摘要
目的
探讨深度学习相关技术在医疗器械不良事件风险类型判别中的应用价值。
方法
选取自2023年4月至9月国家医疗器械不良事件监测系统数据库中的12 350条数据为研究对象,每条数据具有25个维度的信息,其中包括企业、注册证号、产品批号、不良事件描述等。采用fastText技术将文本特征转化为向量表示,采用均值聚类方法将具有相似主题或语义内容的文本数据分组到同一类别中,搭建BP神经网络将不良事件的风险类型分为轻微危害、严重危害、死亡。
结果
该研究选取的深度学习方法能够很好地处理文本数据且搭建的BP神经网络模型的准确度(accuracy)为92.86%,精密度(precision)为93.65%,召回率(recall)为93.08%,F1-score为92.31%,曲线下面积(AUC)为0.98,具有良好的准确性和泛化能力。
结论
基于深度学习的医疗器械不良事件风险类型的研究可有效地为医疗器械不良事件监测工作提供帮助。
在现代医疗领域中,医疗器械的作用至关重要,然而,其伴随的安全问题已经引起了广泛的关注。医疗器械不良事件对患者的身心健康和生命安全构成潜在威胁,严重损害了医疗质量和医疗行业的信誉。如何有效地控制和降低医疗器械不良事件,是当前医疗器械安全管理中亟待解决的问题。因此,要建立医疗器械的安全监管体系,更新医疗器械不良事件监管的技术手段,预防和减少医疗器械不良事件的发生。目前,我国已经建立了一个覆盖全国的医疗器械不良事件监测系统,包含全国各省市级的药品不良反应监测中心、医疗器械厂商、销售公司以及医疗机
1 资料与方法
1.1 一般资料
本研究数据选取自2023年4月至9月国家医疗器械不良事件监测系统数据库中的12 350条数据为研究对象,每条数据具有25个维度的信息,其中包括企业、注册证号、产品批号、不良事件描述等。
1.2 相关技术手段
1.2.1 fastText技术
近来年,基于神经网络的自动特征抽取方法逐渐成为研究热
fastText模型是一种强大的文本分类工具,它主要由三个关键部分组成:输入层、隐藏层和输出层。在输入层,文本数据被接收并转换为单词和子词的向量表示。这种表示方式使得模型能够更好地理解和分析文本内容。隐藏层是模型的核心部分,它通过将输入层的向量表示进行加权求和得到。这个加权求和过程可以是平均池化、最大池化,或者是其他形式的池化操作。这种池化操作能够有效地提取文本数据中的关键信息,提高模型的预测精度。输出层是模型的最后部分,它使用分层Softmax方法计算每个类别的概率分布。这种概率分布能够告诉我们文本属于哪个类别,以及这个类别的可能性有多大。在本文中,我们通过最大化目标类别的条件概率来调整模型的参数,使得模型能够更好地预测文本的类别。这种调整方式能够使模型在训练过程中更加关注那些对分类结果影响最大的参数,从而提高模型的分类性能。
1.2.2 均值聚类
文本聚类是一种无监督学习的技术,用于将具有相似主题或语义内容的文本数据分组到同一类别
1.2.3 BP神经网络
神经网络在深度学习领域中扮演者重要角色,BP(back propagation)神经网络作为其中的一种技术,以其非线性映射能力强大和并行信息处理能力突出的特点,在实际工作中倍受青睐。该技术主要用来实现模式识别、数据分类、函数拟合等功
1.3 方法
1.3.1 数据处理
数据处理环节主要包括四个方面:①采用fastText算法将文本特征(如企业、不良事件描述等)转换为向量表示。②采用删除、填充平均数等方法处理缺失值、异常值和重复值。③标记不良事件的严重程度为类别标签,1代表轻微危害,2代表严重危害,3代表死亡。④将数据分成训练集和测试集,采用70%的数据作为训练集,30%的数据作为测试集。
1.3.2 聚类分析
本文采用MATLAB自带的CH(contraction hierarchies)指标评估聚类数,其CH值越大代表类自身越紧密,类与类之间越清晰,聚类效果更好。通过MATLAB中的evalclusters函数计算得出最佳聚类数为3。该结果与风险程度大致分为轻度危害、严重危害、死亡相一致,具有一定的实际意义。
在实际操作中利用MATLAB调用-means聚类算法。在计算距离时,选取了sqEuclidean函数,即采用欧几里得距离函数,此函数能够较为准确地反映数据之间的距离。为了提高聚类分析实验的可靠性,设置了代表重复聚类次数的replicate参数为5,以此得到了更加稳定和准确的聚类结果。
1.3.3 搭建BP神经网络
在对BP神经网络模型进行优化设置时,本研究参考了数据量、数据输出情况以及数据特点等信息,对模型的层数、隐藏层神经元个数、激活函数和优化器等参数进行了精细调整。为了更加精确地判断不良事件的严重程度,笔者选择了一个包含三层隐含层的模型,以增强模型的复杂性和准确性。在神经元个数的选择上,本研究根据数据集的规模,确定了输入层神经元为25个,隐藏层神经元为15个。所有的激活函数都采用了ReLU(rectified linear unit)函数,输出层神经元个数为3,意味着模型将输出三个预测数据。在模型优化过程中,本研究采用了RMSProp模型优化器,并将学习率设定为0.001。最大迭代次数设定为3 000次,损失函数选择均方误差(mean-square error, MSE),评测标准则选择了MSE和平均绝对值误差(mean absolute error, MAE)。这样的优化策略,旨在提高模型的精度和稳定性,使其能够更好地适应和处理实际问题。
1.3.4 模型训练与评价
本研究用预先划分的测试集数据来验证已经训练好的模型,并获取预测结果,并将预测结果与测试数据进行比对,通过综合运用准确度、精确度、召回率以及F1分数等评估指标全面评估模型的性能表现。
2 实验结果
本研究运用所建立的BP神经网络模型对不良事件危害程度进行了分类。选取注册证号、产品批号、生产日期、不良事件描述等25个特征作为输入参数,输出结果为三类不良事件的风险程度即轻微危害、严重危害、死亡。模型结果图见
评价指标 | 数值 |
---|---|
准确度 | 92.86% |
精密度 | 93.65% |
召回率 | 93.08% |
F1-score | 92.31% |

图1 BP神经网络模型ROC曲线
3 讨论
随着医疗质量的提高,医疗器械不良事件的危害程度判定,作为一项重要工作,也越来越受到人们的重视。然而,这一领域目前仍处于探索阶段,许多方法和技术尚待进一步开发和完善。本研究展示了一种基于BP神经网络模型的医疗器械不良事件危害程度分类方法。经过实验验证,该方法在风险程度判定方面表现优秀,准确率高,为医疗器械不良事件的监测工作提供了强有力的工具。然而,本文提出的分类方法仍有提升空间。期望来者可以对聚类算法进行优化,以提高分类的准确性和效率;对数据进行更好的预处理,以减少噪声和错误信息对分类结果的影响;也可以尝试将不同的深度学习模型应用到危害程度的判定工作中,并进行模型的对比,以提高判定的准确性和效率。此外,本研究也期望能够引发更多关于医疗器械不良事件风险程度检测方法的研究。深度学习作为一种新兴的技术,其在医疗器械不良事件危害程度判定中的潜力是无可忽视的。我们期待未来能有更多的研究者在这个领域做出突破,为我国的医疗器械不良事件监测工作提供更多的技术支持。
综上所述,虽然医疗器械不良事件的危害程度判定工作目前仍处于探索阶段,但是我们有理由相信,随着人工智能技术的发展,我们能够找到更好的方法来完成这项工作,从而更好地保护公众的健康。
参考文献
田燕, 肖桂荣, 徐珽. 我国医疗器械不良事件监测年度报告分析[J]. 中国药业, 2022, 31(6): 6-12. [百度学术]
王东京, 吴维民. 我国医疗器械不良事件监测现状研究[J]. 中国医疗设备, 2022, 37(3): 127-130. [百度学术]
伊恩·古德费洛, 约书亚·本吉奥, 亚伦·库维尔. 深度学习[M]. 北京: 人民邮电出版社, 2021. [百度学术]
SOCHER R, BAUER J, MANNING CD, et al. Parsing with compositional vector grammars[C]// 51st annual meeting of the Association for Computational Linguistics, August 4-9, 2013, Sofia, Bulgaria: Association for Computational Linguistics, 2013: 455-465. [百度学术]
MIKOLOV T, SUTSKEVER I, CHEN K, et al. Distributed representations of words and phrases and their compositionality[J]. arXiv E Prints, 2013: arXiv: 1310.4546. [百度学术]
MIKOLOV T, CHEN K, CORRADO G, et al. Efficient estimation of word representations in vector space[EB/OL]. 2013: arXiv: 1301.3781. http://arxiv.org/abs/1301.3781. [百度学术]
张孝飞, 黄河燕. 一种采用聚类技术改进的KNN文本分类方法[J]. 模式识别与人工智能, 2009, 22(6): 936-940. [百度学术]
陶莹, 杨锋, 刘洋, 等. K均值聚类算法的研究与优化[J]. 计算机技术与发展, 2018, 28(6): 90-92. [百度学术]
周梦, 吕志刚, 邸若海, 等. 基于小样本数据的BP神经网络建模[J]. 科学技术与工程, 2022, 22(7): 2754-2760. [百度学术]
张明琪, 邓鑫. 基于集成学习后融合神经网络算法构建肝硬化代偿期中医智能辨证模型的探讨[J]. 广州中医药大学学报, 2023, 40(10): 2650-2660. [百度学术]