【综述】人工智能在检验医学领域的应用和发展

医学撷英集 2023-01-17 发布于塞内加尔

展开全文

文章来源：中华检验医学杂志, 2022,45(12) : 1282-1287

作者：李玮泽李莉

摘要

随着计算机运算能力的提高，机器学习和深度学习算法不断发展，人工智能（AI）逐渐成为人类活动的重要工具，也为生命科学和医学领域赋予了新的生命力。对于检验医学而言既是机遇，也是挑战。检验大数据和AI算法结合，推动了形态学检验能力的提升、检验流程的优化、新知识的发掘和疾病诊断模型的研发，成为临床疾病预防、诊断和预后预测的便捷、智能的助手。

人工智能（artificial intelligence，AI）是以最少的人工干预模仿人类智能行为进行数据分析、学习建模等的计算机科学^［^1］，包含机器学习和深度学习2个子集，两者主要的区别在于学习方式和驱动学习的算法工具不同。机器学习的输入特征是人为干预，因而，结果会有偏差或遗漏，但对数据集的要求不苛刻。传统的机器学习算法主要是线性回归、Logistic回归、决策树、随机森林、支持向量机（support vector machines，SVM）和朴素贝叶斯等方法。而深度学习是在大量、完整数据集的基础之上，计算机通过卷积神经网络（convolutional neural networks，CNN）、递归神经网络（recurrent neural network，RNN）等算法，机器进行自我学习、推断、建模，并不断优化模型的过程。CNN是一类包含卷积计算且具有深度结构的前馈神经网络算法，RNN是一种常用的循环神经网络结构，在处理和预测序列数据的问题上有着良好的表现。

随着数字化数据采集、机器学习和计算基础设施的进展，AI已经扩展到人类活动的方方面面，在医学领域正在改变着医疗模式和健康理念。

一、AI发展的历史简述
AI的提出源于计算机的诞生，随着生物学和神经生理学等学科的发展而不断演进。1950年“计算机科学之父”艾伦·麦席森·图灵提出了机器思维和图灵测试的概念。而“Artificial Intelligence”则由约翰·麦卡锡在1956年达特茅斯会议上首次提出。加拿大心理学家、认知心理学的创始者唐纳德·赫布基于3个基本假设：共同激活的神经元称为联合；联合能发生在相邻的或疏远的神经元间，即整个皮层是联合存储；如果神经元成为联合，它们将发展成为功能体――细胞集合。并于1949年提出了著名的赫布定律。该理论认为，同一时间被激发的神经元间的联系会被强化，而被强化的2个神经元间可形成一个细胞回路，并记住这2个事物之间存在着联系。这一理论首次揭示了人类学习过程中脑部神经元发生的变化和突触可塑性的基本原理，在此理论的引导下，科学家对人类对大脑神经元结构和功能认识的不断完善，美国科学家于1958年创造了一种具有单层计算单元的神经网络――感知器。人类不仅首次赋予机器从数据中学习知识的能力，形成了人工神经网络（artificial neural networks，ANN）的雏形，同时也奠定了机器学习的基础，开启了人类用算法模型模拟人类学习过程的探索之旅。然而，受限于当时计算机运算能力，AI的发展一度停滞。直到21世纪，计算机处理和分析能力的跨越式进步，才迎来了机器学习的第二次高潮。2012年，加拿大学者Krizhevsky和 Hinton共同开发了名为AlexNet的卷积神经网络算法，该算法在2013年的ImageNet挑战赛图像分类和物体识别中一举夺冠，并在深度学习（deep learning，DL）理论的提出、完善和更新下，促进了图像分析领域AI的进程^［^2］。DL能够利用CNN、多层神经元的自编码神经网络并以此方式进行预训练进而结合鉴别信息进一步优化神经网络权值的深度信念网络，最终以“简单模型”完成复杂的分类等学习任务。随着复杂的机器学习算法的涌现，使得机器模仿视听和思考等人类活动成为可能，很多复杂的模式识别难题也迎刃而解。至此，AI得以迅速拓展并深入到人类生活的各个领域，医学领域也不例外^［^3］。

二、AI在人类健康和医学领域的发展
走进医学领域的AI已经发展得较为成熟，其应用和发展主要有两个方向：物理方面和虚拟领域。物理方面，如以美国Intuitive Surgical公司生产的“达芬奇”为代表的手术机器人，这类机器人主要是通过AI控制机器人系统，将外科医生、护士等操作者的手部运动转化为患者体内器械的运动。其中达芬奇手术机器人自2000年获得美国食品药品监督管理局批准后，在全球得到广泛应用，目前已发展至第5代。自主打结机器人、肠吻合机器人、耳蜗造口自主机器人等也应运而生^［^4］，这类机器人不仅提高了腔镜手术的精确性、精细度和安全性，还降低了围术期后遗症和并发症。而在护理领域，如橡胶手指洗发机器人和柔性淋浴臂^［^5］等，为健康保健、护理等提供便捷、自主服务。
AI在健康和医学中的第二类应用方向是虚拟领域，它是在利用算法处理分析数据（数字数据、图片数据等）的基础上，为卫生健康管理、疾病的预测、诊断和预后判断提供智能化的支持。如美国经济和临床健康卫生信息技术法案及其推动的电子病历以及由此迅速推进的综合决策支持系统和全自动临床系统等等。使得在国家层面实施全面的预防战略，改善大众的健康预后和国家卫生经济管理成为可能。电子病历在国内外的应用推动了远程会诊、医疗资源共享和医疗水平的提高。我国2018年实施的三级/二级公立医院绩效考核是对患者的诊疗数据、机构运营和管理数据等的智能化管理，推行几年来我国公立医院的“质量、效率、安全”显著提升。凸显了AI前所未有的信息处理能力，及其以“信息的全人类共享”为目的的广阔应用前景。AI应用目前在医学诊断领域探索最多、也较为成熟的是基于图像的智能化识别。如借助CNN技术鉴别影像学的肺结节或乳腺结节的良恶性；通过眼底视网膜图像区分糖尿病视网膜病变和先天性白内障；皮肤良恶性病变的临床图像鉴别模型。与检验医学密切相关的是在生物标志物的研究中，借助AI对临床生化、免疫、基因、微生物检验中获得的海量数据，结合患者临床信息发现和挖掘新的生物标志物、生物标志物的组合分析以及多维综合判断，用于临床鉴别诊断、预测、治疗方案选择和监测等。AI在卫生健康领域已如雨后春笋般涌现，并迅速提高医疗水平并重新定义临床医生的角色。

三、AI在检验医学中的应用
AI在检验医学领域的应用从形态学开始，目前已经成为检验医学发展的重要助手。
（一）AI在检验图像型数据中的应用
迅速增长的检验数据为深度学习算法应用创造了条件，而强大的数据处理能力和贴近人类智能的AI则最早在图像分析学习算法中显示出优势，与检验医学的智能化发展相得益彰，优势并行。
1.AI在血细胞形态识别中的应用：细胞形态识别是AI在检验领域最早的探索，目的是帮助临床检验最基础的血细胞分析形态学走出主观性强、耗时和标准化低的困境。这一创新技术仅仅几年的时间后，2016年Elsalamony^［^6］使用神经网络识别血涂片中单个类型的血细胞如镰刀状、椭圆形、小球形和形状未知等特殊形态的红细胞，识别有效率分别达到100%、98%、100%和99.3%。除了对单个细胞形态的精准识别以外，对复杂的细胞种类图像识别也进一步发展，2018年，Shafique和Tehsin^［^7］利用CNN算法构建的模型对急性淋巴细胞白血病检测的敏感度、特异度和准确率高达100%、98.11%和99.50%，克服了传统人工检查白血病方法耗时长、检查过程繁琐的局限性。2019年日本学者将CNN算法与XGBoost算法相结合，开发出外周血涂片骨髓增生异常综合征诊断系统^［^8］，能以特异度96.2%、敏感度100%，受试者操作特征曲线的曲线下面积（area under curve，AUC）为0.99的能力鉴别骨髓增生异常综合征和再生障碍性贫血，这是第一个基于CNN的骨髓异常综合征自动化初始诊断系统，为后续开发各种血液系统疾病的自动化智能诊断系统提供了借鉴。一年后Burkitt淋巴瘤和弥漫大B细胞淋巴瘤的鉴别诊断模型也先后问世^［^9, 10］。优异的算法与快速、高分辨率的图像采集系统结合形成的疾病识别模型不仅提高了工作效率，将检验人员从重复、繁琐、耗时的操作中解放出来，同时呈现更准确、更优质的结果。
2.AI在临床微生物检验的应用：长期以来病原体检验受困于样本量大、疑难菌辨识难和视觉疲劳等问题导致的低效、高误差，为此，国内外研究者在临床微生物形态学检验的智能化探索中投入了很大精力。2017年哈佛医学院利用自动图像采集技术和CNN算法建立了血培养革兰染色涂片分类和识别模型，对革兰阳性球菌和革兰阴性菌识别实现了94.9%的分类准确率^［^11］。无独有偶，2019年上海交通大学利用快速特征嵌入神经卷积网络框架算法识别霉菌分类，纹理特征支持向量机算法识别滴虫和特征统计学算法建立阴道分泌物革兰染色自动识别、分类技术，在测试集的准确率达85%，在临床测试中，模型的检测能力达到普通检验医师水平，并减少了90%的工作量^［^12］。
2021年Rani等^［^13］关于微生物智能图像自动识别研究意识到，由于微生物物种的独特特性，不同的微生物对基于机器学习的研究提出了不同的挑战。具有人工操作特征的传统机器学习算法难以识别图像，虽然CNN算法、深度信念网络已被用于特征提取和分类，但在微生物领域，由于缺乏规范化数据，深度学习算法构建模型不能满足临床的需要。目前AI在临床微生物检验的发展还处于初步阶段，但毫无疑问，需求导向的、基于深度学习算法的临床微生物检验的探索和研究是具有广泛的应用前景。
3.AI和体液以及排泄物形态学检查：早在2007年就有美国学者利用ANN算法建立了女性尿液样本判断尿路感染的模型^［^14］，也有中国学者利用SVM算法对尿液图像识别、分类^［^15］。但是传统的机器学习方法大数据处理能力有限，特征提取泛化性低，样本数据过拟合度高。更优秀的算法应运而生，2018年中国学者采用具有变异性和判别性的聚合通道特征，结合改进的Adaboost分类器分析尿沉渣显微镜照片中的红细胞，比SVM的性能更优越^［^16］。面对CNN算法削弱输入图像区域特征的缺点，2019年中国哈尔滨工程大学提出区域特征算法对30万张尿沉渣图像进行训练，建立的网络模型可以快速准确地识别10类尿沉渣颗粒图像，准确率达97%^［^17］。深圳大学研究团队利用RetinaNet基本网络模型准确预测尿液显微镜成像中7种细胞成分，准确率达88.65%，单图像处理仅0.2 s，该模型后续可以在临床实践中改善尿液和肾脏疾病的诊断和治疗^［^18］。无独有偶，2021年法国传染病研究院和浙江大学医学院分别开发了PHM智能软件和AdaBoost集成学习模型。前者与实验室技术人员判断结果的一致率达到90%^［^19］，而浙江大学的模型学习器，实现了对7种疾病异常尿液结果的准确判断，能区分报告的异常程度，指导个性化的临床决策^［^20］。
大便显微镜检验具有重要的临床辅助诊断价值。但是，粪便背景成分复杂，受食物、代谢物等诸多因素干扰，对检测的准确率和算法识别的精确性都是考验。电子科技大学2021年推出了基于Faster-R-CNN技术的快速高效细胞检测算法，能够快速定位和识别粪便样本中的红细胞、白细胞、脓细胞和真菌，准确率达84%，处理单份样本仅需732 s^［^21］。美国学者也在2020年利用CNN建立识别粪便中的肠道微生物模型（召回率0.83，精确率0.78），对样本中寄生虫的识别准确率达到98%^［^22］。
如今，尿液和大便自动分析仪技术十分成熟，现在已经广泛用于检验工作的日常中。随着算法和图像采集技术的进一步提升，对于尿液和粪便图像中复杂成分的识别会更加的精准，不仅减轻检验人员的工作压力，也提高了对样本的精确处理能力。
（二）AI在检验数值型数据中的应用
目前用于临床检验项目几千项，以数值型数据报告为主，但数据反映的病理意义、数据间的相互关系和数据变化反映的病理变化均没有阐述，导致大量有用信息丢失，没有充分发挥这些检验指标在疾病诊疗中的重要作用，严重阻碍疾病的精准诊断和精准治疗^［^23］。有学者利用神经网络算法建立模型，发现CA72-4与其他标志物组合，可以定量评估胃癌淋巴结转移、腹膜播散、死亡和化疗耐药的概率，及时精确地指导胃癌治疗和康复计划，突破了传统的肿瘤标志物如AFP、CEA、PSA等单一指标特异性和敏感度低的藩篱^［^24］。2021年有学者利用神经网络算法建立的模型，评估膀胱癌患者根治术后5年存活率，其AUC为0.81，高于传统多变量Cox比例风险模型^［^25］。与之相应的，机器学习算法预测前列腺癌、食管癌和口腔癌等模型也在不断推出，都拥有较高的准确率^［^{26, 27, 28］}。
不仅在肿瘤诊断和预后，一些慢性疾病和综合性疾病诊治中，AI也有很大的发展空间。2020年英国学者利用机器学习分析电子健康记录，识别妊娠期糖尿病高风险和低风险孕妇，以指导医生对患者更好地早期干预和健康管理^［^29］。2021年黄荷凤团队，对孕妇妊娠期前三个月的临床数据通过机器学习回顾分析，建立了7变量Logistic回归模型，预测孕妇妊娠期糖尿病风险，其AUC为0.77，并发现脂蛋白a（AUC=0.66）可能是潜在的预测指标^［^30］。借助机器学习算法，作者研究团队基于检验数据建立的妊娠期糖尿病预测模型AUC在训练集、验证集和测试集均高于0.891，敏感度在0.826以上、特异度在0.802以上。利用从检验数据和临床基本信息中筛选的155个特征构建模型，最终获得孕史、年龄、舒张压、红细胞比容、BMI（身体质量指数）、糖化血红蛋白、总胆固醇、尿葡萄糖、总蛋白、白蛋白/球蛋白比值10个参数，较以往单纯统计学技术建立的模型，AUC、敏感度、特异度都更高，且更加易于应用，符合临床需求（目前在多中心验证中，数据尚未发表）。在高血压的慢性病管理中，有学者利用机器学习算法XGBoost对患者电子病历进行预测风险评分，发现Ⅱ型糖尿病、脂质紊乱、心血管疾病、精神疾病等因素为原发性高血压的驱动因素或相关特征，并为高血压和相关疾病的干预措施提供了启示^［^31］。

四、AI在检验医学的挑战
尽管AI有望彻底改变检验医学实验，但未来仍面临许多技术挑战。因为基于机器学习的方法依赖于大量高质量训练数据的可用性，因此必须注意目标患者群体的数据。例如，来自不同医疗机构的检验数据可能包含各种类型的偏差，这可能导致根据一家医院的数据训练的模型无法推广到另一家医院的数据^［^32］。对于一些高性能的机器学习模型，其生成结果很难被人为解释，虽然这些模型可以实现比人类更好的性能，但传达解释模型结论的直观概念，识别模型弱点或从这些计算“黑匣子”中提取额外的生物学见解并不简单。
随着检验医学AI系统的成熟，其临床使用和部署将不可避免地增加，这也将导致一系列新问题的出现。首先检验AI系统的部署需要得到专业的认证，此外检验应用模型从监管角度来说是一个独特的挑战，并且随着收集到更多的数据和用户反馈，模型会迅速发展，目前没有明确的方法评估这些更新^［^3］。为了应对这些挑战，AI研究人员和检验工作者需要共同努力，优先考虑和开发解决关键临床检验需求的应用程序。

五、展望
AI在检验领域的实践，以图像识别需求最强烈、研究更多也最成熟。从外周血、骨髓细胞形态到尿液、粪便、阴道分泌物和各种来源样本的病原体的准确识别和精确分类，兼容或与自动化检测仪器整合，实现快速、便捷的临床样本检测，成为AI在临床形态学检验发展和彰显优势的方向。其次，将检验大数据与临床信息、疾病特征结合的疾病预测、预警模型，是更有前景和更受临床医生欢迎的AI发展领域。除此之外，作者团队参与研发的融汇临床医学知识、经验、指南和检验数据的知识与数据双驱动的AI检验报告解读系统也在探索之中。不同于嵌入或附加于仪器设备的AI和实验室管理的AI，该系统以满足临床需求为目标，赋予了检验报告单全新的功能，包括检验项目临床意义标注、异常结果综合分析解释、疾病和/或潜在风险提示、多种疾病危险度排序加注释，特别是建立在临床研究基础之上的疾病预测模型^［^33］和基因测序生信分析的AI报告系统。再者，综合感染与病原体检测信息的临床微生物智能化多学科会诊（Multi-Disciplinary Treatment，MDT）系统大大提升了感染诊断效能和抗生素使用的合理性。如此知识丰富、逻辑缜密、深度分析的检验报告单经过临床实践不断提升和完善，必将成为临床医生手边的检验医师和检验医师坐诊专家门诊的良师益友。深受临床医生欢迎和依赖。诚然，探索与创新是社会发展的必然和需求，同时，AI的发展和应用有一个成长和成熟的过程，检验AI也是如此，它需要检验工作者与临床医生、信息化和AI专业的技术人员共同努力，克服数据获取和归一化等方面的瓶颈、融汇更多知识、积累海量数据、探索更多算法和模型，同时以包容和扶持的姿态，推动AI在检验医学的高质量发展。相信检验领域AI的明天会更好，借助AI检验也将获得新的生命力。

参考文献（略）