AI在检验医学领域的应用从形态学开始,目前已经成为检验医学发展的重要助手。
(一)AI在检验图像型数据中的应用
迅速增长的检验数据为深度学习算法应用创造了条件,而强大的数据处理能力和贴近人类智能的AI则最早在图像分析学习算法中显示出优势,与检验医学的智能化发展相得益彰,优势并行。
1.AI在血细胞形态识别中的应用:细胞形态识别是AI在检验领域最早的探索,目的是帮助临床检验最基础的血细胞分析形态学走出主观性强、耗时和标准化低的困境。这一创新技术仅仅几年的时间后,2016年Elsalamony[6]使用神经网络识别血涂片中单个类型的血细胞如镰刀状、椭圆形、小球形和形状未知等特殊形态的红细胞,识别有效率分别达到100%、98%、100%和99.3%。除了对单个细胞形态的精准识别以外,对复杂的细胞种类图像识别也进一步发展,2018年,Shafique和Tehsin[7]利用CNN算法构建的模型对急性淋巴细胞白血病检测的敏感度、特异度和准确率高达100%、98.11%和99.50%,克服了传统人工检查白血病方法耗时长、检查过程繁琐的局限性。2019年日本学者将CNN算法与XGBoost算法相结合,开发出外周血涂片骨髓增生异常综合征诊断系统[8],能以特异度96.2%、敏感度100%,受试者操作特征曲线的曲线下面积(area under curve,AUC)为0.99的能力鉴别骨髓增生异常综合征和再生障碍性贫血,这是第一个基于CNN的骨髓异常综合征自动化初始诊断系统,为后续开发各种血液系统疾病的自动化智能诊断系统提供了借鉴。一年后Burkitt淋巴瘤和弥漫大B细胞淋巴瘤的鉴别诊断模型也先后问世[9, 10]。优异的算法与快速、高分辨率的图像采集系统结合形成的疾病识别模型不仅提高了工作效率,将检验人员从重复、繁琐、耗时的操作中解放出来,同时呈现更准确、更优质的结果。
2.AI在临床微生物检验的应用:长期以来病原体检验受困于样本量大、疑难菌辨识难和视觉疲劳等问题导致的低效、高误差,为此,国内外研究者在临床微生物形态学检验的智能化探索中投入了很大精力。2017年哈佛医学院利用自动图像采集技术和CNN算法建立了血培养革兰染色涂片分类和识别模型,对革兰阳性球菌和革兰阴性菌识别实现了94.9%的分类准确率[11]。无独有偶,2019年上海交通大学利用快速特征嵌入神经卷积网络框架算法识别霉菌分类,纹理特征支持向量机算法识别滴虫和特征统计学算法建立阴道分泌物革兰染色自动识别、分类技术,在测试集的准确率达85%,在临床测试中,模型的检测能力达到普通检验医师水平,并减少了90%的工作量[12]。
2021年Rani等[13]关于微生物智能图像自动识别研究意识到,由于微生物物种的独特特性,不同的微生物对基于机器学习的研究提出了不同的挑战。具有人工操作特征的传统机器学习算法难以识别图像,虽然CNN算法、深度信念网络已被用于特征提取和分类,但在微生物领域,由于缺乏规范化数据,深度学习算法构建模型不能满足临床的需要。目前AI在临床微生物检验的发展还处于初步阶段,但毫无疑问,需求导向的、基于深度学习算法的临床微生物检验的探索和研究是具有广泛的应用前景。
3.AI和体液以及排泄物形态学检查:早在2007年就有美国学者利用ANN算法建立了女性尿液样本判断尿路感染的模型[14],也有中国学者利用SVM算法对尿液图像识别、分类[15]。但是传统的机器学习方法大数据处理能力有限,特征提取泛化性低,样本数据过拟合度高。更优秀的算法应运而生,2018年中国学者采用具有变异性和判别性的聚合通道特征,结合改进的Adaboost分类器分析尿沉渣显微镜照片中的红细胞,比SVM的性能更优越[16]。面对CNN算法削弱输入图像区域特征的缺点,2019年中国哈尔滨工程大学提出区域特征算法对30万张尿沉渣图像进行训练,建立的网络模型可以快速准确地识别10类尿沉渣颗粒图像,准确率达97%[17]。深圳大学研究团队利用RetinaNet基本网络模型准确预测尿液显微镜成像中7种细胞成分,准确率达88.65%,单图像处理仅0.2 s,该模型后续可以在临床实践中改善尿液和肾脏疾病的诊断和治疗[18]。无独有偶,2021年法国传染病研究院和浙江大学医学院分别开发了PHM智能软件和AdaBoost集成学习模型。前者与实验室技术人员判断结果的一致率达到90%[19],而浙江大学的模型学习器,实现了对7种疾病异常尿液结果的准确判断,能区分报告的异常程度,指导个性化的临床决策[20]。
大便显微镜检验具有重要的临床辅助诊断价值。但是,粪便背景成分复杂,受食物、代谢物等诸多因素干扰,对检测的准确率和算法识别的精确性都是考验。电子科技大学2021年推出了基于Faster-R-CNN技术的快速高效细胞检测算法,能够快速定位和识别粪便样本中的红细胞、白细胞、脓细胞和真菌,准确率达84%,处理单份样本仅需732 s[21]。美国学者也在2020年利用CNN建立识别粪便中的肠道微生物模型(召回率0.83,精确率0.78),对样本中寄生虫的识别准确率达到98%[22]。
如今,尿液和大便自动分析仪技术十分成熟,现在已经广泛用于检验工作的日常中。随着算法和图像采集技术的进一步提升,对于尿液和粪便图像中复杂成分的识别会更加的精准,不仅减轻检验人员的工作压力,也提高了对样本的精确处理能力。
(二)AI在检验数值型数据中的应用
目前用于临床检验项目几千项,以数值型数据报告为主,但数据反映的病理意义、数据间的相互关系和数据变化反映的病理变化均没有阐述,导致大量有用信息丢失,没有充分发挥这些检验指标在疾病诊疗中的重要作用,严重阻碍疾病的精准诊断和精准治疗[23]。有学者利用神经网络算法建立模型,发现CA72-4与其他标志物组合,可以定量评估胃癌淋巴结转移、腹膜播散、死亡和化疗耐药的概率,及时精确地指导胃癌治疗和康复计划,突破了传统的肿瘤标志物如AFP、CEA、PSA等单一指标特异性和敏感度低的藩篱[24]。2021年有学者利用神经网络算法建立的模型,评估膀胱癌患者根治术后5年存活率,其AUC为0.81,高于传统多变量Cox比例风险模型[25]。与之相应的,机器学习算法预测前列腺癌、食管癌和口腔癌等模型也在不断推出,都拥有较高的准确率[26, 27, 28]。
不仅在肿瘤诊断和预后,一些慢性疾病和综合性疾病诊治中,AI也有很大的发展空间。2020年英国学者利用机器学习分析电子健康记录,识别妊娠期糖尿病高风险和低风险孕妇,以指导医生对患者更好地早期干预和健康管理[29]。2021年黄荷凤团队,对孕妇妊娠期前三个月的临床数据通过机器学习回顾分析,建立了7变量Logistic回归模型,预测孕妇妊娠期糖尿病风险,其AUC为0.77,并发现脂蛋白a(AUC=0.66)可能是潜在的预测指标[30]。借助机器学习算法,作者研究团队基于检验数据建立的妊娠期糖尿病预测模型AUC在训练集、验证集和测试集均高于0.891,敏感度在0.826以上、特异度在0.802以上。利用从检验数据和临床基本信息中筛选的155个特征构建模型,最终获得孕史、年龄、舒张压、红细胞比容、BMI(身体质量指数)、糖化血红蛋白、总胆固醇、尿葡萄糖、总蛋白、白蛋白/球蛋白比值10个参数,较以往单纯统计学技术建立的模型,AUC、敏感度、特异度都更高,且更加易于应用,符合临床需求(目前在多中心验证中,数据尚未发表)。在高血压的慢性病管理中,有学者利用机器学习算法XGBoost对患者电子病历进行预测风险评分,发现Ⅱ型糖尿病、脂质紊乱、心血管疾病、精神疾病等因素为原发性高血压的驱动因素或相关特征,并为高血压和相关疾病的干预措施提供了启示[31]。