分享

Nat. Biomed. Eng.| AI医疗影像诊断: 慢性肾病和2型糖尿病检测及发病预测

 DrugAI 2022-04-19

本文介绍由四川大学华西医院、澳科大医学院的张康教授主导,与多个机构合作发表于nature biomedical engineering的研究成果:使用深度学习模型仅根据视网膜眼底图像或与临床元数据(年龄、性别、身高等)相结合来识别慢性肾病(CKD)和2型糖尿病(T2DM),并预测疾病发展风险对患者进行分级。该研究有利于常见慢性病的早期发现和干预,医疗资源匮乏的偏远地区也将十分受益。

1

背景

CKD和T2DM都是流行且高风险的常见慢性疾病,早期诊断和治疗对于减少相关并发症和死亡率至关重要,然而许多患者没有症状或只有非特异性的症状,早期识别和诊断仍然具有挑战性。

人眼视网膜图像可以快速无创获得,通过视网膜能以非侵入性的方式观察血管、神经和结缔组织,也已有早期证据表明根据眼底照片识别系统性疾病和临床指标具有可行性,而目前尚未有基于标准baseline预测CKD发病以及AI诊断早期CKD的研究。

2

研究成果

2.1 系统简介

作者开发了一种能够分析视网膜眼底图像以检测CKD和T2DM的AI系统(图1a),实现两类任务:

(1)预测连续值(包括肾脏功能指数eGFR)的回归任务;

(2)进行诊断的二元分类任务。此外,系统可以预测疾病的发展,并在两个纵向群组中验证了对CKD和T2DM进行风险分级,在移动设备拍摄的视网膜眼底图像数据集上也进行了验证(图1b)。

2.2 数据集

诊断CKD主要通过eGFR和肾损伤标志物(如尿蛋白),作者使用了CKD患者的眼底图像和相应的eGFR测量值,将严重程度划分为三个风险阶段:early CKD,advanced CKD和severe+ CDK。T2DM同样使用T2DM患者眼底图像和相应临床数据,主要包括没有糖尿病视网膜病变(NDR)的个体和小部分按照早期治疗糖尿病视网膜病变研究(ETDRS)标准定义的糖尿病视网膜病变(DR)个体。

作者构建了一个包含中国眼底图像研究联合会(CC-FII,图1a和表1)患者群组的大型视网膜眼底图像数据集,包括横断面和纵向数据集。作者首先使用横断面数据集(CC-FII-C),以7:1:2划分用于算法训练、调整和内部测试。为了评估泛化性,作者还使用了两个独立群组(External test set)进行外部验证:(1)来自广东省的8059名此前未选中个体;(2)使用智能手机设备采集的视网膜眼底图像——开发的一种低成本手持手机相机附件,医护人员或患者可以拍摄眼底图像上传至云端进行诊断以及风险分级。

此外,为了预测个体CKD和T2DM的未来发展,作者还准备了两个纵向数据集进行识别验证:

(1)CC-FII-L,包含河北省唐山市的10269人,以8:2的比例随机分成训练集和纵向验证集(内部纵向测试集);

(2)外部验证集,来自北京的3376人。

2.3 识别CKD和early CKD

作者结合眼底图像以及年龄、性别、身高等临床数据进行CKD预测探索,开发了三个模型:

(1)仅使用临床元数据的baseline随机森林模型;

(2)仅使用眼底图像的深度学习模型;

(3)同时输入眼底图片和临床元数据的综合AI模型。

如图2a和2b,作者分别在内部测试集和外部测试集1(External test set 1)上进行验证,可以看出综合AI模型表现优于其他两种模型。在预测earlyCKD时,作者加入了健康对照组,图2d为使用CC-FII-C的内部测试集进行评估的结果,图2e为外部测试集1的测试结果。尽管模型是使用标准医学眼底相机拍摄的图像进行训练的,但智能手机拍摄的图像也有相当好的CKD检测性能,如图2c为在外部测试集2(External test set 2)的结果。此外,作者进一步测试了模型对early CKD的分级能力(图2f)。这些结果表明着通过个人移动设备进行视网膜AI诊断的潜在可行性和实用性。

2.4 eGFR预测、CKD分级和CKD发展预测

作者测试了仅使用眼底图像的AI模型,模型预测的GFR和测量的eGFR之间显示出很强的线性关联性(图3a-c),表明模型能够提取预测eGFR的信息。使用Bland–Altman图评估预测GFR和测量eGFR之间的一致程度,模型在内部测试集(图3d)和外部测试集1(图3e)中均表现良好。当使用智能手机拍摄的图像对外部测试集2上进行测试时,AI模型性能欠佳(图3f),Bland-Altman图显示负比例偏差,说明AI模型在eGFR高水平时比在低水平时更大程度地低估了eGFR,通过校准输出方差可以降低比例偏差(详见原文补充图3a-c)。

此外,作者还研究了模型预测CKD阶段分级的表现:通过回归模型及阈值设置判断是否存在severe+ CKD,还训练了分类模型区分severe+ CKD和其他阶段CKD(early和advanced),在内部验证集和外部测试集1都取得了不错的结果。除了预测当前CKD状态,作者还使用纵向组数据集预测个体发展为CKD/advanced CKD的风险,结果表明眼底图像和临床元数据结合的发展预测模型在统计学上有明显的改进。

2.5 识别T2DM及发展预测

作者还将模型应用于T2DM检测,以7:1:2划分数据集为训练、调整和内部测试集。首先评估模型从健康对照中检测T2DM患者的表现,内部测试集(图5a)和外部测试集1(图5b)都表现良好。在使用智能手机摄像头拍摄图像的外部测试集2进行评估时,也取得了相当好的T2DM检测性能(图5c)。此外,由于患有DR的T2DM个体可以很容易地通过视网膜图像被检测出来,作者在不考虑DR情况下测试了模型性能,结果表明准确性并不严重依赖于ETDRS定义的DR的存在。作者进一步测试了模型仅从眼底图像预测平均血糖水平的能力,在内部测试集、外部测试集1和外部测试集2上都取得了相对较强的表现(图5d-f)。

作者还评估了系统预测健康人在五年内发生T2DM的性能,按3个(low/medium/high)风险组分级,如Kaplan-Meier曲线所示,在内部纵向测试组中,T2DM发病率在低风险组和高风险组之间的分层很清晰(图5g,h)。

2.6 CKD和T2DM预测证据可视化

作者利用集成梯度生成显示图,图6展示了几个有代表性的原始眼底图像及其相应的显著区域图的例子,可以看出模型关注视盘周围的区域、中央黄斑、视网膜血管等,这些区域也通常被眼科医生用来诊断视网膜疾病。此外,CKD和T2DM的显著区域图显示出不同的强调模式(图6d,e)。

3

总结与展望

本文模型以高度的准确性检测CKD和T2DM,并在任何临床表现之前,仅根据眼底图像预测未来的疾病发展,模型不仅适用于使用专业相机获得的临床级视网膜图像,也适用于使用智能手机拍摄的眼底图像。这些结果提高了基于AI检测其他具有视网膜表现的系统性疾病的可能性,超出了临床医生的观察能力,与传统的疾病筛查方案相比,也将带来巨大的成本节约。但本文模型训练数据限于中国人口,其他临床元数据(如血压趋势、吸烟状况、饮酒水平和家族史)是否能进一步提高预测的准确性等问题还需要进一步探讨。

参考资料

Zhang, K., Liu, X., Xu, J. et al. Deep-learning models for the detection and incidence prediction of chronic kidney disease and type 2 diabetes from retinal fundus images. Nat Biomed Eng 5, 533–545 (2021).

https:///10.1038/s41551-021-00745-6

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多