分享

原创|一文读懂Nat med-人工智能高效预测糖尿病慢性肾病早期风险全文

 生物_医药_科研 2019-01-13

号外

《精准医学前沿》组建了10余个生物医学应用专业微信交流群,包括人工智能医学应用前沿肿瘤(靶向治疗和细胞免疫治疗),单细胞测序医学应用非编码RNA与疾病干细胞与再生医学临床基因组解读与遗传咨询基因编辑医学应用表观修饰医学应用罕见病和单基因病病原感染与宏基因组神经系统疾病心脑血管疾病等。长按以下二维码加微信(Precision_medcine)备注想加入的群或研究领域,再邀进相关群,非诚勿扰。


精准医学前沿资讯


人工智能(AI),特别是深度学习(Deep Learning),是开始用于医学图像和电子健康记录解释的主要技术工具之一。利用AI可以预测年龄和吸烟、血压状况甚至疾病风险,AI在医学中的应用越来越广泛,FDA甚至批准了一种基于人工智能的设备来检测某些与糖尿病相关的眼部问题。


2019年1月7日,Nature 旗下顶级医学期刊 Nature Medicine 杂志同期刊登8篇论文,聚焦人工智能在医学领域的应用。其中1项研究表明,与基于临床研究数据中开发的人工智能算法,基于糖尿病电子健康档案数据的算法模型,对糖尿病慢性肾病早期风险预测具有更高效的的性能这是一项非常有意思和有意义的研究,因此《精准医学前沿》团队对该研究的文进行了精细的编译和解读


人工智能化的诊断、治疗建议和医疗风险预测是一项基于专门的、严格控制的临床试验。然而,现实世界中存在大量的医疗数据,数据量的增加是以牺牲完整性、一致性和控制为代价的。近日,来自罗氏公司的科学家的一个比较研究案例的表明,与基于临床研究数据相比,基于糖尿病电子健康档案数据的人工智能算法模型可以更有效的预测糖尿病相关慢性肾病的早期风险 [24]。该研究成果2019年1月7日在国际医学顶级期刊《Nature Medicine》在线发表,题名为基于糖尿病电子健康档案数据可以更有效的预测糖尿病相关慢性肾病的早期风险(《Predicting the early risk of chronic kidney disease in patients with diabetes using real-world data》)的论文 [24]


对照临床试验是目前医学决策的黄金标准。这些对照临床试验通常在一个理想的环境中进行,包括预先选择的人群、验证的临床数据条目,有时还包括较短的观察时间窗。因此,从扩大原始临床研究数据的范围推断出的结果不一定能揭示现实世界人群在疗效和有效性方面的最佳途径 [1]。生物医学中大数据的可用性 [2,3],以及数据挖掘、分析和建模方面的改进[4],引发了越来越多对现实世界数据证据如电子健康档案数据的研究,促进了个性化和基于结果的医疗保健 [5,6]。糖尿病是一种非常普遍的葡萄糖代谢紊乱病症 [7]最近的一项研究表明,利用标记好的数据开发糖尿病预测模型是有好处的。电子健康档案(EHRs)结合深度特征学习和监督分类方案已被用来预测糖尿病和其他疾病的发生 [8]

 

糖尿病微血管长期并发症的慢性肾病(CKD)作为一个医学,社会和经济方面的重大疾病 [9-11],研究人员在本项研究中,对来自糖尿病相关的慢性肾病患者的临床研究数据和真实数据(RWD)如电子健康档案数据的算法进行了直接比较。(参见原文补充材料表1)。

 

研究人员从IBM Explorys数据库 [12] 中检索了417912名糖尿病患者(1型和2型)的电子健康档案(EHRs)数据(见原文补充材料图1),每个人的电子健康档案数据从首次诊断糖尿病前2年开始,一直持续到诊断后的第3年。本研究使用的是数据驱动的、医学支持的特征选择策略,而不是Miotto等人的Deep Patient策略 [8],因为Deep Patient是一种无监督的特征选择方法,最适合使用数百个特征对多种疾病进行风险预测相比之下,罗氏/IBM的方法使用有监督的方法,选择有限数量的特性并针对单一疾病进行风险预测

 

基于上面提到的数据驱动的、医学支持的特征选择策略,研究人员选择了年龄、体重指数、肾小球滤过率以及肌酐、白蛋白、葡萄糖和血红蛋白(HbA1C)的浓度这7个临床特征,作为慢性肾病重要的预测指标。利用这7个临床特征,研究人员特意选择逻辑回归作为训练方法 [13]而不是像深度学习这样的黑箱方法[14],因为这更有利于对数据驱动的分析进行医学解释。训练结束后,研究人员使用同一数据库中另外104,504个个体的独立样本数据集进行独立验证。此外,罗氏/IBM算法还使用了印第安纳患者护理网络(INPC)数据库 [15] 中82912名的2型糖尿病患者的数据进行独立验证值得注意的是,这些提取的数据集构成了迄今为止用于研究糖尿病长期并发症慢性肾病的最大真实数据(RWD)基础


接受者操作特征曲线(AUC)下的面积经常被用来评估临床标记特征的算法 [16] 以及机器学习算法的预测性能 [17]。当使用总体独立数据验证时,在使用7个优先级临床特征对Roche/IBM模型进行训练后,该Roche/IBM模型预测算法的AUC为0.7937(95%置信区间,0.790,0.797)(Explorys数据集:AUC = 0.761; 印第安纳患者护理网络(INPC)数据集:AUC = 0.831)。 (参见原文补充材料表2)。

 

此外,进一步研究显示罗氏/ IBM分类结果在1型和2型糖尿病患者之间的预测性能差异值为|Δ(AUC) |≤0.034(参见原文补充材料表3),性别预测性能差异值偏好性|Δ(AUC) |≤0.025(参见原文补充材料表4)

 

进一步的分析表明,临床特征数量的增加只会对AUC产生很小的改善 (10个临床特征,0.7939;12个临床特征, 0.7967)

 

虽然年龄被认为是肾功能的主要因素之一,但单纯以年龄为指标的logistic回归算法,使用印第安纳患者护理网络(INPC)数据库队列的数据集验证,AUC只有0.712(0.707,0.717)有趣的是,反过来,如果不考虑个体的年龄(即代之以队列年龄的平均值),那么预测的AUC只会降低0.023,从AUC = 0.831(0.827, 0.836)降到AUC =0.808(0.802, 0.813)。基于印第安纳患者护理网络(INPC)数据库的数据,Roche/IBM算法远远优于单纯基于血红蛋白(HbA1C)的简单风险分层模型 [18] (AUC = 0.483 (0.477, 0.489))(参见原文补充材料图2)

 

研究人员将该罗氏/IBM算法也与已发表的算法 [19-22] 进行了比较,这些算法基于训练的数据主要来源于以下临床研究,如ONTARGET、ORIGIN、RENAAL和advancedstudies(需要注意的是,创建预测算法并不是这些临床研究的主要目标)。罗氏/IBM算法优先分类的特征与文献报道的特征相似(参见原文补充材料表5)。在所有真实数据(RWD)队列中,罗氏/IBM算法的分类效果优于以上已发布的其他文献算法 (图1a)。此外,罗氏/IBM算法比以上已发布的文献算法表现更好,即使是根据个别文献研究数据的纳入和排除标准具体选择子队列 (图1b)


图1 不同预测算法结果的比较 


进一步分析表明慢性肾病结果的准确性、严重程度的差异不能充分解释AUC的差异。为了分析实际机器学习方法的影响,在INPC数据集上训练了用于二值分类的随机森林模型 [23]随机森林模型对7个特征模型和35个特征模型的AUC分别为0.833(0.824,0.841)和0.849(0.841,0.857),而INPC数据集特异性logistic回归模型(7个临床特征,AUC= 0.827(0.818, 0.835)。从概念上讲,当应用于独立的验证数据集时,样本容量的增加会提高训练能力,并获得更具代表性的结果(图2a)考虑到已发表的算法 [19-22] 用于训练的临床研究数据通常涉及大约10 4名患者。然而,训练集抽≥10³个代表样本以及进一步分析的基础上,我们得出结论,训练数据集的数量不是罗氏/IBM算法预测性能优越于其他已发表算法的主要原因(参见原文补充材料图3和补充材料表6)

 

与临床试验数据的预测分析算法相比,Roche/IBM算法使用真实数据(RWD)集进行训练,是与已发布的基于临床研究数据的其他预测算法的一个主要的差异缺失数据的归类算法算提供了一个典型的真实世界数据(RWD)队列预测分析的例子,而在临床试验数据的预测分析算法是一个微妙的平均值。临床试验数据的预测分析算法分类准确率随着注入数据比例的增加而迅速下降,而Roche/IBM算法即使在注入数据比例较高的情况下,其稳定性也要高得多 (图2b和参见原文补充材料表7)


图 2 研究样本量的作用和对样本的归一化

 

最后,基于以上的研究结果,研究人员得出结论,至少在目前的例子中,使用真实数据(RWD)如电子病历健康数据的预测分析算法的训练与使用临床试验数据的预测分析算法相比,可以达到同等甚至更高的准确性,但在推广这些结论之前,我们还需要对其他数据集进行进一步的测试。该研究推测真实数据(RWD)的多样性使得预测算法更适合于泛化。这些发现可能会点燃关于医学证据未来的根本性辩论 [5],即对有限数量的患者进行超出原始目标的探索性分析和数据解释,可能有朝一日会被RWD驱动的风险评估所增强,或在特定情况下,甚至部分被RWD驱动的风险评估所取代。


参考文献

 1. Trojano, M. et al. Nat. Rev. Neurol. 13, 105–118 (2017). 

2. Marx, V. Nature 498, 255–260 (2013). 

3. Bender, E. Nature 527, S19 (2015). 

4. Wu, X. et al. IEEE Trans. Knowl. Data Eng. 26, 97–107 (2014). 

5. Frieden, T. R. N. Engl. J. Med. 377, 465–475 (2017). 

6. Bates, D. W. et al. Health Af. 33, 1123–1131 (2014). 

7. Razavian, N. et al. Big Data 3, 277–287 (2015). 

8. Miotto, R., Li, L., Kidd, B. A. & Dudley, J. T. Sci. Rep. 6, 26094 (2016). 

9. Levin, A. et al. Lancet 390, 1888–1917 (2017). 

10. Fioretto, P., Dodson, P. M., Ziegler, D. & Rosenson, R. S. Nat. Rev. Endocrinol. 6, 19–25 (2010). 

11. Wanner, C. et al. N. Engl. J. Med. 375, 323–334 (2016). 

12. Kaelber, D. C. et al. J. Am. Med. Inform. Assoc. 19, 965–972 (2012). 

13. Hosmer, Jr., D. W., Lemeshow, S. & Sturdivant, R. X. Applied Logistic Regression 3rd edn (John Wiley & Sons, Inc., Hoboken, NJ, USA, 2013). 

14. Vossen, P. Science 357, 22–27 (2017). 

15. McDonald, C. J. et al. Health Af. 24, 1214–1220 (2005). 

16. Swets, J. A. Science 240, 1285–1293 (1988). 

17. Bradley, A. P. Patt. Recogn. 30, 1145–1159 (1997). 

18. Te Diabetes Control and Complications Trial Research Group N. Engl. J. Med. 329, 977–986 (1993). 

19. Dunkler, D. et al. Clin. J. Am. Soc. Nephrol. 10, 1371–1379 (2015). 

20. Vergouwe, Y. et al. Diabetologia 53, 254–262 (2010). 

21. Keane, W. F. et al. Clin. J. Am. Soc. Nephrol. 1, 761–767 (2006). 

22. Jardine, M. J. et al. Am. J. Kidn. Dis. 60, 770–778 (2012). 

23. Liaw, A. & Wiener, M. R News 2, 18–22 (2002).

24. Stefan Ravizza et al. Nat. Med. 25, pages 57–59 (2019)


——End——
本文系《精准医学前沿》 原创编译,欢迎分享,转载需后台联系授权


精准医学前沿

精准医学领域致力于基于个体的基因组变异和生活方式等信息,对其疾病进行预防、分子诊断和进展预后评估,进而制定实施个性化的预防和治疗方案。精准医学前沿旨在报道和科普精准医学前沿动态,让专业人士和普通大众深入了解精准医学相关的知识,推动精准医学的健康发展和应用。目前参与精准医学前沿运营的团队主要来自于中山大学,美国哈弗大学医学院,中国科学院,北京协和医科大学,美国麻省理工学院,上海交通大学,厦门大学,美国芝加哥大学,清华大学,北京大学,浙江大学和四川大学等国内外顶级高校院所的生物医学或临床医学的在读博士和一线博士后科研人员

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多