分享

担忧与惊喜:数据模型对真实世界临床转归的研判、预测与决策辅助

 风湿中心 2024-01-16 发布于上海

龙行龘龘

讲者:肖飞博士

主持人:张奉春教授、娄竞博士

娄竞博士:肖飞是我老同学,他现在是苏州抗炎免疫药物研发中心,也是我们协会的总干事。下面还有非常多的职位,最重要的欣凯医药集团的CEO,还曾是我们国家食品药品监督管理局的高级进修学院的教授,这个也是我们经常听肖飞教授讲座的一个重要的头衔,也是我们SSDM,大家今天全天一直讨论的这个平台的创建人、创始人。师从我是非常清楚,师从两位,一个是我们国内特别著名的,一个是美国特别著名的Dr. Williams,还有我们吴孟超院士,两位非常德高望重的肝外科专家。主导的研究也是大家特别熟悉的爱若华来氟米特的产品,获得了非常多的各种各样的奖项 ,包括科学进步的一等奖,不断地在进步,肖飞同学一直也是我们学习的榜样。肖飞还获得过两项NIH的基金,也是作为企业和学术相关的一个特别重要的基金。肖飞教授给我们今天带来的题目是惊喜与担忧:数据模型对真实世界临床转归的研判、预测、决策辅助。大家欢迎。

肖飞博士:我们首先看看我们医疗领域的痛点,贾医生已经介绍过一部分,我们中国没有随访系统,病人的长期的转归我们是不明确的,随机的就诊的模式,让我们的医患关系非常陌生,安全有效的这种方案的调整都是滞后的。每一个学科都提倡达标治疗,但是没有长期的、定期的病情评估这样一个数据,我们是没有办法实现tight control这种积极治疗的,达标是一个空话,没有及时地调整方案,我们的达标治疗tight control都是一个梦想。还有我们没有警示系统,我们机会窗口往往都失去了。中国的病人有一个什么样的悖论呢?都抱怨看病难、看病贵。实际上是因为看病太容易造成了看病贵,任何一个人不管他病情轻重都可以到三甲医院看我们最著名的医生,实际上他可能不需要,这是资源的浪费。而我们的看病贵,又是他翻山越岭有很多的机会成本变成了他医疗的负担,所以变成了看病贵。当然了还有其他的原因。我们各学科的指南现在制定几乎都是用国外的数据,刚才我们看人种的差别、地域的差别、时间的差别,实际上给我们造成了很多的困惑,真实世界治疗的效果往往低于注册研究的、新药研究的结果。刚才我们已经展示了,中国我们是有最多的病人资源,但是我们对世界医学的贡献是非常不足的。所以我们现在临床采集数据的这种方式是脱节的,医生实际上应该做更加有智慧的那部分工作,而不是去只是收集一个数据。所以我们要找解决方案,那解决方案在哪里?今天的话题也是我们的数智和医学是怎么样的融合。

所以我们和全国的医生就建立了这么一个平台,非常地简单,随着我们伟大的时代到来,就是移动互联网技术的成熟,我们每一个病人都有移动的智能手机,我们就和医生一起培训他,把关键的数据录入进去,定期的来去做数28个关节,类风湿关节为例,狼疮就是按照SLEDAI的评分。非常地简单。可以把这些关键的数据输进去,用药的数据,实验室检查和疾病的病情的评估,形成一个连续的曲线,当出现不良反应的时候就去报警。我们的医生就可以在终端接受这些数据,如果没有时间就可以不看,如果有时间看了以后可以选择干预和不干预,不管你干预和不干预,这些都是真实世界的数据,形成大数据我们就可以看到很多的这些信息,最后给我们临床做出一些提示。
首先我们建立了一个系统,它是数据采集系统,叫data capturing。这个是不是准确?刚才李春教授和贾医生都已经介绍了,我们看到的是经过培训,86%的病人他们可以准确地将他的数据录入和做病情的评估。也就是说这一部分的病人我们画好他的画像,他就可以去掌握,让他回家不断地去输入数据,而这些数据源源不断地同步到云端,同步到医生的终端。刚才魏教授他们也都讲了,赵久良教授也讲了,我们的一个医生可能你能管几千个病人、几万个病人,因为大部分病人都被你控制好了,你只是去重视那些有并发症的或者出现病情变化的病人。所以我们说这个结构性的数据进入系统以后,就可以直接的到他的slot,到他的位置上,可以便于观测和统计。
在整个的数据科学的流程中间,数据的采集、数据的清理就形成什么?我们的数据就变成了information,就是可传播的一些信息。而这些information我们就可以去分析了,分析出来的这些数据我们就可以写成文章,它就变成了一种知识。而在这个知识基础上,结合我们的医生,结合我们的现在的一些数学模型,它就可能成为我们的智能、智慧。我们可以做出智慧AI两个重要的,一个就是可预测,一个是决策辅助.
这就是我们功能,两个非常简单的界面,我们可以采集,让病人源源不断地输入数据。有一个规则,我们规定就是数据属于病人,我们医生通过服务可以获取病人这些数据的使用权,我们作为管理者我们为医生和病人服务。
我们现在有32万有左右的一个病人的数据,这里边包括了哪些数据呢?我们先看看什么叫information。
我们看,我这里列了51种我们的风湿病的数据,拿风湿病来做一个比喻,我们还有肾病、还有血液病、还有肝胆外科。可以看到类风湿关节炎它仍然是一个最大的病种,这些数据进入了以后,实际上我们就可以进行数据的分析,把它变成知识了。
首先我们数据可以采取哪几种分析呢?一个就是把同样的数据给它拼到一起,叫数据串,就是一个data class train,还有一个就是association study,就关联性的研究。我们刚才说的病例串,就是吴建红教授把8种风湿病的焦虑和抑郁做了一个描述,都是同样的一个状态下的描述。我们说的相关性研究,穆荣教授把智能管理的次数和达标的一个关系做了描述。还有一个就是我们发现一些不正常的叫outlier,这些数据我们看看它到底发生了什么?比如说杨静教授就发现,我们有很多的临床病人,医生认为他达标治好了,但是他仍然觉得很难受,生活质量很差,生活质量和达标之间的不匹配,这就是个异常现象,去找到底是什么原因,她就提出来了“不是所有关节都平等”。比如说28个关节,我们小趾关节和膝关节同样是一个关节,但是我们发现它是不平等的。还有就是把这些丢失的我们忽略的数据找出来,黄建林教授他就把晨僵和DAS28做了一个匹配,发现有一部分DAS28是可以用晨僵来代替的。还有就是用一些尾气效应的数据,穆荣教授就是把我们的28个关节都拉出来,看看我们哪些关节最容易受损伤,治疗以后哪些关节恢复的最优先,又做了个描述,所有这些都是被我们是ACR、EULAR作为大会发言了,一共有88篇文摘被大会接受。
这就是刚才讲的数据串。大家看,我们把这8种疾病的焦虑和抑郁排列起来,我们可以看到一个规律,皮肌炎,这一系列的他们的焦虑抑郁表现就更加明显,特别是抑郁,大家可以看到这边的一些差距。而我们发现在这个过程中间还有一个交错的表现,当疾病没治好的时候,他很抑郁;疾病治好了以后他怕复发,焦虑又成为一个主要的原因了。
我们再看评估和达标的过程,评估的次数和达标是正相关的。
这就是那个28个关节,现在我们还在大数据的进一步分析。我就稍稍透露一下,已经把不匹配率减少了20%~30%这么一个比例,20左右的这么一个比例是非常不容易的一个挑战。也就是说我们中国医生用大数据挑战DAS28欧洲的评估的这一个方法。
这是黄建林教授做大会发言,刚才讲的晨僵。
是穆荣教授描述了28个关节,几万个关节中间的一个规律。
我们继续地挖掘,大家看这是50万个关节的压痛,50万个关节的肿胀。关节的压痛和关节的肿胀受累的比例是什么?我有时候问医生,我说最容易受累的这个关节是什么?让我也很吃惊,腕关节在这个数据库里。再一个看他恢复最慢的是什么?恢复的比例最低的是什么?右膝关节、左膝关节是压痛,肿胀也是右腕关节和右膝关节。这是大数据告诉我们的,这样子的临床我们往往个体上发现不了的规律,它是上百万个关节的数据产生的。
我们再看,我们现在的用药。我们的社会越来越富裕了,医保覆盖的越多了,维持环节怎么用药?复发率是怎么样的一个情况?我们需要一个答案。我们往往是回答不出来的,因为很多的临床试验都是要用活动性的类风湿关节炎病人来做实验的。那李春教授他们的研究回答了部分的问题,复发率是多少。我们看在这个研究中间,这里边是我们拿出了2万个类风湿关节炎的病人,我们可以看到的他的一个基线达标的情况下,复发率是多少?大约是百分之二十四点几。
如果不同的用药呢?如果我们在基线的时候和末次评估都是用生物制剂,或者没用生物制剂的情况下,他的复发率和达标率是怎么一个状态呢?我们发现这个现象,基线达标的病人复发率和用不用生物制剂是区别不大的。但是如果是未达标的病人,似乎我们刚才看到的数据,生物制剂是有一个更好的效果,大约提高了7%~8%个百分点。那也就给我们一个结论,我们现在大量的用生物制剂去维持缓解它的优势是不明显的。这和指南是一致的。
我们不单单是可以做数据的分析,发表文章把它变成一种知识,还有一个就是我们可以提取模式,建立模型,我们可以用一些算法来解决我们的预测和决策辅助的问题。
比如讲我们先看怎么样去降低风险这一点,首先我们这个系统,SSDM的系统是可以有报警功能的。如果转氨酶我设定了40,不管是谷丙还是谷草转氨酶,我设定的40为一个线,它超过40就报警了。有的时候医生说这个40没意义,80再报,你也可以设80就报警了,当报警了以后你就会关注这个病人。
我们的报警到底是什么药物它会产生这样子的风险呢?我们可以很方便的把所有的单独用药的导致的转氨酶升高的病人排列出来,把他的百分比拿出来互相一除就变成了一个风险系数,就可以拿出来这样一个字典一样的,可以看风险的系数。拿甲氨蝶呤为例,甲氨蝶呤单独用药作为1,所有联合用药跟它相除,如果大于1就代表风险增加,就出现风险系数,把这个风险系数排出来,我们可以排出300多种风险系数,这个时候我们心里有数,甲氨蝶呤和什么药联合它的风险最大,什么是最小。
这是简单的一个方法,但是复杂的呢?如果说不同的用药时间,不同的用药剂量,我怎么样来去做模型的预测呢?我们在这也做了一个例子,我们抽出来了19000多个病人的数据,用4种算法,一个是逻辑回归、决策树、随机森林,还有一个支持向量的方法,去检验到底哪一个算法适合风险的预测,最后我们决定的是随机森林。用这个随机森林,我们选择了类风湿关节炎的1万多个病人,其中他们合并了593种疾病,把这些相关性的因素我们不断地纳入,来训练这个模型。
大家也可以看到,如果我只是用药和性别、和年龄,我来预测转氨酶升高的风险,可以看到它的准确率是74%,如果用药、性别、年龄、用药时长,它的准确率提高到86%。如果我用药的时长再加上剂量和合并症,它提高到87%,你看就是一个点一个点的提高。然后我加上用药时长、用药剂量、合并症和病程,它提高到88%。
如果我限制一个用药时间,在150天之内的预测这么一个模型,病人的数减少了,它的准确率提高到89%这么一个状态。
这个时候我们就可以去输入这几个关键的信息,包括病人的年龄、性别和一般的信息,包括有没有合并症、病程,还有用药的方案,他用药的时长,这一系列的我们就可以得出他的风险,就可以出来了,这是在训练的一个模型。比如说MTX和雷公藤合用,我们说未来这165天用药期间,他转氨酶异常的概率是96%。
我们再看这个例子,来氟米特加甲氨蝶呤,加甲基强的松龙,它们的联合用药如果是16天之内,正常的概率是93%,异常的概率是0.07。如果是我们延长用药时间,延长到150天,正常的概率就降到了86%。
所以这样子的一个模型就给我们预测的参考,我们当选择一些方案的时候,我们看它和另外的方案比较,它的风险是不是大。
我们说可以预测、报警,还有一个就是决策辅助。
这篇文摘是在ACR上报告的,这是在2018年的一个口头发言,我们就出了这么样的一个问题:当我们4种药、5种药联合用药的时候,出现了转氨酶升高,白细胞降低或者白细胞升高,我们先撤哪个药?在临床上医生比较习惯的就是最后加上那个药先撤。但是其实不对的,如果我们有这个大数据的支持,有所有的风险系数的支撑,我们用贝叶斯的算法,我们就可以算出来它的一个建议的撤药途径,这个吃药途径是降低风险最好的一个途径。
当5种药联合用药的时候,我们可以看到撤药途径就更加复杂。要没有这种算法和系统支撑的话,可能我们就凭感觉去撤药了。
还有一个就是怎么样提高我们的有效率?在这个有效率中间,我们用在RCT研究中间的系统就是跟医生一起建立的,实际上我们如果医生能看看到病人病情的变化,前后的曲线,他就可以用上台阶、下台阶、换方案,这三招就可以把绝大部分病人的病情可以控制住。所以我们有这个提示的系统建立好了。
我们看在这个预警中间,刚李春教授也给我们展示了,确实是干预和不干预有显著性的差异。就是接到这个干预的信号以后,有的医生我们没干预,有的医生我们干预了,它前后我们可以看到这是有显著差异的,12个月差异更加显著。
我们可以看到的是通过这样子的报警和干预,风湿科医生把我们基线达标率30%左右,1/3这样一个状态提高到2/3,甚至更高,我们的RCT研究可以看到可以提高到70%多。
那依据什么?我们可以建模型,就是不断地它的一个转归的图形,这些图形我们可以加入不同的因素喂进去,就可以建立出这样子的模型和算法。
这篇研究也是被大会接受,我们可以看到,我们就把这些相关因素作为一个复发的预警的模型。
同时我们讲的这是一个我们的兴奋,还有一个隐忧,总是兴奋和隐忧交织在一起。我们在张奉春教授的领导下,当时我们说用这个系统让医生一线门诊的时候拍上照片传上来,我们看看是什么状态,结果收上来了很多照片,我们就编了一个《中国风湿病图谱——类风湿关节炎分册》。让我们非常地兴奋的是医生真的特高质量的照片和病历。但是让我们非常痛苦的是,这是当今门诊的照片,可以看到这叫望远镜手。我最早的时候到美国去我还比较纳闷,什么叫望远镜手?他说就像麦哲伦的望远镜一样,一拉就长了,一松就缩回去了,骨关节全部被破坏了。这是我们搜集了有11例这样的病人,而这个是发生在今天,免疫抑制剂和生物制剂已经广泛被使用,而且现在的病程改善药可以很好地控制情况下出现的,这是非常可惜的。所以我们希望的是病人全部往这方面转归,这也是通过我们医生共同的努力,把达标率可以实现到78%这么一个状态。
我刚才听到李春教授的介绍,我们也非常地兴奋,我们可以看到的是中国研究的文章排名到了全世界Top1%,这是非常不简单的。
而这个平台产出的另外一个贾医生也介绍了,是《柳叶刀》的健康大会被接受,也是登在它的第一页作为主刊发表。
鲍春德教授团队利用这个平台随访病人,也成就了一个填补世界空白的研究。所以我们可以看到的是,在我们刚才列举的我们医疗的痛点,我们怎么样去解决,如果是用爱因斯坦的一句话来讲的话,刚才魏教授用爱因斯坦讲了imagination非常重要。爱因斯坦说了一句话,他说:人们总是犯一个错误,在发生问题的层面上想解决问题的方法是永远解除不了的,所以我们一定要换个思维方法,换个角度。用什么?必须要用我们现在的信息技术和大数据数据科学来解决我们医疗的痛点。
我们中国没有有效的随访系统,实际上我们可以有。这个可有是什么?靠我们现在的信息技术,SSDM就是一个,随机就诊的模式导致医患陌生的一个关系,现在可以用这个平台手牵手的把我们的医患装在一起。我们的医生可以想象,你有四五千个病人在你的身边不断贡献数据,你给他做好服务,你的学术进步了,你的收入上升了。还有一个很重要的一点,当这个医院不要你的时候,你可以带这个病人到另外一个医院去开你的诊所,实际上这是全世界流行的,这个我说的是大实话。
第二个就是每一个学科都提倡达标,但没有定期的病情评估。谁来评估?可以用病人把这些繁杂的工作做好,但是我们需要的是什么?我们要想让他成为我们医生的助手和科研的伙伴,一定善待他们,而且要好好的培训,培训他一次,他可以一辈子去管理自己的疾病,病人也成为你的助手,疾病的主人和智慧的病人。
在这个中间我们就可以实现了积极控制tight control,可以实现达标,而且我们可以抓住window of opportunity。中国病人可以选择不同的医院,当你是一个专科医生,你凝聚这个病人的时候,他就是在新疆、在西藏都是围着你转的,我们可以跨越时空。
我们可以看到的各个注册研究,刚才我们看到的这个结果超越了注册研究的临床的效果,我们的病人真正的产生的价值就是这些大数据为世界医学为人类健康作出贡献。所以我们的医生可以体现出他的智慧和价值。
这个就是我最后的一张幻灯片,大家看这个金字塔,刚才有循证医学金字塔,我们说这是我们对世界的观察,把这些观察的以数据、数字搜集上来,就是data塔数据,数据给它梳理好就是信息,信息把它进行分析,可以传播就是知识,而合理地使用知识是智慧。而怎么样合理地使用这些知识,就是要通过我们现在的信息技术和我们的数据科学的辅助,在这儿我非常感谢大会主席,感谢各位教授,感谢我的团队,谢谢大家。
张奉春教授:谢谢肖飞博士,肖飞博士既是CEO,也是一个知识型的学者,那么今天他利用SSDM智慧医疗的数据,一步一步地分析,看产生了很多的成果。我觉得这和我们魏正宗教授实际上有异曲同工之处,也就是我们积累的数据,我们怎么在里边去设计,怎么去挖掘,其实这目前一定是未来医学发展的一个大方向,但是又是我们的一个弱点。有的时候我们常常积累数据,结果积累数据干什么?还有积累数据的时候,怎么去把它标准化,其实我们没有做到。所以在大数据里边还有一个名词,大数据和大量数据是不等同的,大量数据等于垃圾数据。所以我们怎么才能让我们的数据真正成为大数据,我觉得肖飞博士刚才这个分析给我们做出了一个非常好的样板,谢谢你。

内容来自2023年海峡两岸医药卫生交流协会智慧医疗健康与数据科学分会学术会议。这是一场汇聚两岸医疗健康与数据科学精英的盛会,探讨了智慧医疗的过去、现在与未来之路。在接下来的几天里,会议上的学术讲座将会被陆续放出,以期对您的工作、生活有所启发。

更多信息请登录会议微官网查看

龙行

龘龘

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多