CMU 邢波教授主题演讲：医疗决策中的弊病给了 AI 哪些机会？

cedt 2017-01-19

展开全文

有些人的血液里，天生流动着革命和创新的因子，所以他们会一针见血地指出某些弊病，然后想着解决它。————题记。

近期，未来论坛在京举行，在创新生态－从基础科研到前沿技术开发的圆桌论坛环节, 卡耐基梅隆大学计算机学院教授，机器学习系副系主任， Petuum 公司CEO 邢波做了一场关于医疗大数据主题的演讲，在此之前，邢波教授曾主持CMU的一个机器学习和医疗中心，致力于基于自然语言处理，图像和视频分析，计算基因组学以及泛组学等使用多维异质数据源的精准个性化医疗和智慧医院研发，以及包括移动和可穿戴设备，医疗数据隐私安全等应用于医疗行业的大数据技术。根据AI科技评论在现场的感受，整个演讲简单扼要，振聋发聩，以下是AI科技评论根据现场演讲摘录。

各位好，我想讲一下在医疗大数据和智能医疗研发和产业化过程中出现的问题，同时探讨给我们的基础研究和技术创新带来的启发。大家知道医生的世界是非常高压和紧张的，他们每天都面临排山倒海般的大数据迎面扑来，数据通常都非常昂贵、复杂，而且有极高的时效性，所以在这种基于数据做决策实际上是相当有挑战性的任务。实际上我们并不是很能肯定在面对大数据的情况下医生是不是真的可以从海量数据中实时地做正确决策，这也是我们在理论研究和应用开发所面临的极大挑战。如何能使医务工作者在数据的海洋中正确有效的驾驭或决策呢？

｜医疗决策中的4大弊病

通常我们会认为，医生的诊疗决策是基于确定的科学依据，疾病的诊断和治疗有统一标准的。但实际上很多著名医学家，包括著名的Arnold Relman教授，新医学英格兰杂志的主编，道出了相反的真相：实际上很多时候医生的决策经常是基于经验、推测，惯例，甚至仅仅是便利或习惯。

1. 过度诊断／过度治疗

另外一位著名医学家Leo Anthony Celi，他是MIT和哈佛的教授，而且是著名医疗大数据库MIMIC的负责人之一，他观察到医疗现象中有“钟摆现象'：多年前我们觉得很有效的方案在几十年后经常发现是无效甚至有害的。比如在重症病房里是不是要进入动脉导管手术，是不是要给更年期妇女使用激素，还是要给二型糖尿病患者控制糖的摄入；以及大家熟知的有关维生素，胆固醇作用的讨论。其他的问题还包括：病人安全、过度诊断、过度治疗，甚至在生物医学的可重复性，都是问题重重。事实上过度诊断过度治疗在美国医学界是一个严重的问题。大家如果想了解里面的细节，我建议你们看这本书，一位著名的医生Gilbert Welch博士写的，对此有详尽描述。他实际上是建议大家少看病、少去治疗，才会变得更健康。

这种过度诊断和治疗不光无助于人类健康，还造成了巨大的浪费。现在在美国每年大概有7000亿美元来自医疗上的浪费，这里面过度诊断和治疗导致了其中三分之一，同时它也挤占了很多其它资源，使很多本应优先服务的病人得不到应有的治疗。

2. 过度检测

另一个比较严重的问题是所谓的过度检测，大家知道现在我们的仪器变得更加精密了，我们有很多移动设备或穿戴式设备，可以大量获取每个人的健康信息。这个信息量是如此之大，很多时候我们并不知道一些所谓的异常到底是不是会导致疾病，或者是不是有重要性；因为如果用放大镜看每个人，每个人都会有点不正常，所以它到底和疾病是不是有关系，里面还没有足够研究。总之我们还缺乏对于这些大数据的深度、明确的了解，对它们和疾病之间因果关系的了解，对于复杂病理和致病因素的了解。

举一个例子，比如癌症，我们现在经常会说我们要攻克癌症、要早期诊断癌症，但实际上到底有没有必要呢？有没有对于结果的具有统计意义的证明呢？这是一个很有意思的问题，Celi教授指出：很多癌症在病理意义上很像是我们所说的“乌龟”，它实际上是潜伏在你的身体里缓慢成长，在它把你杀死以前你可能已经被各种其它毛病杀死掉了。比如大部分大前列腺癌的发病是在70-80岁以后，所以你就会想到底要不要干涉这个癌症，还是因地制宜地做其它的事情，比如关注其他疾病。

3. 不可靠的生物医学研究和过度的商业炒作

这个Celi教授进一步指出，实际上我们所面临的最大问题，比癌症或艾滋病更为严重的，是不可靠的医学研究和不负责任的商业炒作。比如在我们看到的很多“自然”或“科学”杂志里非常爆眼球的关于癌症的研究，它们大部分的发现实际上并没有很强的可重复性或很可靠的统计上有意义的依据；至于在商业上的炒作，大家也知道，最近在美国出了很大的丑闻，Theranos这个公司鼓吹用一滴血可以做多达200种科学检测，这种明显违反常识的论点居然可以在商界和民间大行其道，而且作为皇帝的新衣很多人没有戳破。这说明我们的科研和商业评估系统存在问题。

这里我们就要问基础的科学，科学的文化，科学的思维到底是不是有它应有的影响，或者是得到应有的重视。

4. 过度的基因检测

让我们再看看精准或者说个人医疗这个概念：现在公众被灌输的观念是：个性化诊断、个性化治疗，最终会革命性的颠覆医疗保健和公共卫生。而这种方法必须是是基于每个人的大数据：包括基因组、各种电子医疗数据，等等，最终它可以使人的健康更有保障。

实际上是这样吗？一个严肃的医疗工作者经常会提出这样的疑问—— 不见得会是这样。

我们发现很多基因突变，真正有统计意义致病的相对风险并不会高于1.5。而且我们还发现这些基因变异對传统风险预测算法极少有帮助。更坏的是，即使发现了有真正风险的基因缺陷，它对于人们的生活习惯或生活形态的影响，也没有产生显著影响。而且有很多数据显示，传统假说中的所谓个别几个DNA“热点”变异可以解释一个疾病的论调正在被推翻，因为现在我们发现大多数疾病的基因背景极其复杂，致病因素通常达到几千上万个不同的突变。

这种情况下我们就会要问，到底遗传学的研究应该往哪个方向走，而且在医院里很多病是不涉及DNA的，过于强调基因本身就是一个片面的观点。比如烧伤跌伤，检测DNA是一个很荒谬的事情。

所以我们需要想一想医疗研究到底怎么做一种重新思考。比如有一个著名的例子——镰刀型贫血症，60年前这个致病基因就发现了，它的突变可以导致一个蛋白质变性，以至于使红血球形状变形，但60年后我们还没有能够通过使用这个信息直接设计出药物来治疗镰刀型贫血症。

23andMe是一个很著名的公司，要把每个人用低价做基因测序，这样你就可以有机会掌握自己的健康，可以了解你自己。但实际上FDA的统计表明，现在还没有任何证据表明获得这种信息以后能对这个人的生活状态或生活习惯产生有益的改变；反而它会带来人的焦虑，带来过度测试，因此增加了医疗费用和风险。

| 医疗大数据的使用还处在非常原始的阶段

那究竟我们因该怎样用好医疗大数据？数据驱动的医疗到底催生一个什么样的产业前景？我认为我们目前对于医疗数据的使用还是很原始的，不夸张的说还处在石器时代。基本就是当一个病人来，留下数据，下一次这份数据被再使用就是同一个病人回来时。唯一的不同是纸病历变成了电子病历。所以现在大多数情况下某个病人的数据还没有对其他病人产生直接的帮助，扭转这一局面是依靠医疗数据来驱使智慧医疗以后的方向：把病人的数据综合起来去学习里面的规律，甚至是学习出里面的预测模型使每一个病人受惠。

所以医疗大数据分析的目标应该是把不同相的大数据整合，综合起来，它需要我们来研发新的模型、算法或计算能力，能够把复杂的数据联合起来产生有价值的结果。

｜人工智能会带来哪些机会？

那么在这一愿景中，我们需要倚仗什么工具呢？我认为机器学习在这里会起到核心的，不可替代的作用。就像我们现在所知道的，人工智能时代已经来临了，我们最近都能听到很多突破性进展，各种各样的成果层出不穷。

在未来智能医疗中，我认为这五个方面的技术突破和商业化的机遇和需求尤其突出：

1) 电脑医生

2）基因健康

3）智能医院

4）移动医疗

5）隐私和数据安全

我认为这些方面的产业突破和基础研究都会有很大的机遇。

1）所谓电脑医生，就是多相数据驱动的医疗决策系统。开发这样的系统在技术上要解决许多挑战：以我们研发的PetuumMed系统为例：他首先需要自然语言处理技术，计算机视觉技术，数据库技术对于原始电子医疗数据进行形式化和特征提取，然后需要复杂的人工智能和机器学习算法引擎进行推理，分析，最后需要高度稳定直观的互动式平台把结果提供给医生参考。这些计算和模型训练还需要高效的计算平台的支撑。这些工作，没有长期基础科研的积累，原创能力的培养，和完整全面的技术储备和人员培养，是无法完成的。

2）对于基因健康产业的推动，也远远不仅是像很多公司所做的，建造很多测序中心，为病人测序了事。而是要更多聚焦在遗传机理，数学模型，计算机模拟和预测，预测当基因产生变化以后它到底能产生什么样的下游影响，真正提供有效，可靠，个性化，和可执行的诊断，推荐功能，同时也为药物开发提供靶标，思路。我们的PetuumGen系统，正在朝这一方向努力。

3）医院设施的现代化也不只限于买了多少电子设备，装了多少摄像头，而是能否使用人工智能算法管理，运转医院。能够使得医院的管理或运营自动化、高效化，实现资源优化；和实时的自动服务，报警，能够使病人的需要能够及时得到发现和反馈。

4）大量的可穿戴，移动设备可以帮助我们追踪预测个人健康状况。如何用这些信息降低患病风险，节约医疗成本？实际上这里面还缺少一个连接这些移动设备，动态的大数据分析中心，和专业医生直接干预的闭环，实现无缝连接。所以研究可以往这上面走，甚至可以把移动医疗或是远程医疗的日程也放到同一个框架下来做比较深入的思考。

5）最后，所有这些研究，应用，和服务所收集，处理的数据都包含的高度敏感的个人信息，可能被用来损害用户的利益。如何保障这些数据的安全，和合法使用本身也是一个非常重要的研究和市场方向，这里面包括加密、防火墙，各种各样的保护方法，等等。

我想说技术研究题目的获得、手段的产生以至于结果的传导，实际上是一个非常广泛和复杂的过程，需要有人坐下来做一个深入思考，这里我想用这样一个最后的愿景来结束讲话，我想强调一点，智慧医疗或数据驱动医疗的进步和落地其实是离不开医生和医疗界的指导和配合的，当数据产生的数量或者是频率巨大，以至于到了人脑不能够用的时候，我们希望医生、技术研究者和开发者都做好适当准备，使我们能够从人脑跨越到电脑，使计算机或其它人工智能技术，甚至是其它的科学技术能够给人的需要和工作提供一个很好的帮助。

小结：

如果你拥有一定的技术实力后，发现问题永远比解决问题更重要，自AI科技评论君第一次在贵州见到邢波教授以来，邢波教授每一次的演讲都会针对实际问题，探讨非常实际而又有力的解决办法，让所有想创业却愁找不到方向的人突然找到一丝破局者的榜样之光。

以这次邢波教授介绍的构建在他们的Petuum通用机器学习平台之上的Petuum Med系统为例，他们针对医疗决策中的4大弊病，将医疗系统中的电子病历数据，医疗影像数据，借助Petuum Med系统，在解决现有医疗数据格式不统一的问题后，进一步借助AI／ML引擎来进行数据决策，再最后开发人机界面来把这些结果和医生进行交流。

依据Petuum Med系统的强劲实力，以科技为后盾去与医疗机构合作，让医院已采集的数据产生有效的决策信息。这样大家可以看到即使是医疗这种门槛较高的领域，AI也是有机会切入的。