分享

医学图谱的智能系统——康伯石CEO刘东方博士讲述医

 cqyuanye 2017-09-09

2017-07-29泰山汇健康金融

2017年7月25日下午,由泰山汇主办,思宇研究院、泰智会、动脉网协办的“医疗人工智能:颠覆医疗的新科技”高端沙龙活动成功举办。当天,一百多位来自医疗健康领域的投资精英及产业专家参加了此次沙龙,康伯石信息技术有限公司CEO刘东方博士带来了“基于医学知识图谱的推理型智能系统”主题演讲,以下为演讲内容整理:

目前我国颁布的关于新一代人工智能的发展规划中,在共建关键基础这一块,前两条提到的都与知识相关,第一条叫做知识计算引擎医疗及知识服务技术,第二条专门提到知识图谱的构建与学习。

医学知识图谱和深度学习的不同之处在于:现在的机器学习旨在帮助医生解决需要依靠经验积累才能完成的任务,能够直接有效地提高医生的工作效率;而知识图谱的推理型系统侧重于传递语言知识和思维方式,是培养一个医生最常用的方法。

医学图谱的智能系统——康伯石CEO刘东方博士讲述医

一、为什么我们要成立康伯石

南京康伯石信息技术有限公司成立于2014年,是一家智慧医疗领域的创业公司,公司的核心业务是基于权威资料源的医学知识图谱的构建和应用,主要产品方向是基于知识图谱的问答系统。

我本人之前在协和医院心内科工作了12年,2016年正式加入康伯石,但实际上早在2012年我就已经深入参与到这个项目。当时听到时我就觉得跟我的一些困惑很是契合,是解决之前遇到的一些痛点比较好的办法。所以,在菜还没上来的时候,我就已经同意和他一起做这个项目。

1、医生培养过程中的痛点

医生的培养过程是很漫长和严格的。从一开始,一个医学生大概需要花费5—8年的时间全面系统地学习基础知识;再需要3—6年的时间补充临床知识,运用知识,建立临床思维;其后是专科培训,深入全面学习专科知识;最后可能成为某一领域的专家,主要工作是跟踪文献,更新知识和输出知识。

2、痛点的解决方式

欧美国家其中的一种解决方式就是实行医生的精英教育,必须要聪明才能当医生。前两年的新闻说过,香港的状元都学医,而内陆的几十个状元没有一个学医的,我们现在的医生整体素质不是很高,这条路线基本上行不通。第二种办法就是目前国家倡导的医生的归培+继续教育,帮助医生不断提高水平。第三种,借助知识库网络,但这些都是浏览性的,医生需要花费大块的时间去检索、分析、学习,无法有效帮助医生解决面临的痛点。

我们的解决方案——构建医学知识图谱。我们构建了医学知识库,希望通过对医学知识进行语义结构化,连接医学概念和医学知识,构成一个医学知识图谱。比如通过把刚才讲的对于高血压水肿问题的解答写入查询路径,他可以找出所有的从高血压链接到水肿的路径,这样就会发现一些新的别人都没有想到的东西,从而发现隐性的临床思维路径。

二、知识图谱的概念、发展过程以及它的应用场景

1、知识图谱的概念

知识图谱的核心观点是“things,not strings”。知识图谱的核心是一个知识库,但它是一个图结构,包括两个基本元素,一个是结点,一个是边,结点代表了某一个概念,边代表的是关系,这样的每一组叫一个三元组,是知识图谱的基本单元。

医学图谱的智能系统——康伯石CEO刘东方博士讲述医

知识图谱不算一个单独的技术,更多的是一种思维方式,一种解决问题的方法,是一个结构化技术的处理方法,涉及的技术很多,我们要求知识图谱的精度非常高,单靠处理技术、深度学习技术都是不够的,还需要人工干预确保准确性。知识图谱可以进行推理,多数应用场景只需要浅层推理,但在其垂直领域深层推理能力可以用来解决人脑难以应付的问题。

2、知识图谱的发展过程

知识图谱从60年代人工智能开始就出现了,经历了很长的发展时期,国外这块做了很多的工作,在人工智能发展过程中,80年代专家系统比较火的时候,实际上就是知识图谱这一支里面的。

医学图谱的智能系统——康伯石CEO刘东方博士讲述医

医学图谱的智能系统——康伯石CEO刘东方博士讲述医


3、知识图谱目前的应用场景

1)搜索引擎

现在大家能够看到的应用包括谷歌的优化搜索,比如把“李娜”输进去,原来可能就是一些链接,这个链接里面包括关键词,就是“李娜”和“大满贯”,现在可以直接告诉你拿到大满贯赛事冠军次数,会给一个知识卡片,里面有很多具体、简单的信息,比如身高、体重、国籍,这些信息都存储在知识图谱上。


医学图谱的智能系统——康伯石CEO刘东方博士讲述医

在百度上搜“克林顿的女儿的妈妈”的时候,他会给你一个具体的人,这里面实际是用到知识图谱的推理功能,因为知识图谱已经存了“克林顿的女儿是谁”,“克林顿的女儿的妈妈是谁”,就可以直接告诉你,这是知识图谱推理的一个应用。

医学图谱的智能系统——康伯石CEO刘东方博士讲述医

2)聊天机器人。

现在国内的聊天机器人有不少会用到知识图谱,对话式的信息获取更加需要精准度和可靠度,知识图谱对于用户体验更加不可少。

医学图谱的智能系统——康伯石CEO刘东方博士讲述医

3)数决分析和挖掘。

这是知识图谱跟大数据相结合,用到很多知识图谱的技术,可以更深的挖掘出大数据里面的价值。

医学图谱的智能系统——康伯石CEO刘东方博士讲述医

三、医学领域知识图谱的发展现状

目前,国内在医学领域知识图谱这块基本是空白,而国外实际上很早之前就很热,当时不叫知识图谱,叫Linked open data,还有一个比较大的是DDP。医学方面更多是基础医学,临床医学比较少,主要是药物、基因、分子生物学方面,里面都是一些偏基础的东西。这种应用是典型的我给你两个数据,你给我找出可能链接到这两个数据的所有链接,这样只找了一层关系,而我们可以设计找几层关系。

医学图谱的智能系统——康伯石CEO刘东方博士讲述医

做医疗系统的人可能知道,SNOMED—CT、UMLS、ICD—11,实际都是在知识图谱上做,这是能够公开查到的可视发展截面,已经具有了知识图谱的一些关系,关系比较简单,更多的是上位词和下位词的关系。医学图谱的智能系统——康伯石CEO刘东方博士讲述医

国内在这方面做的时间比较长的是中医药研究院的于桐教授,从上世纪末本体论开始,一直到语义,他们构建了一个中医药的知识图谱,这块是国内能够找到的医疗的知识图谱做的最好的,但是只涉及到中医药。

医学图谱的智能系统——康伯石CEO刘东方博士讲述医

谷歌前段时间提出要把医疗作为重点,现在谷歌的医学知识图谱不知道建成什么样,但是在应用上面能看到,他做了很多医学方面相关的知识卡片,这是点到点,会有一些相关的知识卡片的信息,以前是没有的,更深一步目前还没有看到。国内这块做得并不比谷歌差,国内百度、360都有这一块,我们搜“鼻炎”的时候会给出相关的东西,边上还有相关的药物,这种形式的展现都需要用到后台的知识图谱。

国内做自助诊断、自动问诊、辅助决策、大数据、知识库的公司,他们解决实际问题的时候,都会构建自己的知识图谱,这些知识图谱都是非常典型的,解决自己的应用就可以。实际我们建的是一个非常全的、非常深的,希望能够把所有的医学知识都能够纳入进去。

医学图谱的智能系统——康伯石CEO刘东方博士讲述医

总的来说,在医学领域的知识图谱方面,国外已经有了大量基础工作,但更多的是局限在基础医学领域,临床医学我们现在也没有看到非常好的。现在大多数知识图谱都只是浅层的关系,缺乏一些深层的关系,应用受到限制。另外大家在建立知识图谱的时候缺乏共识,各自的知识图谱难以融合在一起,浪费了很多资源。

四、康伯石是如何搭建医学知识图谱的

1、让更多医学专业人员认识知识图谱,参与医学知识图谱构建

当时跟复旦大学的专家聊,他表示做人工智能非常辛苦,知识图谱只有圣人才能做这事情,其实医生在这块有先天的优势,因为医生可能是所有的行业里面最接近圣人的。国内的医生特别便宜,所以现在我们要组织一批水平还可以的医学生或医生来做这件事,消耗的成本不高。在国外这个事情基本不可能实现,国外的医生跟深度学习的工程师差不多价钱,差不多一年三四十万美元,国内招一百个医生真是没多少钱,平安号称自己有两千个专职的医生负责咨询,这在国外是不可想象的事情。

医学图谱的智能系统——康伯石CEO刘东方博士讲述医

2、建立知识表识体系

我们现在在知识图谱方面做了接近四年,还是比较扎实的,我们首先建立了一套知识表识体系,这是建立知识图谱的核心,但是高度抽象,用这样一套体系能够表达所有的医学知识,而且能够很好的表达内部逻辑,便于应用,这是比较难的事情。

3、构建开发和维护系统

我们构建了知识图谱的开发和维护系统,这个系统基于规则,开发和维护是同等重要的,因为知识图谱本身量非常大,如果没有进行维护,再建一次成本非常高,我们有一个很完整的生产、校验、维护,这是很好的一套系统。

4、从应用出发、从基础出发构建中文医学知识图谱

我们现在做的应用产品定位是面向全科医生、医疗咨询人员和以学生,这些人对于知识的需求是最大的,对于一些专科医生来讲他们的需求量比较小,专科涉及的范围比较有限。

我的分享到这里结束了,谢谢大家!

整理:刘明宇


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多