分享

医疗大数据的终极三问:是何,为何,如何

 conscience6487 2019-12-29

 何谓大数据?

顾名思义,就是体量特别大且数据类型复杂多样的数据集,其特征是数量大、类别多、真实性高、速度快,因而难以用传统数据库工具对其内容进行抓取、管理和处理。

随着医疗改革的不断深化以及科学技术的飞速发展,医疗信息化的重要性引起了行业整体的极大关注。医疗的信息化是离不开数据的,而医疗的数据绕不开HIS系统,凡是对医学比较关注的人,一定都听说过HIS系统。医院信息系统(Hospital Information System,HIS),亦称“医院管理信息系统”,是指利用计算机软硬件技术、网络通信技术等现代化手段,对医院及其所属各部门的人流、物流、财流进行综合管理,对在医疗活动各阶段产生的数据进行采集、储存、处理、提取、传输、汇总、加工生成各种信息,从而为医院的整体运行提供全面的、自动化的管理及各种服务的信息系统。

HIS系统是一个复杂庞大的信息管理系统,按照HIS的功能划分,医疗系统的发展可以分为3个阶段:医院管理信息化阶段(HMIS)、临床管理信息化阶段(HCIS)和局域医疗卫生服务阶段(GMIS),根据国家卫生部制定的HIS功能规范,其总体可以划分为以下几个部分——

如果按照系统设计的初衷进行的话,那么从开始落地到现在,HIS系统积累的数据应该是很完善、很可观的。然而,根据相关资料的报道:85%的医院信息系统是以财务核算为中心的管理信息系统“HMIS”,只有10%的医院在开始探索建立以医生工作站为核心临床信息系统“HCIS”,5%的医院正在探索建立GMIS系统,这是不均衡的发展,这是“畸形”的。

一个发展完善的医疗大数据系统对于医疗质量的提高是立竿见影的,我们就拿医疗大数据中的电子病历来说吧。一份电子病历的"质量",宣小晟认为主要体现在两个方面,一方面是信息可靠性,另一方面是信息全面性

对于患者,一份质量过硬的病历,体现的是管床医生细致认真的询问及关怀,对疾病的诊治作用不言而喻;

对于低年资医生,学习写病历、写好病历,有助于临床思维的培养;

中级职称的医生,监管好低年资医生写好病历,有助于传帮带教;

高级职称的医生,注重提高病历质量,有助于提前发现隐患、有利于人才挑选及评价。

虽说近期国际权威医学期刊《柳叶刀》发布的全球医疗质量和可及性最新排名显示:我国HAQ(医疗质量和可及性)排名从2015年的全球第60位提高到2016年的第48位,是中等SDI(社会人口学指数)国家中进步最大的国家之一,但是这还远远不够,如果我们的HIS系统能发展得不那么“畸形”,而是均衡一些,或许医疗质量排名还能再往前冲几个台阶。

此外,之所以要迫切利用医疗大数据提高医疗质量,其中一个重要原因在于我国多地已经出现社保资金缺口,因此更要把钱用在刀刃上。

今年6月20日,国家审计署公布了2017年度中央预算执行和其他财政收支情况的审计工作报告,截至2017年底,审计的9个省级企业职工基本养老保险基金累计结余1.82万亿元,同比增长12.8%,总体收大于支,但其中6个省份有60个市2017年当期结余554.25亿元,而省域内其他45个市当期缺口460.55亿元;有32个市存在通过占用财政资金和失业保险基金、向银行贷款等方式弥补基金缺口的现象。另外,据统计我国卫生总费用和人均卫生费用迅速增长,卫生总费用从2004年的7590.29亿元,到2014年的35312.40亿元,10年内增长近4倍,这个数字的增长以及上述基金缺口的出现有一部分是来源于【过度医疗】

如果我们可以用数据科学方法来年度总结某些疾病数据,那么是不是就意味着可以让医疗提供者透过这些信息,开始建立一个全新的视觉,有助于避免疾病传播和一些特定的健康威胁。通过描述性统计分析,探索性数据分析,和预测性分析,制定一套对某些疾病最具性价比的治疗方案,并减少不必要的甚至重复的治疗。

就拿改善冠脉血运重建来说吧,有数据表明,2014年,我国每百万人手术量<400例/年,远低于发达国家(>1000例/年),冠脉介入与搭桥手术总量比约15:1,远远高于发达国家平均值3.3:1。其实,我们可以参考北美的NCDR、CCN等大型注册登记数据,建立冠脉血运重建注册登记数据库,为一系列质量改善研究提供实时的数据支持及强有力的监督反馈,让之成为整个“实践-评价-反馈”体系的核心,从而实现提高临床治疗有效性的同时减少过度医疗。

对政府来说,定期发布医疗相关数据,将有利于提高医疗过程中数据的透明度,能使医疗机构及其从业者的绩效更透明,直接精简业务流程,降低医疗成本,间接提高医疗或护理服务的质量,从而为医疗服务机构带来额外的业绩增长潜力,为患者带来更好的体验,进而改善医患关系。

医疗大数据从哪里来?

其实,我国对于医疗大数据早已做了顶层设计,2014年卫计委发布了“46312”工程,对国家卫生、计生资源整合做了顶层设计规划,其中的“3”就是指三大数据库,分别为电子健康档案数据库、电子病历数据库和全员人口个案数据库。

健康档案数据库:主要包含定期或不定期的健康体检记录、卫生服务过程中的各种服务记录、专题健康或疾病调查记录。数据来源于体检机构、医院和基层。

电子病历数据库:主要包含医院诊断治疗全过程原始记录,数据来源于医院,其商业化价值最高。

人口数据库:主要包含人口信息,数据来源于各大部门(卫计委、公安、民政、统计、人力社保、教育等)交互共享。

短短几年间,我国健康医疗大数据就已进入了初步利好阶段,国家作为政策引导方,已出台了百余条“纲要”或“意见”,为医疗质量的提升打下了坚定的基础。据不完全统计,从2013年到2016年,国家共颁布了58项与健康医疗大数据相关的政策:

除了上面所说的三种数据来源之外,随着人们生活水平的提高,可穿戴设备(手环、起搏器、眼镜等)也正成为医疗大数据的又一重要来源。

AMI Research的一项研究表明,可穿戴设备的市场到2019年可达到$ 5200万。可穿戴设备在监控心脏速率、睡眠模式、步行等等的同时,还提供环境、地理位置、行为模式、和生物统计的新维度。与社交媒体数据及非结构化的"生活方式"的数据相结合,将是一个强大的、潜力无限的组合。

要到哪里去?

用已有知识来预测未来,这是医疗大数据的最大价值之一。

在很长的一段时间内,医院的质控科是比较盲目的,虽说医院的系统每天都会产生很多数据,但是他们却不知道自己到底需要什么样的数据,再加上数据来源多、数据复杂、标准不统一等问题,大数据如何应用的问题迟迟没有答案。

现如今,答案似乎正慢慢浮出水面了— —

医疗大数据将在临床辅助决策医疗质量监管疾病预测模型临床试验分析个性化治疗等医疗服务领域发挥巨大作用。

其中,个性化医疗和疾病预测模型尤其值得关注。

个性化医疗

个性化医疗是医疗保健领域的一个热门话题,它可以根据每个人独一无二的遗传结构来规划用药,并将个人的基因蓝图和数据整合到他们的生活和所处的环境中,然后将这些数据与其他成千上万的人进行比较,从而诊断疾病并确定最佳治疗方案。国内几家涉及个性化医疗大数据业务的公司微医、零氪科技、全域医疗和医联,更是相继获得了国有资本的青睐,且融资都在5亿元以上。

疾病预测模型

近些年,生物基因组学和网络大数据分析技术的获得突破性发展。基因组学在传染病的筛查确认、疫情传染来源的追踪、以及病原变异等方面,提供了新的强有力的技术手段,而大数据分析对于传染病的预测、疫情传染来源的追踪提供了新的手段。

今年7月10日,《自然》上发表了一项重磅研究:一个由来自全球多家科研机构的白血病科学家组成的研究小组使用血液检测和机器学习技术,来预测健康个体是否有患急性骨髓性白血病(AML)的风险。

使用机器学习技术构建的AML预测模型结果示意图

很明显,我们将从分析医疗保健数据的因果关系中获得巨大的益处。毕竟,预防远远胜于治疗,在早期阶段发现的东西更容易处理,疾病治疗以及疫情爆发更容易得到控制。

知道了要去哪里,还要知道怎么去

打破信息孤岛现象

业界普遍认为,由于信息系统技术规范、基础信息数据标准的不统一和缺失,我国的医疗数据普遍不能互通互认,这直接导致各医疗机构大量有价值的数据,变成了“数据孤岛”。

宣小晟认为可以从以下三个方面打通数据壁垒,联通数据孤岛,实现互联互通:

首先,建立各种主索引,有病人主索引、医嘱主索引等,能够让病人和医生快速提取到自己需要的信息;

第二,建立数据的关联性,有关联的数据才有价值,割裂开的数据是没有价值的。比如说心衰与心力衰竭,懂医学的人都知道说的是同一个东西,但是对于机器来说,如果你不输入相关的逻辑,它会认为是两个事物。虽说现在人工AI被吹得神乎其神,但是从目前来看,电脑还是比较“笨”的,还需要我们一步步地教,对数据进行关联。

第三,统一数据管理,数据一定要统一搜集起来变成数据中心,数据要数字化、集成化、数据化、要素化、结构化、标准化、语义化、智能化。

走出人才缺乏困境

大数据并非无所不能:它可以同时提供真知灼见,也可能迷糊了我们的视线。

随着医疗数据堆积越来越多,从中找出有用信息越来越困难。宣小晟在查找资料时发现全国政协委员季加孚曾在一次采访中说过,北大肿瘤医院2017年住院患者数量就已超过6.4万人次,年门诊量超过61万人次,医院产生的数据量可想而知会是多么的惊人。

宣小晟之前曾看到这么一个故事:在美国阿肯萨斯州有个地方,这块土地曾经是一个钻石矿场,但后来因为钻石密度太少而被放弃。如今,这块地变成了钻石公园,游人可以去这里手工淘取钻石,万一真的找到钻石是可以自己带走的。很多人闻讯而去,然而淘了几天几夜,上百公斤泥却依旧一无所获。

认真类比一下的话,这故事和医疗数据的现状没有什么不同。当医疗数据集很大很多时,即便其中有钻石,也会造成开掘的极大障碍。因此,海量的数据,需要专业化的团队人才来打理。

如果没有专业化人才对这些数据进行诊疗过程分析,以发现大量临床电子记录数据之间的关系,为今后的循证临床实践提供参考,那么这些数据就仅仅只是数据,是没有价值的。只有专业人员对数据进行过筛选、分析、研究,才能得出那些真正有用的“钻石”。比如说,对二次住院预测分析大大降低了病情的不确定性,重症中心ICU病人全程生理参数数据监控分析,进行关键指标的警示和交互干预,使医护工作更有效率,优化了相关操作,降低了医疗风险。同时,有利于形成医护患协同的病人全过程的疾病管理分析,产生最佳医疗实践的疾病诊治流程。

医疗与计算机同属于知识密集型行业,医疗大数据初兴,目前来说,了解这两个行业特点的复合型人才少之又少,相信随着业界和学界的持续努力,尤其是系统性培养体系的逐步建立,健康医疗行业的大数据人才短缺现象会逐步得到改善。

未来的挑战

目前,将大数据应用到医疗行业仍有许多障碍,既有技术性的,也有心理上的问题。医疗工作者多年来收集纸质文件,已经根深蒂固,并导致了低效率,而新习惯需要慢慢养成,我们不能冒进,至少还要花时间搞清楚数据所有权以及患者隐私等问题。

结语

随着医疗大数据的不断发展、完善、应用,相信在不久的未来,医疗将是一体化的,包括健康与诊疗一体化、线上线下一体化、院外院内医生一体化。

期待着,这一天的早日来临。

平台声明

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多