【重磅】人工智能影像应用深度研究报告发布

czxiaoyi 2018-06-10

展开全文

摘要

分析医疗影像面临的问题，梳理目前主流影像人工智能企业应用情况，总结影像人工智能行业发展主要瓶颈并提出建议。

医疗影像诊断面临的问题

疾病的病理过程会产生一定的病理解剖和病理生理方面的变化，这些病理变化在不同的影像学检查中会产生不同的影像学信息(X线和CT是利用人体组织间的密度差异，MRI是利用组织间的MR信号强度差异，US是利用组织间的声学信息差异)，通过对这些信息的分析，医生能够实现对机体病变的有效把握。

随着电子信息技术的发展，近年来各种多模式成像设备，如PET/CT、SPECT/CT和PET/MRI等的不断涌现，医学影像已经成为现代医学精准诊断的最主要证据来源。但硬件检查门槛的降低，并没有成功转化为影像可及性的提高，关键在于影像解读能力的严重不足。有以下表现为：

· 医学影像分析供需矛盾持续加大；

· 影像医生工作量大，双审核下避免漏诊依旧困难；

· 基层医生诊断经验不足，阅片质量整体较低。

据国家卫健委统计显示，2013至2015年三年中，全国累计完成放射诊疗12.4亿人次。而“2017中国医师协会放射医师年会”数据显示，全国放射从业人员约15.8万，其中放射医师只有约8万，具有副主任医师以上职称的只有2万人。以此推算平均每一位影像医师每年需要处理5100多人次的报告，以每一例报告最少需要两个医师阅片和报告估算，每位放射医师全年的诊疗人次约为12000，而2万名副高以上职称的影像科医师由于有审核工作，诊疗人次将会更多。

“放射科医生每天需要看上万张CT，有时为了检验肿瘤早期症状，一位病人甚至需要拍200张以上CT，即使每张只需要看3秒，也需要至少10分钟看完，医生的时间和精力都消耗于此。”

“目前，我国仅有8万多影像科医生，人员严重不足，每天超负荷工作，不可避免地出现漏诊、误诊。而我国医学影像数据的年增长率约为30%，而放射科医师数量的年增长率约为4.1%。”影像工作负担将进一步加重。

——某三级肿瘤医院放射科主任

人工智能带来新的解决方案

由于影像检查资料大量都属于客观资料，而且信息标准化的程度较好，早在人工智能技术出现之前，人们已经尝试通过各种方式提高影像诊断效率，其中以CAD（计算机辅助决策系统）应用最为广泛，它通过专家提取特征，制定分类规则，建立各种复杂严密的数学模型，实现了对影像的自动分析。但被固定的分析模型仅能处理和识别非常有限的影像表现，无法自主学习和优化。

基于深度学习的人工智能影像分析技术解决了这一不足，深度学习通过广泛的图像训练，从底层提取特征，能够实现对更加多样化的影像表现识别并不断自动优化。基于人工智能的新的解决方案给医学影像分析带来诸多益处：

· 高效的处理和分析影像速度，快速给出辅助判断结果；

· 良好的灵敏度，降低筛检中的漏诊率；

· 专家知识学习，定量数据分析，填补医技间鸿沟，提高基层检查质量。

人工智能+影像应用的现状

应用概述

目前，人工智能在医学影像领域的应用暂时无法脱离辅助角色。

其应用在功能层面上，主要有疾病诊断支持和治疗决策支持，疾病诊断支持的发展明显活跃于治疗决策支持；在图像类型方面，各类影像均有企业涉及，包括X线影像，CT影像，病理图像，超声影像等，但总体上以静态图像分析为主，对于动态影像的处理较少。

在图像处理方式上，包括了影像分类、目标检测、图像分割和图像检索。在疾病应用方面，主要集中于肺癌筛查，糖网筛查，病理细胞筛查，病灶勾画、脏器三维成像。

相关企业与产品清单

我们目前主流的影像人工智能企业及其产品进行了收集与梳理，具体见下表：

公司	产品	疾病领域	功能特点	落地医院
推想科技	智能X线辅助诊断AI-DR	肺癌识别	DR处理速度<>	100+（三甲50+）；协和医院、长征医院、同济医院、邵逸夫医院
推想科技	智能CT辅助诊断AI-CT	肺癌早筛	DR处理速度<>	100+（三甲50+）；协和医院、长征医院、同济医院、邵逸夫医院
雅森科技	雅森天玑™智慧医疗平台	多种疾病	多模态数据；包括：癫痫、阿尔茨海默症、帕金森病、慢性放射性职业病、分化型甲状腺癌、肺结节	宣武医院，北大人民医院，浙江省人民医院，浙一医院
图码深维	σ-Discover Lung智能肺结节分析系统	肺结节识别/自动分割/良恶性判断	处理速度≈1min;结节诊断敏感性96.7%；假阳性只有2.8FP/S;良恶性符合率90%	/
依图科技	care.ai ™ 胸部CT智能辅助诊断	病灶识别/分割/靶区勾画	结节检出的敏感性92%，报告的临床采纳率90%	浙江、上海、湖北等数十家顶级三甲医院
深睿医疗	Dr.WISE CAD医疗影像诊断系统	肺结节识别/肺癌早筛	处理速度≈30s;敏感度98.8%	数十家顶级三甲医院
腾讯觅影	食管癌筛查系统	早期食管癌识别	识别率90%、敏感度87%、特异度99%	重庆医科大学附属第一医院、重庆市涪陵中心医院、重庆市第四人民医院、三峡中心医院、重庆市第九人民医院
	早期肺癌筛查系统	肺癌早筛	3mm结节检出率>95%,敏感度85%，特异度90%
	糖尿病视网膜病变智能系统	糖网识别/分级	数十万张糖网分期数据（5级）;识别准确率97%;糖网分期准确率85%
	乳腺癌早期筛查系统	病灶定位/良恶性风险评估	钙化敏感度92%，恶性肿块敏感度90%，良恶性判别敏感度85%，良恶性判别特异度88%
阿里巴巴	医疗大脑	肺癌早筛	平均召回率89.7%(LUNA)	/
阿里巴巴	医疗大脑	皮肤综合分析	面部分割，识别毛孔，痤疮，黑头给出健康建议	/
汇医慧影	-	胸部疾病自动诊断	识别多种疾病：气胸、肺结节、肺结核、肿块。百万数据影像，人体器官模型;自动诊断准确率≈90%；肺结节的识别率>85%	几十家
		脑肿瘤识别	自动识别率>85%。
		乳腺癌识别	钙化斑点、肿块的识别率>90%
健培科技	阅片机器人啄医生	多种疾病	肺部疾病,乳腺、肝脏、脑部等疾病	100+；河南省胸科医院
体素科技	肺癌筛查	结节定位/良恶性评估	多源数据精准肺癌筛查；通过迁移学习，减少数据标注工作量	北京、上海三甲医院
	糖尿病眼底病变全自动分析	糖网筛查	/
	冠脉分析	/	基于冠脉CTA影像冠脉官腔狭窄分析及斑块定性、定量分析与风险评估
深思考	细胞图片医疗影像辅助阅片系统	宫颈癌/乳腺癌筛查；	细胞分类精度 99.3%;自动分割团簇重叠细胞，病变细胞识别与分级
上工医信	AutoEye筛查系统	糖网病分级	筛查云平台	300+
广州河谷	AI眼科诊断系统	多种眼部疾病	疾病严重程度分级（5级）糖网、青光眼、老年黄斑变性、白内障筛查
羽医甘蓝	宫颈细胞涂片智能辅助筛查系统	宫颈癌筛查	处理速度<1min;可以嵌入his>	不面向医院；合作4家厂商

目前行业人工智能+影像应用的特点

· 绝大多数应用以单一疾病入手，进行疾病筛查等检查需求明确的影像分析，并不适用于临床影像诊断需求。其中肺癌早筛是大多数企业的标配，整理的12家人工智能企业中，8家涉及，占66.7%。

· 强调训练数据集的数量与质量，并作为企业核心竞争力的一部分。

· 模型影像诊断效果是企业的宣传重点，但多数企业未披露具体评估过程，且评估指标各异。

· 市场火热但实际应用率不足，大多数仍然停留在实验阶段。

人工智能+影像应用的瓶颈

虽然影像人工智能发展火热，新进入企业不断增加，资本市场投资不断升级，但通过研究分析综合，我们认为人工智能+影像应用还面临着包括多个方面的发展瓶颈，主要包括以下三大方面：

技术方面

1) 基于概率分析的关联推理无法判断疾病的因果关系

目前的深度学习最主要的特征是基于数据学习的概率分析，其结果是能够进行有效的诊断和预测，因此目前的深度学习在影像疾病筛检诊断中表现出彩。但疾病诊治是一个复杂动态的决策系统，需要去理解不同因素与疾病的因果关系，才能够采取更有效的干预实现疾病的治疗。没有医学知识体系作为基础的深度学习数据分析，只是将结果压在训练数据上，训练数据的样本量和离散情况对于训练结果将产生直接影响。

然而目前AI的发展过分的强调“概率关联”，但是疾病对于人来说永远都有未知的领域，如何能够基于已有的医学知识，将数据和知识这两种模型结合起来，这才是影像AI在医疗领域向更深层次的治疗与干预层面应用的关键。

2) 训练所需标注数据集获取困难

目前基于深度学习的医学影像人工智能都需要大量的标注数据进行训练，而且训练所用的标注数据本身对于训练结果的影响要大于算法，但是现阶段来说，高质量的训练用标注数据获取是一大难点，在国内具体体现在如下几个方面：

· 数字化影像数据难以获取

国内影像数字化的进程在近些年才开始，CHIMA的抽样调查统计显示，2016年医院PACS系统的平均实施比例不足五成，三级以下医院甚至只有三成。一些不能支持数字化的影像设备在一些基层医疗机构中仍在使用。而拥有大量数字化影像数据的三甲医院数据的开放依然是一个很大的问题，企业必须与医院合作才有机会获取大量的数据，数据获取困难大。

· 影像数据标准化程度低

不同医院的影像系统互操作水平低，各个影像系统的数据纷纷散落在各地，互交换水平低。而且不同医院之间影像成像数据往往会有系统性偏差，一些企业在与医院合作获得的都是本院数据，单一来源的训练结果产生偏差，对于训练数据来源的医院产生的影像数据诊断灵敏度高，而对于其他医疗机构来源的数据诊断灵敏度低。如何能够获取多样性的大数据仍然是一大问题。

· 数据标注难度大

影像人工智能的训练需要大量已经标注好的影像数据，而标注需要花掉大量的人力成本，且对训练结果产生直接影响。数据标注的问题主要体现在如下几点：

i. 临床医学很多问题的定义依然是模糊的，一些问题定义的不明确使得标注产生难度，甚至对于一些问题，不同的专家标注的结果可能会产生很大差别。与此同时，医学的复杂性造成标注只能局限于限定的领域，疾病的筛查都专注于一两个领域，造成能够解决的问题也有限。

ii. 医学本身的专业性使得可以参与标注的人群门槛很高，需要医学专业背景与年资和专业水平要求，这使得能参与标注数据人员的数量进一步减少。

iii. 标注质量没法保证，市面上大多数公司很难拥有一支高水平的医生团队作为专业顾问，而将标注数据的工作单独外包不仅费时费力，还很难保证标注质量。

产业方面

1) 相关注册、准入、监管法律法规体系尚未形成

随着数字科学技术的创新和发展，从手机应用软件、健身追踪设备到临床决策辅助软件，数字创新技术在很多方面都改变着现有的医疗保健模式。美国食品药品监督管理局（FDA）认识到传统的审评方法已经不适用于监管这些新兴医疗工具。

2017年7月27日，FDA的器械和放射健康中心（CDRH）发布数字健康创新行动计划（Digital Health Innovation Action Plan），对医疗软件提出监管方法的新举措。主要包括了首先明确了受监管的医疗软件范围、创设软件预认证试点项目、成立评估专家组，并公布一系列几乎出台的规范性指南清单。

虽然中国市场的热度并不亚于美国，但在法律法规的跟进上相对慢了一些，现有声称取得准入资格的人工智能产品是按照传统的CAD遵循《医疗器械软件注册技术审查指导原则》进行申报所获得的。

目前中国食品药品监督管理总局（CFDA）也在积极的设计应对策略。2017年8月31日，国家食品药品监督管理总局（CFDA）发布了新版《医疗器械分类目录》，其中对医用软件目录作了更新，其中放射治疗轮廓勾画软件、放射治疗模拟定位软件被归为治疗计划软件下的放射治疗辅助软件，属于Ⅲ类管理类别。

而目前主流人工智能企业的产品例如乳腺X射线影像计算机辅助诊断软件、结肠计算机辅助诊断软件、肺部计算机辅助诊断软件、乳腺超声辅助诊断软件可归为决策支持软件中的计算机辅助诊断/分析软件类别，同样属于Ⅲ类管理类别。但是针对人工智能软件产品的准入标准，评估办法都还处于空白阶段。这也成为了限制相关企业实现产品变现优化的重要瓶颈。

2) 影像人工智能辅助诊断结果评估缺乏标准，效果存疑

目前人工智能+影像的应用集中于疾病的辅助诊断，病灶筛查。该类模型的效果评估本质上就是对筛检试验或诊断试验的评估。以肺癌早筛为例，最核心的内容是对肺部低剂量CT影像的结节识别以及结节部位、密度、大小、形态的分析。我们对不同影像判断应涉及的评估内容进行了整理分析：

影像判断	测试集需求	模型要求	评估指标
1 是否有结节	无肺结节正常影像+有结节异常影像	尽可能真确区分正常与异常影像	灵敏度，特异度
2 结节部位识别	已全部标注出肺结节的影像	尽可能正确检出肺结节	灵敏度，假阳性结节数
3 结节大小评估	已全部标注出肺结节及大小的影像	尽可能正确检出肺结节并给出正确的结节大小	灵敏度，假阳性结节数，大小分类的准确性
4 结节性质评估	通过病理活检确定良恶性的结节影像	尽可能真确检出结节，给出正确的良恶性分类	灵敏度，假阳性结节数，良恶性分类的准确性

目前主流的肺癌筛查人工智能影像系统会同时给出对结节的各项指标的综合判断，但我们认为不同内容的评估指标是有差异的，不应该混淆评估。在筛检试验中，高灵敏度可以降低漏诊率，高特异度可以降低误诊率。而假阳性结节数会直接影响模型对影像科医生工作效率提升效果，即使模型在筛检中为医生发现了部分漏检的结节，但前提是给医生增加了大量假阳性结节的判断工作，工作效率不升反降，这样的模型必然无法被医生所采用。

但从整理的相关企业披露的数据来看，企业对于模型效果评估结果展现并不清晰，对于结节大小的分组也未与专家共识一致：

公司	评价指标
腾讯觅影	3mm结节检出率>95%，3-10mm结节分析识别灵敏度85%，特异度91%
图码深维	2毫米以上的结节检出率可以达到95%，良恶性诊断准确率到90%。
推想科技	3-6mm准确率88%；医生点击率64.5%（纯自愿）
依图科技	结节检出的敏感性已高达92%，报告临床采纳率90%
慧医汇影	肺结节识别准确率最高可达到95%以上，敏感性接近95%，3mm的肺结节检出率可达到85%。
深睿医疗	肺结节检出的敏感性及特异性已经达到国际领先水平，其准确率更是高达98.8%

这个问题某种程度上折射出整个行业对医学知识理解的不足。动脉网蛋壳研究院搜集了47位人工智能医疗企业的CEO、CTO名单，除去14位专业不明确的，其中医学相关专业的比例仅为21%，人工智能专业占比52%，虽然所有的医疗AI创业公司都会聘请临床医学专家作为公司的医学顾问，但就目前的产品表现来看，还有很多进步的空间。

另外方面企业对外披露的数据上显示出来的混乱性同样也会让医疗从业者对人工智能效果存疑，这在一定程度上也必将影响了医疗从业者对人工智能的接受程度。

应用方面

1) 人工智能目前能够解决的医疗影像问题有限

医疗影像在临床中主要有三大作用：辅助临床诊断（识别，标注，定性，分级），放射治疗方案制定（分割，描边，大小，评估）以及介入治疗手术引导（3D可视化）。

目前市场主流产品主要集中于静态影像的辅助诊断，且主要针对影像分析需求明确的特定疾病，例如肺结节筛检，乳腺结节筛检，糖网病变分级等。即使声称为综合类的影像辅助诊断中，也以特定几类疾病为主，例如对肺部X线的智能分析，主要集中在对肺气肿、肺结节、肺炎、肿块等主要肺部疾病分析。

对于动态影像辅助诊断，目前主流的方法是将动态影像转化为静态图片进行处理，例如超声数据，不同于静态影像数据只看水平面上的相关性和信息，还需要处理具有同样有特点、特征的上下层信息。并且还要解决医生在超声检查中的移动速度和压力不同的导致的非标准化数据等问题。由于动态数据处理的要求更高，算法编制难度更大实际市面应用披露的非常少，比较活跃的仅有浙江大学的孔德兴教授团队。

人工智能在影像领域应用局限于特定疾病主要有以下两大原因，首先深度学习本身的自学习、自适应性决定的，它需要大量的样本数据学习才能更加准确地获取病症图像特征，以进一步作出病症诊断，这使得目前的应用主要集中在发病率比较高即病人数据量比较多的病症研究中。其次，医学影像本身信号处理的复杂性，对于信号差别较小、结构形态较为复杂的脏器、动态影像等模型训练仍较难获得满意效果。

2) 影像人工智能系统应用模式依然还需探索

目前，大多医疗影像人工智能在医院依然是试用阶段，其可能的主要应用方式可以分为：直接单独作为软件给医疗机构；与信息化系统集成后给医疗机构；与医疗器械合作与硬件一起提供给医疗机构；通过远程医疗提供给基层医疗机构；通过互联网医疗的方式直接提供给患者。在与提供直接提供给医疗机构的模式中，大量未接云端的系统和医院局域网的限制都有可能影响影像人工智能系统的使用。与此同时影像人工智能对于临床一线的影像医生诊断过程中起到的实际帮助作用，以及流程优化仍需要进行大量的实践进行探索。

人工智能+影像应用发展建议

技术方面

· 算法：加深规则和深度学习的联合模型的研究

· 数据：建立广泛来源、标准化数据集，提高训练数据质量；通过迁移学习减少标注，提高标注效率。

产业方面

· 人工智能软件注册规范制定应关注模型的前中后期过程规范，模型效果评估指标，模型安全性评价、诊断建议分级制度以及医疗机构的准入机制。

· 构建人工智能医用软件评估专家团队，研制模型评估体系与标准。

· 影像医学专家协会等行业组织，研究制定人工智能+影像相关专家共识，为企业提供医学专业指导意见。

应用方面

· 根据临床诊疗规范和标准术语实现对数据标注的规范化，提升系统结果输出的互操作性。

· 影像诊断模型的训练不应仅停留在对影像图像的识别和分析上，应整合病史、体征、实验室检查、其他检查等信息，进一步提升人工智能的综合诊断能力，从辅助诊断逐步过渡到预测判断和辅助决策参考。

参考资料：