深度学习辅助决策医疗器械软件审评要点(征求意见稿) ——解读(一) 2019年2月1日,国家药监局技术审评中心发布了《深度学习辅助决策医疗器械软件审评要点》(征求意见稿)。 为何此次发布的不是注册技术指导原则,而是审评要点? 引言 表1 软件设计开发过程 具体参考法规:
原文: 深度学习实为基于海量数据和高算力的黑盒算法,本审评要点重点关注软件的数据质量控制、算法泛化能力、临床使用风险。临床使用风险应当考虑数据质量控制、算法泛化能力的直接影响,以及算力所用计算资源(即运行环境)失效的间接影响。 解读: 摘自《深度学习,AI医疗器械“学然后知不足”》--彭亮,只有在数据质量控制、算法泛化能力以及临床使用风险等方面扎实做好工作,才能保证深度学习医疗器械的安全性和有效性。 原文: 软件风险管理活动应当基于软件的预期用途(目标疾病、临床用途、重要程度、紧迫程度)、使用场景(适用人群、目标用户、使用场所、临床流程)、核心功能(处理对象、功能类型)予以实施,并贯穿于软件全生命周期过程。软件临床使用风险主要包括假阴性和假阳性,其中假阴性即漏诊,可能导致后续诊疗活动延误,特别是要考虑快速进展疾病的诊疗活动延误风险;假阳性即误诊,可能导致后续不必要的诊疗活动(过度医疗风险)。进口软件除考虑假阳性和假阴性风险外,还应当考虑中外人种、流行病学特征、临床诊疗规范等方面差异的影响及其风险。应当采取充分的、适宜的、有效的风险控制措施以保证软件的安全性和有效性。 解读: 首先,软件风险管理活动应贯穿于软件全生命周期过程,因此我们先明确软件生命周期过程: l 软件开发过程:软件开发策划、软件需求分析、软件结构设计、软件详细设计、软件单元的实施和验证、软件集成和集成测试、软件系统测试、软件发布 l 软件维护过程:软件维护计划、问题和修改分析、修改和实施 其次,应在需求分析阶段要明确软件的预期用途、使用场景、核心功能的具体需求。 最后,在软件生命周期全过程识别所有的可预见风险,并对识别的风险进行风险分析、风险评价及风险控制。包括假阴性和假阳性的风险。如是进口软件,还应该考虑中外人种、流行病学特征、临床诊疗规范等方面的差异影响。 具体执行可参考标准:
(一)需求分析 原文: 需求分析应当以软件的临床需求与使用风险为导向,结合软件的预期用途、使用场景和核心功能,综合考虑法规、标准、用户、产品、数据、功能、性能、接口、用户界面、网络安全、警示提示等需求,重点考虑数据收集、算法性能、临床使用限制等方面要求。 数据收集应当考虑数据来源的合规性和多样性、目标疾病流行病学特征、数据质量控制要求(详见下节)。数据来源应当在合规性基础上尽可能来自多家、不同层级的临床机构,以保证数据多样性,提高算法泛化能力。目标疾病流行病学特征包括但不限于疾病构成(如分型、分级、分期)、人群分布(如健康、患者,性别、年龄、职业、地域、生活方式)、统计指标(如发病率、患病率、治愈率、生存率)等情况,以及目标疾病并发症与类似疾病的影响情况。 算法性能应当考虑假阴性与假阳性(指标、关系)、重复性与再现性、鲁棒性/健壮性等要求。 临床使用限制应当考虑临床禁用、慎用等场景。 解读:
输出文件:《软件需求规格书》
(二)数据收集 原文: 数据收集应当考虑数据采集、数据预处理、数据标注、数据集构建等活动的质控要求,以保证数据质量和算法设计质量。 解读:
图1 质量管理理论用于AI数据收集的质控 2.1数据采集 原文: 数据采集主要由临床机构实施,应当考虑采集设备、采集过程以及数据脱敏的质控要求。 采集设备质控应当明确采集设备的兼容性要求和采集要求。兼容性要求应当基于数据生成方式(直接生成、间接生成)提供采集设备兼容性列表,明确采集设备的制造商、型号规格、性能指标等要求,若对采集设备无具体要求应当提供相应支持资料。采集要求应当明确采集设备的采集方式(如常规成像、增强成像)、采集协议(如MRI成像序列)、采集参数(如CT加载电压、加载电流、加载时间、层厚)、采集精度(如分辨率、采样率)等要求。 采集过程质控应当建立数据采集操作规范,明确采集人员要求和采集过程要求。采集人员要求包括人员的选拔、培训、考核。采集过程要求包括人员职责、采集流程(如采集步骤、操作要求)。 若使用现有历史数据,应当明确采集设备要求、数据采集质量评估要求(如人员、方法、指标、通过准则)。 采集的数据应当进行数据脱敏以保护患者隐私。数据脱敏应当明确脱敏的类型(静态、动态)、规则、程度、方法。 解读: 图2 数据采集过程的人机料法示意图 数据采集过程应输出《数据采集操作规范》,文件应包括以下内容
兼容性要求:采集设备的制造商、型号规格、性能指标等要求; 采集要求:采集方式 、采集协议、采集参数、采集精度
2.2 数据预处理 原文: 脱敏数据由临床机构转移至生产企业形成原始数据库,不同模态的数据在原始数据库中应当加以区分(下同)。 数据预处理应当基于原始数据库考虑数据处理、数据清洗的质控要求。数据处理应当明确处理的方法,如滤波、增强、重采样、尺寸裁剪、均一化等。数据清洗应当明确清洗的规则、方法。 数据处理和清洗应当明确选用软件工具的名称、型号规格、完整版本、供应商、运行环境、确认等要求,同时考虑数据处理选用方法对软件的影响及其风险。 数据经预处理后形成基础数据库,应当明确样本类型、样本量、样本分布等信息。样本类型以适用人群为单位可分为数据序列(由多个数据组成,如结构序列、功能序列)、数据。样本量应当明确样本规模及确定依据,需要考虑样本量不足对软件的影响及其风险。样本分布应当依据疾病构成、适用人群、数据来源机构、采集设备、样本类型等因素明确数据分布情况,需要考虑数据偏性对软件的影响及其风险。 解读: 3 数据预处理过程的人机料法示意图
2.3 数据标注 原文: 数据标注应当考虑标注资源管理、标注过程质控、标注质量评估等要求。 标注资源管理包括人员管理和基础设施管理。人员管理应当明确标注人员和仲裁人员的选拔(如职称、工作年限、工作经验、所在机构,若有国外人员应当明确其资质要求)、培训、考核(如方法、频次、指标、通过准则,其中指标应当包括重复性、再现性)等要求。 基础设施管理应当明确标注场所(真实或模拟,环境、照明条件)、标注软件(名称、型号规格、完整版本、供应商、运行环境、确认)等要求。 标注过程质控应当建立数据标注操作规范,明确标注人员(如资质、数量、职责)、标注流程(如标注对象、标注形式、标注轮次、标注步骤、操作要求)、临床诊疗规范(如临床指南、专家共识)、分歧处理(如仲裁人员、仲裁方式)、可追溯性(如数据、操作)等要求。 数据经标注后形成标注数据库,其样本类型可分为数据序列、数据(由多个数据块组成)、数据块(如图像区域、数据片段)。样本量、样本分布等要求及风险考量与基础数据库相同。 解读: 4 数据标注过程的人机料法示意图
2.4 数据集构建 原文: 基于标注数据库构建训练集(用于算法训练)、调优集(若有,用于算法超参数调优)、测试集(用于算法性能评估),明确训练集、调优集、测试集的划分方法、划分依据、数据分配比例。训练集应当保证样本分布具有均衡性,测试集、调优集应当保证样本分布符合临床实际情况,训练集、调优集、测试集的样本应当两两无交集。 基于标注数据库构建训练集(用于算法训练)、调优集(若有,用于算法超参数调优)、测试集(用于算法性能评估),明确训练集、调优集、测试集的划分方法、划分依据、数据分配比例。训练集应当保证样本分布具有均衡性,测试集、调优集应当保证样本分布符合临床实际情况,训练集、调优集、测试集的样本应当两两无交集。 为解决数据样本分布不均衡问题,可对训练集、调优集小样本量数据进行扩增;测试集不宜进行数据扩增,若扩增应当分析对软件的影响及其风险。数据扩增应当明确扩增的方式(离线、在线)、方法(如翻转、旋转、镜像、平移、滤波等)、倍数,并考虑扩增方法选用以及扩增倍数过大对软件的影响及其风险。 数据经扩增后形成扩增数据库,应当列表对比扩增数据库与标注数据库在样本量、样本分布(注明扩增倍数)等方面的差异,以证实扩增数据库样本量的充分性以及样本分布的合理性。 解读: 5 数据集构建过程的人机料法示意图
基于以上几点解读,企业应建立一套完善的软件设计开发质量管理体系,才能将数据来源、数据收集过程、各过程人员的资质及培训要求、软件工具确认要求、以及过程中相应的风险识别评估等方面进行全过程的质量控制,确保AI医疗器械软件产品的安全性和有效性,每个研发过程相辅相成,缺一不可。 《未完待续》 用2018年的美酒斟满你的壶觞 干了这杯时光,让你忘了所有忧伤 用2019年的佳酿注满你的杯盏 饮了这杯醉酣 祝你未来宏图大展 德大先给您拜年了 送上新年贺礼一份 医疗器械临床试验在国家的推动下大力发展,医械人对临床实验相关知识的需求逐渐增加,为了让大家能有更多的学习机会,常州医疗器械产业研究院、常州创客咖啡科技服务有限公司、广州九泰药械技术有限公司、苏州德大企业管理咨询有限公司联合举办医械临床试验免费课程。 讲师介绍
做服务,德大是认真的! 2019,德大与您共协手!查找你的答案和目标,留下您的问题和需求 “德大医查”专门的留言版块,你有问,我有答! 动一动小手,让“德大医查”在您的主页停留!! 扫一扫二维码,直达主页 http://www./ |
|