分享

【心电大数据与人工智能】从纸质心电图中识别房颤的人工智能算法研究

 实用心电学杂志 2023-02-21 发布于江苏

循心电踪迹,探心脏奥秘!



作       者:章德云,魏国栋,耿世佳,王凯,徐伟伦,刘兴鹏,洪申达

作者单位:安徽心之声医疗科技有限公司(章德云,魏国栋, 耿世佳,王凯);北京哈特瑞姆医疗技术服务有限公司哈特瑞姆-心之声联合实验室(徐伟伦);首都医科大学附属北京朝阳医院心脏中心(刘兴鹏);北京大学健康医疗大数据国家研究院(洪申达)

作者简介:章德云,算法工程师,主要从事医疗相关的人工智能算法研究。

通信作者:刘兴鹏, E-mail:xpliu71@vip.sina.com;洪申达,E-mail:hongshenda@pku.edu.cn

基金项目:国家自然科学基金资助项目(62102008)

1

引用本文

章德云, 魏国栋, 耿世佳, 等. 从纸质心电图中识别房颤的人工智能算法研究[J]. 实用心电学杂志, 2023, 32(1):1-7.DOI:10.13308/j.issn.2095-9354.2023.01.001.

ZHANG Deyun, WEI Guodong, GENG Shijia,et al.Research of artificial intelligence algorithm for identifying atrial fibrillation from paperbased ECG[J].Journal of Practical Electrocardiology,2023, 32(1):1-7.DOI:10.13308/j.issn.2095-9354.2023.01.001.

2

摘要

目的  探讨使用深度学习方法直接对纸质心电图进行处理的可行性,并提出一种能从纸质心电图中快速准确地识别房颤的方法。方法  从CPSC 2018挑战赛数据中选取1 040例房颤患者和1 344例非房颤患者的12导联心电信号,并将其绘制成心电图。将这些心电图打印在纸上,并重新扫描成图像,再通过一系列预处理得到带白色背景的纸质心电图。利用这些纸质心电图构建房颤识别数据集,并以挑战赛提供的真实标签为金标准,对人工智能算法进行训练、验证和测试。结果  基于纸质心电图建立的人工智能算法的敏感性、特异性、F1得分分别为0.957、0.978、0.969,受试者工作特征曲线(receiver operating characteristic curve,ROC曲线)下面积为0.994。基于Grad-CAM的特征可视化结果表明,算法判断房颤的依据主要是纸质心电图中的P波位置及房颤发作过程中的F波位置,这与临床上房颤的心电图诊断标准是一致的。结论  基于纸质心电图的房颤识别算法性能较好。可视化结果表明,通过人工智能算法直接分析纸质心电图高效且可行,能为临床实践提供指导。

3

关键词

纸质心电图;房颤;人工智能;深度学习;特征可视化

      房颤是临床上最常见的持续性心律失常,而且其发生率会随着年龄的增长成倍升高。房颤在心电图上具体表现为P波消失,出现大小不等、形态各异的F波。房颤常与脑卒中、心力衰竭和死亡率增高有关,对患者危害极大,如房颤患者的左心房内易形成血栓,进而引发脑栓塞,威胁到患者的生存。

      心电图可以从心脏电活动中识别关键的病理生理特征,是诊断和管理心血管疾病的重要工具。目前国内外研究者借助人工智能算法在心电分析领域不断探索,极大地推动了该领域的发展。近年来,很多研究者提出了从心电信号中识别房颤的方法,而且这些方法的识别性能与经验丰富的临床医生相当。PEREZ等对内置心电监测功能的智能手表的房颤识别性能开展了一项大规模评估,在8个月内招募了419 297名参与者进行了117 d的监测,其中2 161名参与者接收到了脉搏异常的通知,最终该智能手表在心电图上检测到房颤并发出通知的阳性预测值为0.84。CinC 2017的目标是从短程单导联心电信号中识别出房颤发作,吸引了全球各地研究者的高度关注。最终,HONG等、ZABIHI等、DATTA等和TEIJEIRO等以0.83的F1得分获得了第一名。与其他三种传统分类方法不同,HONG等结合专家特征、中心波特征,以及深度神经网络所提取到的特征,对房颤发作与否进行准确判断,并进一步提出了一种多层知识引导注意力模型,其可基于心电信号预测心脏疾病。此外,该模型还能够结合医学知识给出更直观的解释,最终它在测试集中达到了0.943 6的PR曲线下面积。尽管现有方法在基于心电信号的房颤识别任务中表现出较好的性能,但是受我国医疗信息化发展程度的限制,心电信号在现有医疗环境中难以获取,限制了基于心电信号的房颤识别方法的应用。与心电信号不同的是,纸质心电图是临床上最常见的心电记录方式,因此,亟须一种能够从纸质心电图中自动诊断房颤的方法来辅助诊断。

      与基于心电信号的房颤识别不同,基于纸质心电图的房颤识别面临着以下几项挑战:① 纸质心电图较心电信号具有更高的数据维度;② 心律的复杂性使医生难以从纸质心电图中准确识别房颤,例如,许多非房颤心律表现出与房颤相似的不规则RR间期,导致人工智能模型诊断结果的可信度遭到怀疑;③ 房颤患者的12导联纸质心电图较少。

      为了应对上述挑战,在设计基于纸质心电图的房颤识别人工智能算法时,可采取以下策略:首先,使用轻量化的神经网络模型(neural network model, NNM)来减少数据维度差异带来的计算量;其次,引入特征可视化方法来增强模型的透明度和可解释性。此外,在辅助诊断中,特征可视化方法能够更直观地展示NNM进行决策的依据。最后,引入迁移学习方法来解决可使用样本数量较少的问题。

      本研究直接从纸质心电图入手,通过神经网络提取与房颤高度相关的心电图特征,并对这些特征加以整合,从而准确地分析患者是否发作房颤。在此基础上,利用特征可视化技术对神经网络的可解释性进行研究,以更直观地展示神经网络识别房颤的依据。通过与现有诊断经验进行对比,本研究还探讨了神经网络为何能够快速准确地判断是否发作房颤,验证了直接通过纸质心电图进行心电分析的可行性,为人工智能心电分析准确高效地指导临床实践提供了新的思路和方向。

01

材料与方法

1.1  一般资料

      本研究使用的数据来源于2018年中国生理信号挑战赛(The China Physiological Signal Challenge 2018,CPSC 2018)心律失常分类数据集。该数据集包含6 877例12导联心电信号,其中,正常心律、房颤、一度房室阻滞、左束支阻滞、右束支阻滞、房性早搏、室性早搏、ST段压低和ST段抬高分别有918例、1 098例、704例、207例、1 695例、556例、672例、825例和202例。这些心电信号持续6~60 s,采样频率500 Hz。本研究首先根据以下排除标准选取房颤的心电信号:① 心电图记录时长<10 s;② 心电信号质量极差,以致影响到对疾病的判断。然后,使用python中的np.random.shuffle打乱数据顺序,再按打乱后的顺序取前1 344例非房颤患者的心电信号作为非房颤样本。最终,本研究纳入1 040例房颤患者和1 344例非房颤患者的12导联心电信号。

1.2  研究方法

      本研究利用神经网络直接提取纸质心电图中的波形特征,以实现对房颤的准确识别;还引入了迁移学习方法,以加快神经网络对房颤识别任务的学习速度,并进一步提升房颤识别性能。通过纸质心电图预处理、模型训练和阈值选取,实现基于纸质心电图准确识别房颤。具体流程如图1所示。

1.2 1  预处理

      从CPSC 2018挑战赛数据中获取1 040例房颤患者和1 344例非房颤患者的12导联心电信号后,将2 384份心电记录绘制成心电图。为了更加贴近真实的医疗环境,这些心电图被打印在纸上并重新扫描成图像。本研究使用的纸质心电图网格中,横向的每一大格表示0.20 s,每一小格表示0.04 s;纵向的每一大格表示0.5 mV,每一小格表示0.1 mV;走纸速度为25 mm/s。由于纸质心电图中的背景网格可能会对神经网络提取心电曲线特征造成一定的影响,因此,要对扫描后的图像进行预处理,消除与房颤识别任务无关的信息。首先,采用颜色通道分离法对图像的红色通道进行提取,并结合OTSU算法进行自适应阈值划分,从而去除背景中的红色线条;其次,对已去除红色线条的图像进行形态学转换,通过图像二值化,以及开运算、闭运算来消除图像中的噪音干扰;然后,采用8连通域分析使提取到的心电曲线更为平滑;最后,进行水平投影操作,通过求像素和来矫正倾斜的图像。

1.2.2  神经网络参数设置及数据划分

      本研究将轻量级的神经网络EfficientNetV2应用到房颤识别任务中,取得了良好的效果。考虑到数据集中包含的图像数据较少,因此,使用迁移学习方法引入已在ImageNet数据集上完成预训练的EfficientNetV2中的权重参数,并将其作为本研究中NNM的初始参数。这种方法能够为用于房颤识别任务的NNM提供一定的指导,利用已有的知识提高NNM的学习效率,使其获得更高的起点、上限及更快的学习速度。本研究还采用了随机采样裁剪、随机水平翻转和正则化等操作进行数据增强,以提升训练集中数据的多样性与全面性,增强NNM的泛化能力。利用自适应矩估计优化算法来更新NNM中的权重参数,并使用如下交叉熵损失函数计算预测结果与真实结果之间的差距,即损失值loss:

      其中,N表示纸质心电图的数量;M表示纸质心电图的类别;yn,m表示输入纸质心电图的类别;gn,m为NNM的预测概率。

      将NNM运行的迭代周期设为50,初始学习率设为0.001,批次大小设为32,权重衰减设为0.000 01。本研究中,通过监测验证准确率来调整学习率:当验证准确率在10个迭代周期内不再增加时,学习率下降至原来的1/10。

      数据集中一共包含1 040例房颤患者和1 344例非房颤患者的纸质心电图,分别打乱两类图像的排列顺序,并按照6 ∶2 ∶2的比例将它们分别划分至训练集、验证集和测试集。

1.2.3  阈值选取

      根据测试结果,以0为初始点、1为终点、0.001为步长,逐步选取阈值,最终得到1 000个结果。以F1得分为主要指标,从这些结果中选取最佳阈值。

1.2.4  特征可视化及人工智能模型的应用

      由于缺少可直观呈现决策细节的能力,NNM的可信度一直受到质疑,也导致医护人员难以信任NNM的诊断。为了建立对纸质心电图房颤识别模型的信任,为医生提供辅助诊断的依据,本研究引入了Grad-CAM来展示影响NNM决策的关键特征。该技术可以为任何深度NNM生成视觉解释,而无须更改架构或重新训练模型。

      心电数据预处理、人工智能模型和特征可视化方法的结合,可显著增强纸质心电图房颤识别方法的通用性和功能性,使之适用于任何医疗应用场景。具体实现流程如下:第一步,对用户输入的纸质心电图像进行预处理,得到带白色背景的纸质心电图;第二步,将纸质心电图输入已训练好的人工智能模型,得到预测结果;第三步,根据预测结果,可视化展示人工智能模型中的关键特征;第四步,对预测结果和可视化热图进行展示。

1.2.5  评价指标

      本研究采用敏感性、特异性、F1得分,以及受试者工作特征曲线 (receiver operating characteristic curve,ROC曲线)的曲线下面积(area under curve,AUC),对NNM的房颤识别性能进行评价。上述评价指标按下式计算:

      其中,TP、FP、TN和FN分别代表真阳性、假阳性、真阴性和假阴性。

      敏感性越高,NNM的漏检率就越低;特异性越高,误检率就越低。F1得分是对精确率和召回率的加权平均,能更准确地体现NNM的性能。当随机挑选一个正样本和一个负样本时,根据当前NNM计算得到的概率,将这个正样本排在负样本前的概率就是AUC。上述评价指标的取值范围均在0~1,其中,0表示最差,1表示最好。

02

结果

2.1  训练与验证结果分析

      深度学习NNM的loss值和准确率随迭代周期的变化情况如图2所示。在训练初始阶段,NNM的loss值下降较快,准确率则逐渐升高,但是NNM的识别性能并不稳定,验证的loss值与准确率仍然有一定程度的波动。在训练阶段的末期,NNM内部的权重参数随着训练次数的增加而逐渐接近最优,loss值逐渐收敛,准确率的增长也逐渐平缓,这也表明NNM的性能更加稳定。而验证阶段的loss值与准确率在经历多个迭代周期后趋近于某一固定数值。从曲线变化趋势可以看出,NNM在训练过程中并未出现过拟合现象,体现了NNM参数设置及训练策略的合理性。

2.2  测试结果分析

      在完成训练之后,对NNM进行测试并选取阈值。当阈值为0.496时,NNM识别房颤的性能最佳,此时敏感性、特异性和F1得分分别为0.957、0.978和0.969,进一步验证了使用人工智能算法直接分析纸质心电图的可行性。根据测试结果,NNM每0.23 s即可完成对一张图片的识别,算法运行效率较高,基本能够满足真实医疗环境下医护工作者的需求。图3展示了该NNM在测试集上的ROC曲线和混淆矩阵。从图3a中可以看出AUC达到0.994,进一步证明了网络的鲁棒性。图3b是神经网络在房颤识别任务中的混淆矩阵,其中,纵坐标代表预测结果,横坐标代表真实标签。0代表非房颤,1代表房颤;网格的颜色越深,代表该类识别的准确率越高。混淆矩阵中不同的数字代表不同的含义,其中,199、264、6和9分别代表真阳性、真阴性、假阳性和假阴性样本的数量。根据这些样本数量,可以得到该NNM识别房颤的整体准确率约为0.969。

2.3  样例分析

      部分预测结果样例如图4所示。由此可知,纸质心电图中的心电波形存在噪声干扰、P波振幅过小、部分导联信号形变等问题。尽管这给准确识别纸质心电图带来了一定的困难,但NNM仍能准确判定纸质心电图的类别。这说明NNM能够准确地提取到与房颤相关性较强的特征,对纸质心电图中的心电波形有很强的适应性。

03

讨论

      本研究提出了一种可直接从纸质心电图中识别房颤的人工智能算法,其通过提取心电图特征来快速准确地识别房颤。在测试数据集上,该算法表现出较好的识别性能和较快的识别速度。心房在除极时产生P波、在复极时产生Ta波(被QRS波掩盖),然而,房颤的发生是由心房内存在多径路传导及无数微折返激动所致,这使得房颤发作时P波会发生变化。临床上房颤的心电图诊断标准如下:① 窦性P波消失,出现形态、间距及振幅均绝对不规则的F波;② F波频率在350~600次/min;③ QRS波群形态通常正常,但是当心室率过快且发生室内差异性传导时,QRS波群可增宽、变形。其中,V1导联上能明显观察到F波。

      为了探讨NNM如何快速准确地识别房颤,本研究基于Grad-CAM对NNM提取的特征进行了可视化呈现,并与心电图临床诊断标准进行了对比分析。图5为房颤和非房颤纸质心电图特征的可视化结果(扫描OSID码可查阅彩图)。纸质心电图中的区域越高亮,该区域的关注度就越高;区域越暗,该区域的关注度越低。对于非房颤而言,NNM主要关注心电波形区域,以对P波区域的关注度最高。而NNM在判断房颤时对心电波形中的V1导联更加关注。这说明NNM基于纸质心电图判断是否为房颤时, V1导联上明显的F波是极其重要的特征,这与临床上对房颤的心电图诊断标准相吻合。特征可视化结果表明,NNM的决策与临床医生的决策高度重合,不仅说明人工智能算法能从纸质心电图中准确学习到识别房颤的关键信息,确保网络的可靠性,而且还能使临床医生更易理解NNM识别房颤的依据及决策过程,确保了网络的透明度。

      本研究通过NNM建立了从纸质心电图中识别房颤的人工智能算法,实现了对纸质心电图中房颤的准确识别。本文提出的NNM有望在未来应用于真实的医疗环境中,在减轻临床医生的工作量、辅助医生准确诊断和缩短诊断时间等方面发挥应有的作用。但本研究仍存在一定的局限性,如收集到的心电图均为标准定标心电图,并未考虑不同定标的情况。在今后的研究中,要进一步评估算法在使用不同定标患者群体中的性能。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多