【原】基于深度学习的阿兹海默诊断（上）

思影科技 2024-04-08 发布于重庆

展开全文

阿尔茨海默病在老年人群中大约每9人中就有1人患病。作为一种神经退行性疾病,迄今为止仍无法治愈,主要通过医疗服务提供者的支持性治疗来管理病情。因此,该病的早期诊断是制定治疗方案的关键步骤。目前已有多种诊断程序,包括临床检查、扫描、生物医学检测、心理测评等。计算机辅助诊断技术有助于该病的早期发现,过去已经提出了多种此类机制。这些技术利用机器学习模型来开发疾病分类系统。但是,这些系统的重点现在已经逐渐转移到了更新的深度学习模型上。本文旨在全面回顾过去5年中该领域的最新技术,为该领域的新手研究者提供早期诊断系统开发所需的各种工具和数据集的基本概述。我们讨论了探索生物标志物、识别和提取相关特征、传统机器学习与深度学习模型之间的权衡,以及多模态数据集的重要性。这使医学和工程领域的研究人员和开发人员能够应对已发现的问题,开发出有效的阿尔茨海默病诊断系统。本文发表在Artificial Intelligence Review杂志。由于篇幅较长，将分两章进行介绍，感谢帮转支持。

1 引言

计算机辅助诊断(CAD)系统可以帮助医疗服务提供者识别、检测和诊断人体内的特定疾病(Gendy and Yuce 2023)。当今,由于生物医学工程、数据采集技术和数据分析领域的进步,CAD系统几乎应用于医学科学的所有领域(Amorim et al. 2023)。神经退行性疾病是一类以大脑和中枢神经系统神经元细胞功能丧失为特征的疾病。阿尔茨海默病(AD)就是这样一种在全世界影响大量人口的进行性神经退行性疾病(Knopman et al. 2021)。AD发生在老年人群中,导致长期记忆力丧失、认知障碍、行为不一致以及其他一些症状。AD是一种痴呆类型,指由于大脑内嗅皮层和海马区功能失调,认知能力逐渐或持续下降的病症,尤其影响记忆力和抽象思维能力(Strikwerda-Brown et al. 2019)。这些大脑影响可能在症状首次出现前十年或更早开始(Yu et al. 2021a),这一阶段被称为轻度认知障碍(MCI)(Garg et al. 2023)。

AD在老年人群中大约每9人中就有1人患病(Spetz and Flatt 2023)。由于该疾病的退行性特点,治疗AD是一项具有挑战性的任务,只能通过临床管理来解决。因此,在早期阶段(即MCI阶段)诊断AD可以更好地治疗该疾病(Porsteinsson et al. 2021)。通过CAD技术的辅助,AD的早期检测如今已变得更加高效和可靠。正电子发射断层扫描(PET)和磁共振成像(MRI)等神经影像技术的进步,再加上新的机器学习(ML)技术,为CAD方法做出了贡献(Ghazal and Issa 2022)。目前,在公开影像研究系列(OASIS)和阿尔茨海默病神经影像学计划(ADNI)等各种来源中都有几个诊断数据集可用,其中包括人口统计学、影像学、临床和遗传学等患者健康记录。这些数据集目前正被研究人员、学者和工业界用于开发用于CAD（计算机辅助诊断）的ML技术(El-Sappagh et al. 2021a)。过去,已经发表了几篇关于AD的CAD的综述。它们回顾了不同方法的工作。

其中一些考虑了不同的ML技术对AD阶段进行分类(例如,Grueso and Viejo-Sobera 2021; Zhao et al. 2023; Billeci et al. 2020),而最近的综述则集中在DL技术上(例如,Jo et al. 2019; Ebrahimighahnavieh et al. 2020; Fathi et al. 2022)。其他一些综述文章考虑了影像数据(Warren and Moustafa 2023)、临床数据(Kumar et al. 2021)和预测结果(Rowe et al. 2021)等参数。尽管还有其他一些类似的综述,但它们要么只关注CAD的一种方法,要么只关注ADNI和OASIS等流行数据集中诊断数据的单一模态。它们缺乏对AD的CAD的全局视角。此外,它们也缺乏对CAD和ML的背景介绍。此外,从计算方面对未来方向的全面讨论也有所欠缺。

我们的综述与上述工作不同。为了展示AD的CAD领域的最新进展,我们从过去5年中选择了大量文章(80篇)。此外,我们根据所使用的数据集和ML技术对它们进行了分类。每项被评论工作的优点、缺点和挑战性问题也都概述了。在这方面,我们的贡献如下：

AD背景

我们对AD进行了总结,这将有助于ML领域的新手从医学角度理解CAD面临的疾病挑战。

实现细节

我们提供了深入的实现细节,以及架构和数据集特征。

最新技术的评论、讨论和比较

我们广泛地评论了最近关于AD的CAD的工作,并对正在进行的、有望让未来研究人员了解CAD相对于AD的地位的趋势进行了全面分析。

本文的其余部分组织如下。第2部分从疾病和诊断的角度详细描述了AD。此外,还介绍了几种实现工具和数据集的背景知识。第3部分回顾了解决AD的CAD挑战的最新工作。我们还介绍了每项工作的优点和缺点。此外,在第4部分中,我们通过比较各项工作的实现参数,讨论了从综述中学到的经验教训,并在第5部分中列出了一些未来需要纳入以提高AD的CAD效率的方向。最后,第6部分总结全文。

2 背景

在本节中,我们全面概述了AD。在第一小节中,我们从医学和诊断的角度讨论了这种疾病。我们还确立了早期检测的必要性。此外,在下一小节中,我们提供了AD的计算机辅助诊断的背景知识。它包括对研究人员和开发人员可用的各种数据源的描述,以及CAD中使用的不同ML模型。

2.1 阿尔茨海默病

AD是一种大脑疾病,会逐渐恶化记忆力、思维能力,最终影响日常生活的能力。研究表明,尽管AD的确切原因尚不清楚,但一些遗传、环境因素和生活方式的选择共同导致了AD的发展。大脑中异常蛋白质结构tau纽结和淀粉样斑块的积累是AD的特征之一(Karran and De Strooper 2022)。β-淀粉样蛋白片段在脑细胞外聚集并堆积形成淀粉样斑块(Horie et al. 2022)。另一方面,当tau蛋白在脑细胞内堆积时,会形成tau纽结。有一些特定的基因,如载脂蛋白E基因,被确定为发展AD的遗传决定因素(Liu et al. 2013)。心脏病、头部损伤、高血压和缺乏锻炼是与AD风险升高相关的一些环境和生活方式因素(van Praag 2018)。

由于AD影响老年人群,他们的生活方式和健康状况会逐渐恶化。此外,目前还没有治愈AD的方法。该疾病主要通过医疗服务提供者的支持性治疗来管理。因此,在早期阶段进行诊断至关重要。AD的诊断是通过检查一个人的认知和功能变化来确定的(Kim et al. 2020)。这包括对病史、认知能力和身体状况的全面检查。AD诊断的目的是评估认知障碍的存在和严重程度、症状的潜在原因,并排除可能的其他认知下降因素。诊断过程复杂,由多个步骤组成,在此过程中,医生会询问患者的症状和潜在的医疗状况。

认知和记忆测试包括蒙特利尔认知评估和简易精神状态检查(Pinto et al. 2019)。还进行神经系统检查以评估反射、肌力、协调性和神经系统功能的其他要素(Galasko et al. 1990)。使用PET和MRI等影像学检查发现与AD相关的大脑变化。虽然MRI和PET都可以识别不同的大脑区域,但它们使用不同的方法,用于特定目的。MRI主要用于识别大脑的结构异常,而PET用于识别大脑中发生的功能变化。在某些情况下,可以将两种成像技术结合使用,以提供对大脑及其功能更全面的观点。血液和尿液检查等实验室检查也用于评估整体健康状况(Coimbra et al. 2006)。

综上所述,AD的诊断是一个复杂而繁琐的过程,导致治疗策略效果不佳。为了应对这些挑战,需要一种用于早期检测的计算机机制来辅助医疗服务提供者,提高治疗过程。CAD就是这样一种辅助疾病诊断的自动化技术。对于AD而言,CAD是一种属于机器学习研究的分类策略。它将给定的数据样本分类为(i)二元分类(即对疾病呈阳性/阴性)(Tufail et al. 2020)或(ii)多标签分类(即识别疾病的不同阶段)(Altaf et al. 2018)。

AD是一种退行性疾病,患有该病的患者会经历疾病的几个阶段。尽管医学和研究界对AD的阶段数量和类型存在分歧,但通常接受四阶段分类。在第一阶段,即无痴呆(ND),也称为临床前AD,没有明显的症状。术语ND、正常状况(NC)、认知正常(CN)和健康对照(HC)可互换使用。然而,影像扫描可能检测到β-淀粉样蛋白沉积。这些沉积可以导致早期诊断,从而更好地进行临床管理(McCormick et al. 1994)。AD的第二阶段被称为非常轻度痴呆(VMD)或MCI。在这一阶段,疾病症状开始出现,但不影响患者的日常活动。在此阶段,会处方几项检查,如认知筛查测试、生物标志物识别等。这导致收集多模态数据集(Petersen 2009)。在第三阶段,即轻度痴呆(MID)期,症状突出,影响患者的日常活动。上述医学检查可能会在此处再次处方,以评估和计划疾病的临床管理。AD的最后阶段进一步分为两个子阶段,即中度(MOD)和重度痴呆。在这里,记忆完全丧失,进而导致其他症状,如沟通能力丧失、身体活动下降等(Andersen et al. 1999)。

2.2 AD的计算机辅助诊断

如前一小节所述,在早期阶段诊断AD对于疾病的有效治疗是必要的。因此,CAD在这里起着关键作用。筛查测试和诊断程序中收集的数据被CAD系统用于对疾病及其进展水平做出预测。CAD系统的核心是一个ML模型,通过在历史诊断和其他相关数据上训练模型而构建的。由于数据采集技术和机器学习领域的进步,如今CAD是强大而有效的,即使不能与人类相媲美。ML中深度学习的新兴领域为CAD系统在诊断目的方面的发展做出了重大贡献。在本小节中,我们介绍阿尔茨海默病CAD概念的基本知识(Gupta et al. 2022)。

2.2.1 CAD在AD中的应用

计算机辅助诊断系统在AD诊断中有多种应用。这里讨论其中的一些。在神经影像分析中,使用CAD可以找到PET和MRI等脑扫描中表明AD的模式和改变。自动化体积分析工具可以测量不同脑区的体积,识别随时间推移的结构变化,有助于诊断AD并监测疾病进展(Ferreira and Busatto 2011; Vinutha et al. 2019b)。在生物标志物分析中,CAD有助于检测医学图像中与AD相关的生物标志物,如淀粉样斑块和tau蛋白纽结。这有助于疾病诊断、监测和药物发现(Jack and Holtzman 2013)。

通过检查在主要症状出现之前发生的大脑形态学变化,CAD有助于AD的早期诊断。通过早期干预,可以减缓或防止疾病进展。这有助于识别高危患者(Swainson et al. 2001)。此外,为了生成针对每个人的个性化风险评估,机器学习算法可以检查医学扫描以及其他数据,如遗传和人口统计学风险因素(Patterson et al. 2008)。

2.2.2 诊断数据

由于医生为检测AD而进行的几种不同类型的诊断测试,收集了许多类型的数据。图1描述了AD的CAD中使用的各种数据类型的分类。它们描述如下:

图1 AD的计算机辅助诊断中数据类型的分类

2.2.2.1 临床数据

临床数据的参与对AD的检测至关重要。这些数据包含有关患者病史、体格检查和其他临床评估的详细信息。AD的诊断通常使用临床症状,诊断的准确性取决于提供的临床数据的质量。用于诊断AD的临床信息包括人口统计数据、病史、认知和神经心理测试以及实验室结果。这些不同类型的数据揭示了有关患者总体健康状况、认知能力和AD生物标志物存在的重要细节(Bateman et al. 2012; Vinutha et al. 2019a)。

2.2.2.2 神经影像数据

影像数据已成为AD诊断和检测的重要工具。MRI和PET是一些用于可视化AD期间大脑内部发生的解剖和功能变化的成像方式。MRI扫描提供大脑解剖结构的复杂图像,能够识别与AD相关的大脑特定区域的萎缩或收缩。PET扫描采用放射性示踪剂来评估大脑代谢,并发现tau纽结和淀粉样斑块,这是在大脑内累积的AD的两个标志。利用影像数据大大提高了CAD系统的准确性,实现了早期诊断和更好的治疗结果(Johnson et al. 2012)。

研究人员可以使用几个数据集来训练ML模型。这些数据集提供了与AD相关的诊断数据的访问。下一小节将讨论这些数据集(参见第2.2.3节)。

2.2.2.3 多模态数据

多模态数据结合了来自同一事件不同角度的数据。在CAD中,多模态是各种形式的诊断数据的集成,如遗传数据、影像数据、临床数据等。这种数据融合不仅提高了疾病检测的准确性,而且还提供了从不同类型的诊断测试中获得的宝贵见解。它还有助于建立测试之间的相关性(Kong et al. 2022)。尽管已经对设计用于AD诊断的ML模型进行了广泛的研究,但从第3.3节提供的文献综述中可以明显看出,在使用多模态数据方面仍然存在明显差距。我们在后面的章节中讨论了与多模态数据相关的挑战和未来方向。

2.2.2.4 混合数据

在多模态数据中,我们考虑了来自不同模态(即不同诊断测试)的数据,而在混合数据中,有来自同一模态的不同诊断数据的组合。例如,在神经影像诊断数据的情况下,功能MRI(fMRI)和结构MRI(sMRI)的组合被用于训练ML模型。通过这种方法,数据集的预处理起着至关重要的作用,即在这里推断出特定脑区或某些诊断数据背景在AD诊断中的作用。与多模态数据类似,尽管在这个方向上已经开展了一些工作,但仍然需要在诊断ML模型中探索混合数据。我们在未来方向部分讨论了这方面有前景的工作(参见第5节)。

2.2.3 数据库

如前一节所述,有几种类型的诊断数据可用于训练CAD系统设计和实施的ML模型。有几个数据存储库可以帮助研究人员和开发人员实施这样的系统。在下面的部分中,我们讨论了一些持有AD诊断数据的流行数据存储库。表1列出了所讨论的数据库及其描述。

表1 可用于AD诊断ML模型开发的数据存储库列表

ADNI (Jack Jr et al. 2008)

ADNI数据集包含通过现代成像技术、生物标志物和认知评估收集的纵向数据,用于检测与AD发展和进展相关的早期大脑变化。还有一个日本对应的数据集,称为J-ADNI(Iwatsubo 2010)。

OASIS (Marcus et al. 2007)

这是一个关于痴呆的神经影像学和临床数据的库。它包括来自神经影像扫描的诊断数据,例如MRI和PET图像,以及认知测试和临床评估。OASIS是一个宝贵的资源,用于探索痴呆的早期检测和诊断的研究人员。它还用于开发新的生物标志物和治疗靶点。

GEO Omnibus (Chang et al. 2017)

基因表达综合数据库(GEO)是一个基因表达信息的公共数据库。它允许研究人员存储和访问各种功能基因组数据集,例如微阵列、RNA测序和ChIP测序数据。通过搜索数据库,可以找到与特定基因、疾病或实验条件相关的数据集。除了访问原始数据外,它还提供数据分析和可视化工具,方便研究人员更轻松地探索和解释数据。

GARD (Hoskins 2022)

遗传和罕见疾病信息中心(GARD)数据库是一个集中的信息库,包含有关遗传和罕见疾病的广泛资源,供患者、家属、医疗保健从业者和研究人员使用。该数据库涵盖7000多种罕见疾病,以及有关基因检测、临床研究和治疗选择的详细信息。此外,GARD数据库还为从事罕见疾病研究和治疗的研究人员和医疗保健专业人员提供了互动和合作的平台。GARD数据库是一个宝贵的资源,用于深化对罕见疾病的现有理解,并改善受这些疾病影响的患者和家属的预后。

NACC (Beekly et al. 2004)

国家阿尔茨海默病协调中心(NACC)数据库收集了来自全美42个以上阿尔茨海默病中心的数据,包括超过47,000名参与者的信息。它包含广泛的数据,包括临床和神经心理评估、神经影像数据、遗传学数据和尸检数据,使其成为研究AD和相关痴呆的研究人员的宝贵资源。该数据库包括来自不同人群的参与者的数据,包括患有AD、MCI和HC的个人,以及来自不同种族和民族背景的个人。

除了上述数据存储库外,还有其他一些。这些包括Framingham Heart Study(2023)、Australian Imaging Biomarkers and Lifestyle(2023)、Lewy Body Dementia Center for Excellence at Stanford University(2023)、Rohrer and Rosen(2013)、UK Biobank(2023)、Alzheimer's Disease Repository Without Borders(2023)、Computer Aided Diagnosis of Dementia(2023)和minimal interval resonance imaging in Alzheimer's Disease(2023)。此外,一些大学和医院也为AD创建了自己的存储库,例如意大利莫德纳大学医院、英国牛津大学John Radcliffe医院和西班牙马德里生物医学技术中心。

2.2.4 用于AD诊断的ML模型

如前所述,在CAD中,需要确定给定的数据样本是否对疾病诊断呈阳性。这个任务是通过ML模型实现的。特别是在机器学习中,它是一个预测或分类任务。存在几种技术或模型来实现它(Vinutha et al. 2018a)。在本文中,我们采用两类分类策略来对这些模型进行分类。第一类,即传统模型,包括在该领域长期建立的ML分类算法。第二类包括较新的DL模型。图2和图3对我们在这项工作中考虑审查的不同ML模型进行了分类。

图2 过去5年中最先进的工作采用的不同传统ML模型,用于设计AD的CAD系统。

图3 过去5年中最先进的工作采用的不同DL模型,用于设计AD的CAD系统。

传统类别包括ML分类和回归模型,如支持向量机(SVM)、随机森林(RF)、k-最近邻(kNN)等。在这些模型中,特征选择起着关键作用,因此有助于识别各种生物标志物在疾病诊断中的作用。它们还有助于建立它们之间的相关性。然而,设计这样的模型是繁琐和耗时的。此外,与最先进的DL模型相比,这些模型的性能较差。虽然传统的ML模型需要手动特征选择,但DL模型可以自动完成这项任务(Vinutha et al. 2021)。它们使用多层神经网络从训练集中提取复杂特征。由于这种自动化的特征工程,DL模型已经在图像分类任务中获得了普及。对于AD,最重要的生物标志物是神经影像数据,因此DL模型是现在的首选。CAD系统在AD诊断中最常用的DL模型是卷积神经网络(CNN)、循环神经网络(RNN)、生成对抗网络(GAN)等。尽管与传统ML模型相比,DL模型的性能更优越,但它们缺乏可解释性且计算成本高昂。我们在第4节中进一步讨论这些模型在AD诊断中的适用性。

此外,研究人员和开发人员可以使用许多工具来实现CAD系统。其中一些是特定于AD的。它们用于数据准备、特征选择和提取、测试验证等任务。其中一些是FreeSurfer、Brain Voyager、BioImage Suite等。Vinutha等人在2016年和2018b年对此类工具进行了详细描述。

3 文献综述

本节回顾了近期解决AD的CAD的最新研究文章。它由三个小节组成,在第一小节中,我们概述了为从各种数据库中查找研究而进行的系统搜索。在第二小节中,我们概述了对已审查工作的分类分类法。接下来,我们在最后一小节中全面回顾了80篇论文。每项工作都根据所使用的模型、实现细节、性能、优点和缺点进行了审查。

3.1 评审协议

本次审查遵循了PRISMA(系统评价和荟萃分析的首选报告条目)框架中概述的方法学指南。相关研究的系统搜索围绕关键词,即"阿尔茨海默病检测"、"计算机辅助诊断"、"深度学习"、"神经影像学"和"多模态数据"。这项搜索是在ScienceDirect、IEEEXplore、Pubmed、Scopus和其他几个主要数据库中进行的。图4显示了改编的PRISMA方法的流程图。

图4 为我们的调查研究选择而采用的PRISMA工作流程。

为了确保标准化分析,只考虑了纳入范围内以英文发表的文章。此外,我们只考虑了过去5年发表的最新科学同行评审出版物。本次审查的出版物选择分为以下四个阶段:(i)在第一阶段,我们使用相关关键词对知名数据库进行了搜索;(ii)在第二阶段,我们通过阅读摘要排除了不相关的文章;(iii)接下来,我们通过阅读相关文章的全文,将这些工作分类到我们提出的分类法中;(iv)最后,我们通过比较最新的工作,进行了深入分析,以获得我们的见解、差距和未来方向。

初步搜索共得到120份文件,这些文件经过筛选程序。通过这一过程,确定了17份文件为重复文件,随后予以剔除。在剩余的文件中,有15份文件被认为与审查重点无关,因此被排除在外。此外,根据预先确定的资格标准,另外8份文件被排除在外。通过这一过程,我们从2018年到2023年选择了80篇最新的出版物。表2列出了检索到用于审查的文件的数据库。

表2 收集用于审查的文件的数据库

3.2 分类概述

由于深度学习和数据采集方法领域的进步,研究人员在设计和开发早期诊断系统时可以使用大量机器学习技术。过去,AD的CAD使用传统的ML模型。然而,现在的重点已转移到DL模型。同时,最新的工作也考虑了多模态数据集。我们将现有工作分为两大类。图5描述了我们对AD当前CAD技术的分类法。第一类包括用于CAD系统开发的所有传统ML模型(参见第3.3.1节),而第二类包括现代DL方法(参见第3.3.2节)。此外,这些类别中的每一个都根据用于训练模型的数据集、模型或其架构的类型,以及预处理和特征工程技术进行了再次细分。在下一小节中,我们根据此处建立的分类法对文章进行审查。

图5 AD诊断的最新CAD模型分类

3.3 最新进展回顾

在本节中,我们讨论了过去5年发表的80项关于AD的CAD的最新工作。它们根据我们先前描述的分类法进行介绍。

3.3.1 ML模型

对于AD的诊断,存在几种生物标志物。机器学习算法的特征工程任务利用这些生物标志物从训练数据中选择适当的特征。此外,这些模型在特征方面是可解释的,因此有助于疾病的生物学知识。在接下来的段落中,我们根据我们的分类法回顾实现传统ML模型的此类工作。

在一些工作中,关于人脑的信息,例如形状、体积和区域,被用作机器学习算法的特征。在Fuse et al. (2018)中,Fuse等人研究了使用脑形状信息区分健康人和AD患者的技术的有效性。形状信息是使用P型傅里叶描述符从不包括透明隔板的侧脑室区域提取的。此外,SVM模型被用于通过结合各种描述符和形状信息进行分类。在执行的分类任务中达到了87.5%的准确率。目前的研究表明,与传统的体积比相比,形状信息在诊断中更有帮助。然而,这项工作忽略了对分类和解释特征的全面分析。

同样,Mofrad et al. (2021)设计了一个基于纵向MRI检查开发认知能力下降预测模型的框架。通过其利用,有效地检测从ND到MCI以及从MCI到AD的转变。这项工作的重点是开发一个使用MRI测量的海马体形态测量的系统。所提出的方法在检测从ND到MCI以及从稳定MCI到AD的转变方面分别表现出73%和78%的准确率。这项工作的一个显著优点是其能够处理纵向数据集,适应受试者在不同时间间隔拥有不同数量扫描的情况。然而,预测从ND到MCI的转变存在固有的挑战。这主要是因为难以区分与MCI症状相关的认知能力下降和保持稳定基线认知功能的认知能力下降。这一局限性代表了所提出框架的一个重大缺陷。此外,Uysal和Ozturk(2020)提出了通过分析神经影像来早期诊断AD的ML模型。各种分类模型,包括逻辑回归(LR)、决策树(DT)、高斯朴素贝叶斯(GNB)、SVM、kNN和RF,被用于预测诊断,考虑了来自ADNI数据的性别、年龄以及左右海马体体积等因素。值得注意的是,与单个生物标志物评估相比,多个生物标志物的组合产生了更好的诊断估计。此外,研究结果强调了性别和萎缩值对诊断决策过程的影响。当考虑性别、年龄和脑区体积的组合时,kNN在AD-ND诊断组中达到了98%的最高准确率。然而,左半球特定的认知能力下降与AD之间的关系仍未得到充分解决。

Aruchamy等人(2020)开发了一种利用一阶统计特征从3D MRI扫描中检测AD的技术。它从轴向、冠状面和矢状面三个角度结合白质和灰质切片。使用主成分分析(PCA)进行特征降维。使用LR、NB、SVM和AdaBoost分类器评估算法的有效性。该方法达到了90.9%的准确率。实验结果表明,冠状面视图的白质切片产生了最高的准确率。然而,AdaBoost在矢状面视图的白质分类中的性能以及NB在使用轴向视图进行灰质分类中的性能被认为是不令人满意的。同样,Bi等人(2020)开发了一种基于MRI扫描的无监督DL方法,用于AD的诊断。该方法采用PCANet,一种无监督的CNN模型,从MRI扫描中提取关键模式。为了分类,采用了基于k-means聚类的技术。该方法利用三个正交面板(TOP，是指从三个正交方向(即矢状面、冠状面和横断面)）获取的MRI图像切片和MRI图像的单个切片作为输入数据。使用由MRI图像的TOP切片组成的输入数据可以显著提高分类准确率。具体而言,对于单个切片,它在MCI与AD分类中达到了95.52%的准确率,在NC与MCI分类中达到了90.63%的准确率。相比之下,使用TOP数据可以在NC与MCI分类中达到92.6%的准确率,在MCI与AD分类中达到97.01%的准确率。k-means方法缺乏微调以及相对较小的数据集是这项研究的局限性。

表3 基于脑形态学的最新工作总结

从上述工作可以看出,通过MRI和PET扫描捕获的人脑形态特征有助于确定与疾病的相关性。未来还需要在这个方向上进行进一步的研究,如第5节所述。表3列出了上述最新工作的总结。

此外,遗传数据在CAD中起着关键作用。在Mahendran和PM(2022)的研究中,Mahendran和Vincent提出了一个涉及DNA甲基化过程作为特征的分类模型。对于嵌入式特征选择,采用了LASSO回归、SVM、RF和AdaBoost。该模型的准确率为88.7%。当应用质量控制时,由于排除了性能较低的样本(p值>0.01),数据严重倾斜。这种方法的缺陷在于没有检查所有与AD相关的基因。同样,Vinutha等人(2020)设计了一个ML框架,通过临床数据集进行AD的功能障碍和认知评估。为了提高分类结果,使用插补方法预测研究数据集中缺失的值。采用采样方法平衡研究数据,优于不平衡的训练模型。为了保留最佳的个体特征,应用了基于遗传算法的精英技术。使用R实现了提出的框架。其最大准确率为96.06%。缺少对选定分数使用各种优化策略进行特征选择。表4总结了这些工作。

表4 基于临床诊断数据的最新工作总结

诊断扫描在疾病检测中起着同样重要的作用,早期模型主要关注MRI图像数据进行分类。Sivakani和Ansari(2020)提出了一个用于AD诊断的ML框架。ML算法用于特征选择和提取,然后在OASIS纵向数据集上进行分类。EM算法用于聚类。最佳优先搜索(BFS)用于选择特征。高斯过程算法用于对OASIS数据集进行分类,线性回归用于构建模型。ML用于特征提取,然而,DL可以产生更精确的结果。同样,Mathew等人(2018)设计了一种通过MRI扫描诊断AD的方法。概率神经网络(PNN)、SVM和kNN用于分类。大约600张图像用于训练分类器。对于PNN、kNN和SVM,训练模型的准确率分别为85%、77%和68%。主要优点是能够从MRI图像中提取多个统计特性进行深入研究,包括对比度、同质性、相关性和能量的特征。在准确性方面,作为一种DL方法,PNN的性能优于启发式ML方法,如kNN和SVM。

Sheng等人(2021)设计了一种旨在通过优化特征选择来提高AD分期分类准确率的方法。为了准备和分割结构和功能性脑MRI数据,建立了一个非人类连接组计划准备方法。借助各种ML分类器,提取在特定渐进连接过程中发生重大变化的重要网络特性集合。二元分类的平均准确率如下:(i)HC与早期MCI(EMCI)为90.5%,(ii)HC与晚期MCI(LMCI)为92%,(iii)HC与AD为95.5%,(iv)EMCI与LMCI为86.0%,(v)LMCI与AD为87.0%,(vi)EMCI与AD为88.5%。本研究考察了DT、kNN和集成方法,SVM在准确性方面始终优于它们。其主要缺陷是样本量小,导致模型欠拟合。Puente-Castro等人(2020)开发了一种使用矢状面MRI扫描自动检测AD存在的DL技术。这项工作得出两个主要结论:(i)在矢状面MRI中,可以区分AD及其阶段的影响;(ii)使用矢状面MRI的DL技术获得的结果与使用水平面MRI的最新技术相当。ResNet架构用于特征提取,而SVM用于分类。它在配备NVIDIA GPU的系统上实现。它在ADNI和OASIS数据集上分别达到78.64%和86.81%的准确率。这项研究表明,尽管使用较少,但矢状面MRI在检测早期AD方面被证明与不同平面的MRI同样有效。与OASIS相比,用于这项工作的ADNI数据集在所有可能的场景中缺乏每个阶段的足够代表性病例。表5比较了使用MRI数据作为ML模型特征的工作。

表5 基于MRI诊断数据的最新工作总结

在某些工作中,使用混合数据集来训练ML模型。来自不同扫描的特征被组合形成混合数据集。Zhang等人(2021b)提出了一个基于多模态神经影像学的AD多类框架,结合了融合技术和嵌入式特征选择。它具有三个创新特点:(i)多类铰链损失与l2,1范数正则化项相结合;(ii)建立了一个lp范数(1<p<∞)正则化项,用于有效结合每种模态的互补信息;(iii)提出了一个定理,将使用l2,1范数和lp范数最小化多类铰链损失的问题转化。SVM达到了87.45%的最高准确率。优化过程在理论上被证明收敛到全局最优。在处理大量受试者时,由于存储核矩阵需要大量存储空间,此模型遇到了重大挑战。同样,Janghel和Rathore(2021)提出了一种基于ML的方法,使用ADNI数据进行AD检测。VGG16 CNN模型用于提取特征。DT、k均值聚类、SVM和线性判别用于分类任务。对于fMRI数据集分类,获得的准确率为99.95%,而PET数据集的平均准确率为73.46%。fMRI在所有分类器中实现了最高的准确率。需要减少分类的执行时间。表6列出并比较了使用混合数据集训练ML模型的工作。

表6 基于混合数据集的最新工作总结

通过结合临床和诊断扫描数据可以获得最佳结果。这里,临床数据集与MRI或PET扫描相结合来训练ML模型。Qiu等人(2022)提出了一个ML框架,通过依次完成多个诊断过程来识别NC、MCI、AD和非AD痴呆(nADD)人群。该框架展示了多种可以接受常规收集的各种临床数据组合的模型,包括病史、人口统计学数据、功能评估和神经心理测试。它采用了RF、DT、SVM、kNN和多层感知器(MLP)等ML分类器。它在配备4个NVIDIA RTX 2080Ti GPU和Intel 3.3 GHz 14核i9处理器的系统上使用PyTorch、Matplotlib、NumPy、Pandas和SciPy实现。CNN和CatBoost的组合在分类各种认知类别方面表现出色,准确率为95%。为了最大限度地利用所有可用数据,采用了一个通用融合模型来结合来自不同来源的MRI和非成像特征。缺乏多标签分类使得无法识别同一个人共存的痴呆疾病。同样,El-Sappagh等人(2021b)评估了五种常用ML算法(LR、DT、kNN、RF和SVM)在2.5年预测范围内预测AD进展的有效性。患者的并存疾病、认知评分、用药史和人口统计学数据只是用于优化这些模型的一些具有成本效益的时间序列特征。这些模型执行ND、主观MCI(sMCI)、前驱MCI(pMCI)和AD的4类分类任务。随机森林的准确率为90.51%,优于其他ML算法。根据这些研究,当并存疾病和用药变量早期与其他特征结合时,所有模型都具有很强的预测价值,而RF模型与其他模型相比表现最准确。其他ML算法的性能相比之下并不令人满意。此外,El-Sappagh等人(2021a)开发了一个精确且易于理解的模型,用于诊断和检测AD的进展。这种方法为医生提供准确的决策以及每个决策的理由。该方法旨在完全整合高质量的阿尔茨海默病数据,以准确预测和识别从基线开始的3年内疾病进展。它采用RF和DT,在Python、scikit-learn和Eli5、SHAP中实现解释。第一层达到93.95%的准确率,第二层达到87.08%的准确率。在这项工作中,仅使用基线数据做出决策,由于AD的慢性特点,时间序列数据的分析起着至关重要的作用。表7根据使用的诊断数据的模态性比较了这些工作。

表7 基于多模态数据的最新工作总结

在某些工作中,传统的ML模型与较新的DL模型相结合,以保留特征提取步骤并提高性能准确性。Mohammed等人(2021)提出了一种利用DL诊断早期AD和痴呆的混合方法。评估了两种CNN架构(即ResNet-50和AlexNet)以及结合传统ML和DL的混合技术(如SVM+ResNet-50和SVM+AlexNet)的性能。使用t-SNE将高维数据转换为低维空间进行表示和可视化。SVM+AlexNet模型产生94.8%的最高准确率。混合ML和DL的算法实现了优于DL的更好结果是一个主要优势。但训练模型非常耗时。同样,Abuhmed等人(2021)设计并测试了两种用于AD检测的混合DL架构。多个深度BiLSTM模型组合构建模型。第一个架构是多任务回归模型,第二个模型是利用BiLSTM模型提取深度特征的混合架构。它使用Python和Keras在配备Intel Xenon(R)CPU、3个GeForce GTX TITANX 12GB GPU的系统上实现,具有CUDA 10.0,准确率达到82.63%。为了提高模型的性能,DL模型输出层被替换为更精确的分类器,如RF。没有研究微调建议模型的影响和分析模型的运行时间复杂性。

此外,Khagi等人(2019)提出了一种DNN架构,该架构使用深层特征提取,无需大量硬件资源训练或分类错误。受Alexnet启发的CNN用于从通过从全脑MRI扫描中提取切片获得的图像中自动提取特征。使用Laplacian、ReliefF、Mutinffs等特征排序算法选择特征。在各种条件下测试SVM、kNN和Subspace Ensemble等ML算法。它实现了98%到99%的分类准确率。由于训练资源集较少,CNN并非最优。在同一方向上,Song等人(2019)开发并评估了一个多类图CNN(GCNN)分类器。它用于根据网络分析将AD谱上的患者分为四个不同的类别:ND、EMCI、LMCI和AD。从扩散张量成像数据获得的结构化连接图用于训练和评估网络。在使用NVIDIA 1080 Ti GPU的Thinkmate VSX R5 540V4工作站上的Caffe平台上实现时,它达到89%的准确率。该模型表明,GCNN优于SVM分类器,即使在小样本量下也能取得很好的性能。

同样,AlSaeed和Omar(2022)开发了一种使用ResNet50预训练CNN模型从MRI图像诊断AD的方法。其主要目的是通过利用DL技术分析和增强MRI图像分类性能,以早期检测AD。使用ResNet-50评估性能。使用SVM、RF和softmax提取特征进行分类任务。它在Google Collaboratory平台上使用TensorFlow、Keras、scikit-learn、NumPy、OpenCV、NiBabel(2023)、Nilearn(2023)和DeepBrain AI - Best AI Video Generator(2023)实现。当使用ADNI数据训练模型时,模型在准确性方面表现良好,优于在MIRIAD数据集上训练的模型。当ResNet50分别与softmax、SVM和RF组合时,获得99%、92%和85.7%的准确率。与RF组合时,准确率较低。表8总结了与较新的DL模型相结合的传统ML模型。

表8 基于与DL模型相结合的传统ML模型的最新工作总结

从上述工作概述中可以看出,传统ML模型依赖于训练数据的特征。尽管这些模型是可解释的,但它们缺乏现代方法的计算效率。下一节将讨论这种较新的ML模型。