阿尔茨海默病在老年人群中大约每9人中就有1人患病。作为一种神经退行性疾病,迄今为止仍无法治愈,主要通过医疗服务提供者的支持性治疗来管理病情。因此,该病的早期诊断是制定治疗方案的关键步骤。目前已有多种诊断程序,包括临床检查、扫描、生物医学检测、心理测评等。计算机辅助诊断技术有助于该病的早期发现,过去已经提出了多种此类机制。这些技术利用机器学习模型来开发疾病分类系统。但是,这些系统的重点现在已经逐渐转移到了更新的深度学习模型上。本文旨在全面回顾过去5年中该领域的最新技术,为该领域的新手研究者提供早期诊断系统开发所需的各种工具和数据集的基本概述。我们讨论了探索生物标志物、识别和提取相关特征、传统机器学习与深度学习模型之间的权衡,以及多模态数据集的重要性。这使医学和工程领域的研究人员和开发人员能够应对已发现的问题,开发出有效的阿尔茨海默病诊断系统。本文发表在Artificial Intelligence Review杂志。由于篇幅较长,将分两章进行介绍,感谢帮转支持。 1 引言 计算机辅助诊断(CAD)系统可以帮助医疗服务提供者识别、检测和诊断人体内的特定疾病(Gendy and Yuce 2023)。当今,由于生物医学工程、数据采集技术和数据分析领域的进步,CAD系统几乎应用于医学科学的所有领域(Amorim et al. 2023)。神经退行性疾病是一类以大脑和中枢神经系统神经元细胞功能丧失为特征的疾病。阿尔茨海默病(AD)就是这样一种在全世界影响大量人口的进行性神经退行性疾病(Knopman et al. 2021)。AD发生在老年人群中,导致长期记忆力丧失、认知障碍、行为不一致以及其他一些症状。AD是一种痴呆类型,指由于大脑内嗅皮层和海马区功能失调,认知能力逐渐或持续下降的病症,尤其影响记忆力和抽象思维能力(Strikwerda-Brown et al. 2019)。这些大脑影响可能在症状首次出现前十年或更早开始(Yu et al. 2021a),这一阶段被称为轻度认知障碍(MCI)(Garg et al. 2023)。 AD在老年人群中大约每9人中就有1人患病(Spetz and Flatt 2023)。由于该疾病的退行性特点,治疗AD是一项具有挑战性的任务,只能通过临床管理来解决。因此,在早期阶段(即MCI阶段)诊断AD可以更好地治疗该疾病(Porsteinsson et al. 2021)。通过CAD技术的辅助,AD的早期检测如今已变得更加高效和可靠。正电子发射断层扫描(PET)和磁共振成像(MRI)等神经影像技术的进步,再加上新的机器学习(ML)技术,为CAD方法做出了贡献(Ghazal and Issa 2022)。目前,在公开影像研究系列(OASIS)和阿尔茨海默病神经影像学计划(ADNI)等各种来源中都有几个诊断数据集可用,其中包括人口统计学、影像学、临床和遗传学等患者健康记录。这些数据集目前正被研究人员、学者和工业界用于开发用于CAD(计算机辅助诊断)的ML技术(El-Sappagh et al. 2021a)。过去,已经发表了几篇关于AD的CAD的综述。它们回顾了不同方法的工作。 其中一些考虑了不同的ML技术对AD阶段进行分类(例如,Grueso and Viejo-Sobera 2021; Zhao et al. 2023; Billeci et al. 2020),而最近的综述则集中在DL技术上(例如,Jo et al. 2019; Ebrahimighahnavieh et al. 2020; Fathi et al. 2022)。其他一些综述文章考虑了影像数据(Warren and Moustafa 2023)、临床数据(Kumar et al. 2021)和预测结果(Rowe et al. 2021)等参数。尽管还有其他一些类似的综述,但它们要么只关注CAD的一种方法,要么只关注ADNI和OASIS等流行数据集中诊断数据的单一模态。它们缺乏对AD的CAD的全局视角。此外,它们也缺乏对CAD和ML的背景介绍。此外,从计算方面对未来方向的全面讨论也有所欠缺。 我们的综述与上述工作不同。为了展示AD的CAD领域的最新进展,我们从过去5年中选择了大量文章(80篇)。此外,我们根据所使用的数据集和ML技术对它们进行了分类。每项被评论工作的优点、缺点和挑战性问题也都概述了。在这方面,我们的贡献如下: AD背景 我们对AD进行了总结,这将有助于ML领域的新手从医学角度理解CAD面临的疾病挑战。 实现细节 我们提供了深入的实现细节,以及架构和数据集特征。 最新技术的评论、讨论和比较 我们广泛地评论了最近关于AD的CAD的工作,并对正在进行的、有望让未来研究人员了解CAD相对于AD的地位的趋势进行了全面分析。 本文的其余部分组织如下。第2部分从疾病和诊断的角度详细描述了AD。此外,还介绍了几种实现工具和数据集的背景知识。第3部分回顾了解决AD的CAD挑战的最新工作。我们还介绍了每项工作的优点和缺点。此外,在第4部分中,我们通过比较各项工作的实现参数,讨论了从综述中学到的经验教训,并在第5部分中列出了一些未来需要纳入以提高AD的CAD效率的方向。最后,第6部分总结全文。 2 背景 在本节中,我们全面概述了AD。在第一小节中,我们从医学和诊断的角度讨论了这种疾病。我们还确立了早期检测的必要性。此外,在下一小节中,我们提供了AD的计算机辅助诊断的背景知识。它包括对研究人员和开发人员可用的各种数据源的描述,以及CAD中使用的不同ML模型。 2.1 阿尔茨海默病 AD是一种大脑疾病,会逐渐恶化记忆力、思维能力,最终影响日常生活的能力。研究表明,尽管AD的确切原因尚不清楚,但一些遗传、环境因素和生活方式的选择共同导致了AD的发展。大脑中异常蛋白质结构tau纽结和淀粉样斑块的积累是AD的特征之一(Karran and De Strooper 2022)。β-淀粉样蛋白片段在脑细胞外聚集并堆积形成淀粉样斑块(Horie et al. 2022)。另一方面,当tau蛋白在脑细胞内堆积时,会形成tau纽结。有一些特定的基因,如载脂蛋白E基因,被确定为发展AD的遗传决定因素(Liu et al. 2013)。心脏病、头部损伤、高血压和缺乏锻炼是与AD风险升高相关的一些环境和生活方式因素(van Praag 2018)。 由于AD影响老年人群,他们的生活方式和健康状况会逐渐恶化。此外,目前还没有治愈AD的方法。该疾病主要通过医疗服务提供者的支持性治疗来管理。因此,在早期阶段进行诊断至关重要。AD的诊断是通过检查一个人的认知和功能变化来确定的(Kim et al. 2020)。这包括对病史、认知能力和身体状况的全面检查。AD诊断的目的是评估认知障碍的存在和严重程度、症状的潜在原因,并排除可能的其他认知下降因素。诊断过程复杂,由多个步骤组成,在此过程中,医生会询问患者的症状和潜在的医疗状况。 认知和记忆测试包括蒙特利尔认知评估和简易精神状态检查(Pinto et al. 2019)。还进行神经系统检查以评估反射、肌力、协调性和神经系统功能的其他要素(Galasko et al. 1990)。使用PET和MRI等影像学检查发现与AD相关的大脑变化。虽然MRI和PET都可以识别不同的大脑区域,但它们使用不同的方法,用于特定目的。MRI主要用于识别大脑的结构异常,而PET用于识别大脑中发生的功能变化。在某些情况下,可以将两种成像技术结合使用,以提供对大脑及其功能更全面的观点。血液和尿液检查等实验室检查也用于评估整体健康状况(Coimbra et al. 2006)。 综上所述,AD的诊断是一个复杂而繁琐的过程,导致治疗策略效果不佳。为了应对这些挑战,需要一种用于早期检测的计算机机制来辅助医疗服务提供者,提高治疗过程。CAD就是这样一种辅助疾病诊断的自动化技术。对于AD而言,CAD是一种属于机器学习研究的分类策略。它将给定的数据样本分类为(i)二元分类(即对疾病呈阳性/阴性)(Tufail et al. 2020)或(ii)多标签分类(即识别疾病的不同阶段)(Altaf et al. 2018)。 AD是一种退行性疾病,患有该病的患者会经历疾病的几个阶段。尽管医学和研究界对AD的阶段数量和类型存在分歧,但通常接受四阶段分类。在第一阶段,即无痴呆(ND),也称为临床前AD,没有明显的症状。术语ND、正常状况(NC)、认知正常(CN)和健康对照(HC)可互换使用。然而,影像扫描可能检测到β-淀粉样蛋白沉积。这些沉积可以导致早期诊断,从而更好地进行临床管理(McCormick et al. 1994)。AD的第二阶段被称为非常轻度痴呆(VMD)或MCI。在这一阶段,疾病症状开始出现,但不影响患者的日常活动。在此阶段,会处方几项检查,如认知筛查测试、生物标志物识别等。这导致收集多模态数据集(Petersen 2009)。在第三阶段,即轻度痴呆(MID)期,症状突出,影响患者的日常活动。上述医学检查可能会在此处再次处方,以评估和计划疾病的临床管理。AD的最后阶段进一步分为两个子阶段,即中度(MOD)和重度痴呆。在这里,记忆完全丧失,进而导致其他症状,如沟通能力丧失、身体活动下降等(Andersen et al. 1999)。 2.2 AD的计算机辅助诊断 如前一小节所述,在早期阶段诊断AD对于疾病的有效治疗是必要的。因此,CAD在这里起着关键作用。筛查测试和诊断程序中收集的数据被CAD系统用于对疾病及其进展水平做出预测。CAD系统的核心是一个ML模型,通过在历史诊断和其他相关数据上训练模型而构建的。由于数据采集技术和机器学习领域的进步,如今CAD是强大而有效的,即使不能与人类相媲美。ML中深度学习的新兴领域为CAD系统在诊断目的方面的发展做出了重大贡献。在本小节中,我们介绍阿尔茨海默病CAD概念的基本知识(Gupta et al. 2022)。 2.2.1 CAD在AD中的应用 计算机辅助诊断系统在AD诊断中有多种应用。这里讨论其中的一些。在神经影像分析中,使用CAD可以找到PET和MRI等脑扫描中表明AD的模式和改变。自动化体积分析工具可以测量不同脑区的体积,识别随时间推移的结构变化,有助于诊断AD并监测疾病进展(Ferreira and Busatto 2011; Vinutha et al. 2019b)。在生物标志物分析中,CAD有助于检测医学图像中与AD相关的生物标志物,如淀粉样斑块和tau蛋白纽结。这有助于疾病诊断、监测和药物发现(Jack and Holtzman 2013)。 通过检查在主要症状出现之前发生的大脑形态学变化,CAD有助于AD的早期诊断。通过早期干预,可以减缓或防止疾病进展。这有助于识别高危患者(Swainson et al. 2001)。此外,为了生成针对每个人的个性化风险评估,机器学习算法可以检查医学扫描以及其他数据,如遗传和人口统计学风险因素(Patterson et al. 2008)。 2.2.2 诊断数据 由于医生为检测AD而进行的几种不同类型的诊断测试,收集了许多类型的数据。图1描述了AD的CAD中使用的各种数据类型的分类。它们描述如下: 图1 AD的计算机辅助诊断中数据类型的分类 2.2.2.1 临床数据 临床数据的参与对AD的检测至关重要。这些数据包含有关患者病史、体格检查和其他临床评估的详细信息。AD的诊断通常使用临床症状,诊断的准确性取决于提供的临床数据的质量。用于诊断AD的临床信息包括人口统计数据、病史、认知和神经心理测试以及实验室结果。这些不同类型的数据揭示了有关患者总体健康状况、认知能力和AD生物标志物存在的重要细节(Bateman et al. 2012; Vinutha et al. 2019a)。 2.2.2.2 神经影像数据 影像数据已成为AD诊断和检测的重要工具。MRI和PET是一些用于可视化AD期间大脑内部发生的解剖和功能变化的成像方式。MRI扫描提供大脑解剖结构的复杂图像,能够识别与AD相关的大脑特定区域的萎缩或收缩。PET扫描采用放射性示踪剂来评估大脑代谢,并发现tau纽结和淀粉样斑块,这是在大脑内累积的AD的两个标志。利用影像数据大大提高了CAD系统的准确性,实现了早期诊断和更好的治疗结果(Johnson et al. 2012)。 研究人员可以使用几个数据集来训练ML模型。这些数据集提供了与AD相关的诊断数据的访问。下一小节将讨论这些数据集(参见第2.2.3节)。 2.2.2.3 多模态数据 多模态数据结合了来自同一事件不同角度的数据。在CAD中,多模态是各种形式的诊断数据的集成,如遗传数据、影像数据、临床数据等。这种数据融合不仅提高了疾病检测的准确性,而且还提供了从不同类型的诊断测试中获得的宝贵见解。它还有助于建立测试之间的相关性(Kong et al. 2022)。尽管已经对设计用于AD诊断的ML模型进行了广泛的研究,但从第3.3节提供的文献综述中可以明显看出,在使用多模态数据方面仍然存在明显差距。我们在后面的章节中讨论了与多模态数据相关的挑战和未来方向。 2.2.2.4 混合数据 在多模态数据中,我们考虑了来自不同模态(即不同诊断测试)的数据,而在混合数据中,有来自同一模态的不同诊断数据的组合。例如,在神经影像诊断数据的情况下,功能MRI(fMRI)和结构MRI(sMRI)的组合被用于训练ML模型。通过这种方法,数据集的预处理起着至关重要的作用,即在这里推断出特定脑区或某些诊断数据背景在AD诊断中的作用。与多模态数据类似,尽管在这个方向上已经开展了一些工作,但仍然需要在诊断ML模型中探索混合数据。我们在未来方向部分讨论了这方面有前景的工作(参见第5节)。 2.2.3 数据库 如前一节所述,有几种类型的诊断数据可用于训练CAD系统设计和实施的ML模型。有几个数据存储库可以帮助研究人员和开发人员实施这样的系统。在下面的部分中,我们讨论了一些持有AD诊断数据的流行数据存储库。表1列出了所讨论的数据库及其描述。 ADNI (Jack Jr et al. 2008) ADNI数据集包含通过现代成像技术、生物标志物和认知评估收集的纵向数据,用于检测与AD发展和进展相关的早期大脑变化。还有一个日本对应的数据集,称为J-ADNI(Iwatsubo 2010)。 OASIS (Marcus et al. 2007) 这是一个关于痴呆的神经影像学和临床数据的库。它包括来自神经影像扫描的诊断数据,例如MRI和PET图像,以及认知测试和临床评估。OASIS是一个宝贵的资源,用于探索痴呆的早期检测和诊断的研究人员。它还用于开发新的生物标志物和治疗靶点。 GEO Omnibus (Chang et al. 2017) 基因表达综合数据库(GEO)是一个基因表达信息的公共数据库。它允许研究人员存储和访问各种功能基因组数据集,例如微阵列、RNA测序和ChIP测序数据。通过搜索数据库,可以找到与特定基因、疾病或实验条件相关的数据集。除了访问原始数据外,它还提供数据分析和可视化工具,方便研究人员更轻松地探索和解释数据。 GARD (Hoskins 2022) 遗传和罕见疾病信息中心(GARD)数据库是一个集中的信息库,包含有关遗传和罕见疾病的广泛资源,供患者、家属、医疗保健从业者和研究人员使用。该数据库涵盖7000多种罕见疾病,以及有关基因检测、临床研究和治疗选择的详细信息。此外,GARD数据库还为从事罕见疾病研究和治疗的研究人员和医疗保健专业人员提供了互动和合作的平台。GARD数据库是一个宝贵的资源,用于深化对罕见疾病的现有理解,并改善受这些疾病影响的患者和家属的预后。 NACC (Beekly et al. 2004) 国家阿尔茨海默病协调中心(NACC)数据库收集了来自全美42个以上阿尔茨海默病中心的数据,包括超过47,000名参与者的信息。它包含广泛的数据,包括临床和神经心理评估、神经影像数据、遗传学数据和尸检数据,使其成为研究AD和相关痴呆的研究人员的宝贵资源。该数据库包括来自不同人群的参与者的数据,包括患有AD、MCI和HC的个人,以及来自不同种族和民族背景的个人。 除了上述数据存储库外,还有其他一些。这些包括Framingham Heart Study(2023)、Australian Imaging Biomarkers and Lifestyle(2023)、Lewy Body Dementia Center for Excellence at Stanford University(2023)、Rohrer and Rosen(2013)、UK Biobank(2023)、Alzheimer's Disease Repository Without Borders(2023)、Computer Aided Diagnosis of Dementia(2023)和minimal interval resonance imaging in Alzheimer's Disease(2023)。此外,一些大学和医院也为AD创建了自己的存储库,例如意大利莫德纳大学医院、英国牛津大学John Radcliffe医院和西班牙马德里生物医学技术中心。 2.2.4 用于AD诊断的ML模型 如前所述,在CAD中,需要确定给定的数据样本是否对疾病诊断呈阳性。这个任务是通过ML模型实现的。特别是在机器学习中,它是一个预测或分类任务。存在几种技术或模型来实现它(Vinutha et al. 2018a)。在本文中,我们采用两类分类策略来对这些模型进行分类。第一类,即传统模型,包括在该领域长期建立的ML分类算法。第二类包括较新的DL模型。图2和图3对我们在这项工作中考虑审查的不同ML模型进行了分类。 传统类别包括ML分类和回归模型,如支持向量机(SVM)、随机森林(RF)、k-最近邻(kNN)等。在这些模型中,特征选择起着关键作用,因此有助于识别各种生物标志物在疾病诊断中的作用。它们还有助于建立它们之间的相关性。然而,设计这样的模型是繁琐和耗时的。此外,与最先进的DL模型相比,这些模型的性能较差。虽然传统的ML模型需要手动特征选择,但DL模型可以自动完成这项任务(Vinutha et al. 2021)。它们使用多层神经网络从训练集中提取复杂特征。由于这种自动化的特征工程,DL模型已经在图像分类任务中获得了普及。对于AD,最重要的生物标志物是神经影像数据,因此DL模型是现在的首选。CAD系统在AD诊断中最常用的DL模型是卷积神经网络(CNN)、循环神经网络(RNN)、生成对抗网络(GAN)等。尽管与传统ML模型相比,DL模型的性能更优越,但它们缺乏可解释性且计算成本高昂。我们在第4节中进一步讨论这些模型在AD诊断中的适用性。 此外,研究人员和开发人员可以使用许多工具来实现CAD系统。其中一些是特定于AD的。它们用于数据准备、特征选择和提取、测试验证等任务。其中一些是FreeSurfer、Brain Voyager、BioImage Suite等。Vinutha等人在2016年和2018b年对此类工具进行了详细描述。 3 文献综述 本节回顾了近期解决AD的CAD的最新研究文章。它由三个小节组成,在第一小节中,我们概述了为从各种数据库中查找研究而进行的系统搜索。在第二小节中,我们概述了对已审查工作的分类分类法。接下来,我们在最后一小节中全面回顾了80篇论文。每项工作都根据所使用的模型、实现细节、性能、优点和缺点进行了审查。 3.1 评审协议 本次审查遵循了PRISMA(系统评价和荟萃分析的首选报告条目)框架中概述的方法学指南。相关研究的系统搜索围绕关键词,即"阿尔茨海默病检测"、"计算机辅助诊断"、"深度学习"、"神经影像学"和"多模态数据"。这项搜索是在ScienceDirect、IEEEXplore、Pubmed、Scopus和其他几个主要数据库中进行的。图4显示了改编的PRISMA方法的流程图。 图4 为我们的调查研究选择而采用的PRISMA工作流程。 为了确保标准化分析,只考虑了纳入范围内以英文发表的文章。此外,我们只考虑了过去5年发表的最新科学同行评审出版物。本次审查的出版物选择分为以下四个阶段:(i)在第一阶段,我们使用相关关键词对知名数据库进行了搜索;(ii)在第二阶段,我们通过阅读摘要排除了不相关的文章;(iii)接下来,我们通过阅读相关文章的全文,将这些工作分类到我们提出的分类法中;(iv)最后,我们通过比较最新的工作,进行了深入分析,以获得我们的见解、差距和未来方向。 初步搜索共得到120份文件,这些文件经过筛选程序。通过这一过程,确定了17份文件为重复文件,随后予以剔除。在剩余的文件中,有15份文件被认为与审查重点无关,因此被排除在外。此外,根据预先确定的资格标准,另外8份文件被排除在外。通过这一过程,我们从2018年到2023年选择了80篇最新的出版物。表2列出了检索到用于审查的文件的数据库。 3.2 分类概述 由于深度学习和数据采集方法领域的进步,研究人员在设计和开发早期诊断系统时可以使用大量机器学习技术。过去,AD的CAD使用传统的ML模型。然而,现在的重点已转移到DL模型。同时,最新的工作也考虑了多模态数据集。我们将现有工作分为两大类。图5描述了我们对AD当前CAD技术的分类法。第一类包括用于CAD系统开发的所有传统ML模型(参见第3.3.1节),而第二类包括现代DL方法(参见第3.3.2节)。此外,这些类别中的每一个都根据用于训练模型的数据集、模型或其架构的类型,以及预处理和特征工程技术进行了再次细分。在下一小节中,我们根据此处建立的分类法对文章进行审查。 3.3 最新进展回顾 在本节中,我们讨论了过去5年发表的80项关于AD的CAD的最新工作。它们根据我们先前描述的分类法进行介绍。 3.3.1 ML模型 对于AD的诊断,存在几种生物标志物。机器学习算法的特征工程任务利用这些生物标志物从训练数据中选择适当的特征。此外,这些模型在特征方面是可解释的,因此有助于疾病的生物学知识。在接下来的段落中,我们根据我们的分类法回顾实现传统ML模型的此类工作。 在一些工作中,关于人脑的信息,例如形状、体积和区域,被用作机器学习算法的特征。在Fuse et al. (2018)中,Fuse等人研究了使用脑形状信息区分健康人和AD患者的技术的有效性。形状信息是使用P型傅里叶描述符从不包括透明隔板的侧脑室区域提取的。此外,SVM模型被用于通过结合各种描述符和形状信息进行分类。在执行的分类任务中达到了87.5%的准确率。目前的研究表明,与传统的体积比相比,形状信息在诊断中更有帮助。然而,这项工作忽略了对分类和解释特征的全面分析。 同样,Mofrad et al. (2021)设计了一个基于纵向MRI检查开发认知能力下降预测模型的框架。通过其利用,有效地检测从ND到MCI以及从MCI到AD的转变。这项工作的重点是开发一个使用MRI测量的海马体形态测量的系统。所提出的方法在检测从ND到MCI以及从稳定MCI到AD的转变方面分别表现出73%和78%的准确率。这项工作的一个显著优点是其能够处理纵向数据集,适应受试者在不同时间间隔拥有不同数量扫描的情况。然而,预测从ND到MCI的转变存在固有的挑战。这主要是因为难以区分与MCI症状相关的认知能力下降和保持稳定基线认知功能的认知能力下降。这一局限性代表了所提出框架的一个重大缺陷。此外,Uysal和Ozturk(2020)提出了通过分析神经影像来早期诊断AD的ML模型。各种分类模型,包括逻辑回归(LR)、决策树(DT)、高斯朴素贝叶斯(GNB)、SVM、kNN和RF,被用于预测诊断,考虑了来自ADNI数据的性别、年龄以及左右海马体体积等因素。值得注意的是,与单个生物标志物评估相比,多个生物标志物的组合产生了更好的诊断估计。此外,研究结果强调了性别和萎缩值对诊断决策过程的影响。当考虑性别、年龄和脑区体积的组合时,kNN在AD-ND诊断组中达到了98%的最高准确率。然而,左半球特定的认知能力下降与AD之间的关系仍未得到充分解决。 Aruchamy等人(2020)开发了一种利用一阶统计特征从3D MRI扫描中检测AD的技术。它从轴向、冠状面和矢状面三个角度结合白质和灰质切片。使用主成分分析(PCA)进行特征降维。使用LR、NB、SVM和AdaBoost分类器评估算法的有效性。该方法达到了90.9%的准确率。实验结果表明,冠状面视图的白质切片产生了最高的准确率。然而,AdaBoost在矢状面视图的白质分类中的性能以及NB在使用轴向视图进行灰质分类中的性能被认为是不令人满意的。同样,Bi等人(2020)开发了一种基于MRI扫描的无监督DL方法,用于AD的诊断。该方法采用PCANet,一种无监督的CNN模型,从MRI扫描中提取关键模式。为了分类,采用了基于k-means聚类的技术。该方法利用三个正交面板(TOP,是指从三个正交方向(即矢状面、冠状面和横断面))获取的MRI图像切片和MRI图像的单个切片作为输入数据。使用由MRI图像的TOP切片组成的输入数据可以显著提高分类准确率。具体而言,对于单个切片,它在MCI与AD分类中达到了95.52%的准确率,在NC与MCI分类中达到了90.63%的准确率。相比之下,使用TOP数据可以在NC与MCI分类中达到92.6%的准确率,在MCI与AD分类中达到97.01%的准确率。k-means方法缺乏微调以及相对较小的数据集是这项研究的局限性。 Sheng等人(2021)设计了一种旨在通过优化特征选择来提高AD分期分类准确率的方法。为了准备和分割结构和功能性脑MRI数据,建立了一个非人类连接组计划准备方法。借助各种ML分类器,提取在特定渐进连接过程中发生重大变化的重要网络特性集合。二元分类的平均准确率如下:(i)HC与早期MCI(EMCI)为90.5%,(ii)HC与晚期MCI(LMCI)为92%,(iii)HC与AD为95.5%,(iv)EMCI与LMCI为86.0%,(v)LMCI与AD为87.0%,(vi)EMCI与AD为88.5%。本研究考察了DT、kNN和集成方法,SVM在准确性方面始终优于它们。其主要缺陷是样本量小,导致模型欠拟合。Puente-Castro等人(2020)开发了一种使用矢状面MRI扫描自动检测AD存在的DL技术。这项工作得出两个主要结论:(i)在矢状面MRI中,可以区分AD及其阶段的影响;(ii)使用矢状面MRI的DL技术获得的结果与使用水平面MRI的最新技术相当。ResNet架构用于特征提取,而SVM用于分类。它在配备NVIDIA GPU的系统上实现。它在ADNI和OASIS数据集上分别达到78.64%和86.81%的准确率。这项研究表明,尽管使用较少,但矢状面MRI在检测早期AD方面被证明与不同平面的MRI同样有效。与OASIS相比,用于这项工作的ADNI数据集在所有可能的场景中缺乏每个阶段的足够代表性病例。表5比较了使用MRI数据作为ML模型特征的工作。 在某些工作中,使用混合数据集来训练ML模型。来自不同扫描的特征被组合形成混合数据集。Zhang等人(2021b)提出了一个基于多模态神经影像学的AD多类框架,结合了融合技术和嵌入式特征选择。它具有三个创新特点:(i)多类铰链损失与l2,1范数正则化项相结合;(ii)建立了一个lp范数(1<p<∞)正则化项,用于有效结合每种模态的互补信息;(iii)提出了一个定理,将使用l2,1范数和lp范数最小化多类铰链损失的问题转化。SVM达到了87.45%的最高准确率。优化过程在理论上被证明收敛到全局最优。在处理大量受试者时,由于存储核矩阵需要大量存储空间,此模型遇到了重大挑战。同样,Janghel和Rathore(2021)提出了一种基于ML的方法,使用ADNI数据进行AD检测。VGG16 CNN模型用于提取特征。DT、k均值聚类、SVM和线性判别用于分类任务。对于fMRI数据集分类,获得的准确率为99.95%,而PET数据集的平均准确率为73.46%。fMRI在所有分类器中实现了最高的准确率。需要减少分类的执行时间。表6列出并比较了使用混合数据集训练ML模型的工作。 表8 基于与DL模型相结合的传统ML模型的最新工作总结 |
|