分享

解码自闭症-fMRI研究中机器学习方法的综合综述

 脑机接口社区 2023-07-30 发布于北京

这篇论文提供了一个全面的回顾,总结了自2011年以来,应用机器学习方法在自闭症谱系障碍研究中的主要发现和进展,特别强调了深度学习方法以及多站点数据集的重要性和应用前景。

fMRI(功能磁共振成像)是一种运用磁共振成像技术来测量和记录大脑中的血流变化,并据此推断大脑的活动状态的技术。这种技术基于一个假设,即大脑的神经活动和血流量有关。换句话说,当大脑中的某个区域变得更加活跃时,血流量会相应地增加。通过测量这种血流变化,我们可以获取到这个区域神经活动的信息。

fMRI主要用于研究人脑的功能定位,即研究大脑的哪一部分对特定的感知、行为或认知任务起作用。比如说,当我们阅读、听音乐或者思考问题时,fMRI可以描绘出大脑中的哪些区域被激活,从而为我们了解大脑如何处理这些任务提供帮助。fMRI也可以用于临床诊断,包括研究脑部疾病如阿兹海默症、帕金森病等的影响,以及用于术前脑部映射以规划手术策略等。

fMRI的一种常见类型是BOLD-fMRI(基于血氧水平依赖的功能磁共振成像)。这种类型的fMRI检测的是血液中脱氧血红蛋白和氧合血红蛋白的相对含量。血红蛋白是一种存在于我们血液中的蛋白质,它的主要功能是携带氧气。当血红蛋白与氧气结合时,我们称其为氧合血红蛋白(oxyhemoglobin),而当血红蛋白与氧气脱离时,我们称其为脱氧血红蛋白(deoxyhemoglobin)。不同的是,脱氧血红蛋白具有磁性,而氧合血红蛋白则几乎不具磁性。

MRI是一种使用强大的磁场和无线电波来生成人体内部图像的技术。在强磁场中,身体的某些原子会被激发并发出信号,这些信号可以被检测并转换成图像。特别地,MRI对磁性物质非常敏感,因此能够检测到脱氧血红蛋白和氧合血红蛋白的差异。

当我们的大脑活动时,活动的区域需要更多的能量,所以血流会增加以提供更多的氧和营养。这导致该区域的血液中氧合血红蛋白的比例增加,而脱氧血红蛋白的比例减少。因为氧合血红蛋白和脱氧血红蛋白在磁性上的差异,所以这种改变可以改变MRI信号,使得活动的大脑区域在MRI图像上“亮”起来。这就是fMRI(功能磁共振成像)能够映射大脑活动的原理。当某个大脑区域被激活时,那里的血液会因为增加的氧合血红蛋白而变得更"亮",这种变化可以被MRI设备检测到。

使用fMRI数据和机器学习研究ASD的一般过程(以FC特征为例)

虽然fMRI是一项非常强大的工具,但它也有一些局限性。例如,fMRI不能直接测量神经元的活动,而只能测量血流变化;此外,fMRI的时间分辨率也相对较低,它只能捕捉到几秒钟的大脑活动变化。然而,尽管有这些局限性,fMRI仍然是当前神经科学研究中的重要工具,并且在许多研究和临床应用中都发挥了关键作用。

在分析相关文献时,可以明显看到,fMRI数据主要来自三种来源:自我采集数据、合作机构数据和公开可用的数据库。自我采集数据和合作机构数据通常来自同一站点,采集参数相同。值得注意的是,所有涉及的基于任务的fMRI数据都来自前两种数据源。

被广泛知名的大型公开可用数据库是自闭症大脑成像数据交换(Autism Brain Imaging Data Exchange,简称ABIDE)数据库。ABIDE数据库的数据来自北美和欧洲的不同站点,这无可避免地在数据集中引入了异质性,这种异质性主要体现在fMRI扫描仪、数据收集协议和参与人口之间的差异。近年来,跨多个神经成像站点的数据聚合已经变得流行。

图1
考虑到分享和组合基于任务的fMRI数据比静息态fMRI数据具有更大的挑战,大型公开可用的数据库主要是静息态fMRI数据。尽管如此,人们已经做出了一些努力,为基于任务的fMRI数据建立了一个开放的存储库,例如Open fMRI数据库。

大型数据库的优点是它包含的可用数据比前两种数据源更多,可以满足更多研究人员对大型数据库分析的需求。为了实现从fMRI数据分类中提取出自动化诊断工具的最终目标,大型数据库对于进一步的泛化是必不可少的。不幸的是,来自不同站点的大型数据库的分类比来自同一站点的小型数据库更具挑战性。尽管存在上述挑战,但在ASD的研究中,公开可用的数据库越来越受到关注。值得注意的是,在本文所有列出的文献中,有70%的文献采用了公开可用的数据库。

图2

在进行神经科学研究或者其它科学实验的时候,实验通常包括两组或者多组参与者。在这里,一组是自闭症个体,另一组(即"Typical Controls")是普通(非自闭症)的人。

"Typical Controls"的目的是为了提供一个参照标准,以便研究者能更好地理解自闭症个体的fMRI数据有何特殊之处。比如,研究者可以比较这两组人在执行相同任务时的大脑活动差异,或者比较他们在静息状态下的大脑活动模式的差异。这样,研究者就可以得出结论,指出自闭症个体与普通人在大脑活动上的差异,以及这些差异可能与自闭症的哪些特征相关。

“TCs"在这个背景下,就是指一组正常的、非自闭症的个体,他们被用作对照,以便更好地理解和解释自闭症个体的fMRI数据。

“功能连接性(Functional Connectivity, FC)特征”是一种描述大脑中不同区域在活动上的同步性或相关性的方法。这是神经科学和脑成像研究中的一个重要概念,尤其在使用功能磁共振成像(fMRI)数据进行分析时。

在一个给定的时间段内,如果两个或多个大脑区域的活动模式显示出统计相关性(例如,它们同时增强或减弱),则认为这些区域在功能上是连接的。这种功能连接性可能反映了这些区域在处理信息或执行认知任务时的协同工作。

这些功能连接性模式可以被提取出来作为“功能连接性特征”,这些特征可以用来描述个体的大脑网络。例如,这些特征可以帮助我们了解大脑的正常功能,或者帮助我们识别和理解神经精神疾病,如自闭症、精神分裂症、阿尔茨海默病等的神经机制。

值得注意的是,功能连接性是一种非侵入性、间接的测量方法,它可以提供关于大脑功能和结构之间复杂相互作用的有价值的信息,但它不能直接测量神经元活动或神经电生理信号。同时,功能连接性的解释需要谨慎,因为它可能受到多种因素的影响,包括但不限于信号处理方法、实验设计、参与者状态等。

“静态FC特征”是指在一段较长的时间窗口内(比如整个fMRI扫描过程)大脑不同区域间的连接模式,这种模式被认为是相对稳定不变的。

虽然静态FC特征常常被用于ASD分类,但它并不完全局限于rs-fMRI数据。这是因为我们也可以从执行特定任务(如语言,工作记忆,心理想象,执行功能,认知控制和社会认知任务)过程中的fMRI数据中提取出静态FC特征。这种方法可以帮助我们理解大脑在执行不同任务时的连接模式如何改变,这对于理解ASD的神经基础非常重要。

上述的功能连接(Functional Connectivity,简称FC)主要是指传统的静态脑功能连接,它揭示了一对兴趣区域(Regions of Interest,简称ROI)或特定网络间的内在相似性。近年来,人们逐渐接受了动态功能连接(Dynamic Functional Connectivity,简称DFC)比静态功能连接包含更多的附加知识这一观点。动态功能连接可以揭示静态功能连接无法观察到的时空网络属性,并可能揭示ASD中更为细微的非典型功能连接的瞬态模式。尽管如此,相较于静态功能连接,使用动态功能连接进行ASD分类研究的案例还并不多。

有研究利用独立成分分析(Independent Component Analysis,简称ICA)生成的独立成分获得动态功能连接。他们的研究证明,使用在广泛时间范围内的功能连接特征,比使用静态功能连接特征可以显著提高ASD分类,这表明动态功能连接是静态功能连接特征的重要补充。此外,有研究提出了基于皮尔森相关的高阶形态脑网络,以检测多个脑区间的更复杂交互模式。他们发现,在高阶级别识别的区域与低阶级别的不同,这可能提供互补的区别信息,以便进行更准确的诊断。

另一项研究提出了多级高阶功能连接网络,作为ASD分类特征,并获得了更好的分类性能。两年后,他们融合了从传统功能连接、低阶动态功能连接和高阶动态功能连接中提取的特征,用于ASD分类,并获得了比任何其他类型的特征融合更好的分类性能。这表明,不同级别的功能连接的融合可以提供关于ASD诊断的互补相关信息,这与他们的前期研究是一致的。

通过分析相关文献,可以明显看到,常用的分类特征主要来自静态或动态功能网络。此外,一些研究者通过不同的视角扩大了ASD分类特征的范围。例如,有研究使用了两种视觉奇异任务,研究了在关注社交(面部)和非社交(场景)刺激时参与的脑系统,并选择了前部胰岛皮质背部的多变激活模式作为分类特征。首先,"oddball tasks"是一种常用的心理学实验设计。在这种任务中,被试需要对一连串重复的刺激进行反应,这些刺激中间夹杂着极少数的不同的刺激(即"oddball",或者叫做“异类刺激”)。在此研究中,研究人员使用了两种视觉异类任务,一种是面部(代表社交刺激),另一种是场景(代表非社交刺激)。然后,"dorsal part of the anterior insula"是大脑的一个部位。前岛脑是与感觉、情感、自我意识等有关的区域。这部分的多变性激活模式(即在处理不同任务时激活方式的差异)被用作分类特征。换句话说,他们的研究目的是检验在处理社交刺激和非社交刺激时,前岛脑是否表现出不同的活动模式。简单来说,Odriozola等人在2016年的研究中使用了两种视觉异类任务,分别以面部和场景作为刺激,探查大脑在处理这两类刺激时的活动差异,特别是在前岛脑的背部区域。他们对这个区域的活动模式进行了分类,以检验是否存在对社交和非社交刺激的不同反应模式。

图3

还有的研究从两个实验中获取了fMRI数据,并使用每个条件在个体步骤级别估计的贝塔图作为分类特征。每个个体的贝塔图是高维的,包含186,217个特征。甚至直接选择了静息态fMRI时间序列和灰质(Grey Matter,简称GM)掩模内的所有体素作为分类特征,假设他们将携带比单一的、静态的功能连接测量更有用的信息。解释一下,这里的"高维"和"特征"是指在分析过程中,每个体素都对应一个beta值,这个值代表了该体素对试验条件的反应强度。这个研究中,每个人的大脑被分成了186,217个体素,所以每个人的beta map就有186,217个特征。

此外,一些研究者应用了集成的分类特征。例如,通过小世界网络分析,引入了体积测量分析、功能连接MRI分析和图论,产生了包含总共22个定量局部和全局成像特征的集成分类特征。在某些研究中,实现了源自AAL图谱、HO图谱和Craddock图谱的集成功能连接。此外,为了更好的分类,一些研究者应用了他们提出的方法来获得分类特征,例如方向梯度直方图(Histogram of Oriented Gradients,简称HOG)特征和因子分析特征。还有一些研究者计算了基于AAL图谱的静息态fMRI、GM和白质(White Matter,简称WM)的各自ROI的平均值,然后使用这三种特征的融合获得了最高的分类准确性。在一项研究中,基于AAL图谱的功能连接,引入了fMRI × ROI连接作为特征补充。相对于主要由神经纤维组成的"白质",灰质在fMRI扫描中更能反应神经活动。一个"mask"在这里指的是一个用来选择特定大脑区域的模版,"GM mask"就是用来选择灰质区域的模版。"Voxels"是体素的意思,指的是三维像素,是构成fMRI图像的基本单位。

因此,原文这段话的意思是,研究者们直接使用了处于灰质区域内的所有体素的rs-fMRI时间序列作为分类的特征。这是基于他们的假设,即这些体素的rs-fMRI时间序列包含的信息比单一的、静态的功能连接性(Functional Connectivity, FC)度量更有用。

影响分类准确性的另一个重要因素是特征选择。由于即使构造了相关特征后,fMRI数据仍具有高维特性,因此特征选择方法在分类中起着重要作用。适当的特征选择可以进一步降低特征的维度,提高分类准确性,便于数据的可视化,并导致更快的分类。为了认识到特征选择在分类中的重要性,它逐渐成为ASD分类研究的不可或缺的一部分。然而,这次评论的47篇论文中有16篇并未引入独立的特征选择方法,而是直接将高维特征作为分类器的输入,导致了较低的分类准确性。在一些工作中,还比较了使用和不使用特征选择方法的ASD分类的性能。比如,一项研究使用变量重要性最高的前100个特征获得了90.8%的分类准确性,而没有特征选择时,准确性为58%。另一项研究证明,使用特征选择的分类表现优于不使用特征选择方法的分类表现,不同的特征选择方法可能会产生不同的分类结果。值得一提的是,使用特征选择方法的ASD分类研究平均可以带来比没有使用特征选择方法的研究更好的分类准确性。

图1 https://fcon_1000.projects.nitrc.org/indi/abide/

图2 http:///

图3 Odriozola P, Uddin L Q, Lynch C J, et al. Insula response and connectivity during social and non-social attention in children with autism[J]. Social cognitive and affective neuroscience, 2016, 11(3): 433-444.

参考文献:

Autism Spectrum Disorder Studies Using fMRI Data and Machine Learning: A Review

—— End ——

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多