【原】使用全局-局部迁移学习方法的脑龄预测

思影科技 2023-04-16 发布于重庆

展开全文

本文提出了一种全局-局部迁移学习方法，通过注意力机制将来自局部图像块的细粒度信息与全局上下文信息融合，以估计大脑年龄。在8个包括8379个年龄范围为0-97岁的健康大脑核磁共振成像的公开数据集上评估了这一方法。使用6个数据集进行交叉验证，使用2个数据集评估泛化能力。与其他现有技术相比，本研究的全局-局部迁移学习方法将估计脑龄的平均绝对误差降低到2.70年，并将估计脑龄与实际脑龄的相关系数提高到0.9853。此外，还提供了对大脑年龄估计信息最多的局部图像块信息。

深度学习可以提供基于大脑磁共振成像（MRI）的快速大脑年龄估计。然而，大多数研究使用一个神经网络从整个输入图像中提取全局信息，却忽略了局部细节。在本文中，我们提出了一种全局-局部迁移学习，它由以下两部分组成：从整个输入图像中提取全局上下文信息的全局路径和从局部图像块（即patch）中提取局部细粒度细节的局部路径。受迁移学习的启发，通过注意力机制将来自局部图像块的细粒度信息与全局上下文信息融合，以估计大脑年龄。此外，本文方法还提供了对大脑年龄估计信息最多的局部图像块信息。源代码网址：https://github.com/shengfly/global-local-transformer.本文发表在IEEE TRANSACTIONS ON MEDICAL IMAGING杂志。

基于功能连接组的自闭症预测模型

基于磁共振成像的精神分裂症人工智能诊断

JAMA Psychiatry：早期精神病和情感阶段的临床、大脑和多层次聚类

儿童和青少年精神病学的转换机器学习

深度学习在自闭症谱系障碍神经成像诊断和康复中的应用

使用多模态机器学习方法探索精神疾病和额颞叶痴呆之间的联系

老年抑郁症患者的神经影像学、认知、临床症状和遗传学的异质性表征

利用机器学习(HYDRA)揭示了两种精神分裂症的神经解剖学亚型

精神病学小数据和大数据的深度学习

Science:使用对比机器学习方法揭示自闭症神经解剖学变异结构

卷积神经网络

神经影像预测精神疾病及心理健康的前景

用于阿尔茨海默症分期早期检测的多模态深度学习模型

深度学习在静息态功能磁共振成像中的应用

脑影像中的深度学习研究：前景与挑战

基于磁共振成像的脑龄研究：可解释的人工智能的当前状态和未来挑战

BrainAGE作为大脑老化的神经影像标志物的十年

神经影像研究驱动的脑龄估计作为脑疾病和健康状况识别的生物学标记

基于原始影像数据的深度学习模型预测脑龄可获得可靠的遗传生物标志物

AJP：精神分裂症患者大脑加速老化的纵向识别研究

基于全球14468名被试MRI数据特征预测脑龄和疾病的深度学习模型

AJP：有和没有内化性精神障碍的受虐女孩情绪回路延迟成熟的差异性

重度抑郁症患者的脑龄

SVM在脑影像数据中的应用

基于深度学习和自闭症脑成像数据库（ABIDE）识别自闭症谱系障碍

Radiology：皮层厚度预测轻度认知障碍转化为帕金森痴呆症

阿尔茨海默病及其先兆分期的神经影像分类研究及相关特征提取

Nature子刊：基于深度学习预测家族性阿尔兹海默症患者临床前功能性脑老化

机器学习在重度抑郁症患者中的应用：从分类到治疗结果预测

基于功能磁共振成像数据的机器学习对精神分裂症进行分类

使用多元表征方法提升对大脑-行为之间关系的机器学习研究的泛化

用于临床心理学和精神病学的机器学习方法

PLOS Biology：重度抑郁症多成像中心的泛化脑网络标志物

Nature Medicine：持续的实验性和临床性疼痛的神经影像生物

深度学习在婴儿大脑的磁共振图像分析中的作用（上）

参数选择对脑卒中后失语症预测模型的影响

如果深度学习是答案，那么问题是什么？

大脑数据分类时意外过拟合的危险

机器学习在静息态功能磁共振成像中的应用

有监督机器学习在系统神经科学中的作用

Nature Protocols：为解释神经成像中的机器学习模型

Biological Psychiatry: 基于多模态脑影像的个体指标预测-方法

Biological Psychiatry：自闭症的神经亚型研究进展

PNAS:灰质年龄预测作为痴呆风险的生物标志物

BRAIN：用于阿尔茨海默病分类的可解释深度学习框架的开发

异质性问题：识别精神疾病亚型的方法

NPP:结构MRI数据的生理性别分类显示跨性别者女性的错误分

利用功能连接对脑疾病进行分类和预测

基于脑影像的精神疾病预测

基于影像学和定量感觉测试预测慢性疼痛的治疗结果

识别最优的数据驱动特征选择方法以提高分类任务的可重复性

Neuron脑影像机器学习：表征、模式信息与大脑特征

Molecular Psychiatry：静息态fMRI预测青少年认知能力

JAMA Psychiatry：脑影像机器学习预测精神疾病患者社会功能

AJP:基于脑网络的可卡因戒断预测

基于机器学习的情绪障碍诊断：功能网络预测药物反应

脑影像特征预测散发性阿尔茨海默病症状发作时间

1. 介绍

大脑年龄（以下简称脑龄）可以通过在大脑磁共振图像（MRI）上使用机器学习技术来进行估计。由MRI得出的脑龄与个体水平的大脑健康程度相关。预测的大脑年龄和实际年龄之间的差异被称为“脑龄差距（BAG）”，这是大脑健康的生物信息标志物。许多研究表明，阳性BAG与认知能力下降和神经退行性变的风险有关，如阿尔茨海默病、轻度认知障碍（MCI）、精神病、重度抑郁障碍等。脑龄估计的关键部分是在正常老龄化人群中训练可以在健康的脑部MRI上以低误差估计脑龄的机器学习模型。在大多数研究中，机器学习模型是在脑部MRI上训练的，其中个体的实际年龄是指自个体出生以来的时间。因此，经过训练的机器学习模型可以提取从健康大脑MRI中学习到的年龄特异性模式从而估计大脑年龄。

卷积神经网络（CNNs）可以在各种应用中提供优良的性能。它可以对整个输入图像和局部图像块（即patch，从输入图像中分割）进行预测。在整个图像上使用CNNs的一个优点是，它可以捕获全局信息并提供图像级预测。然而，由于深度神经网络被整个图像上的显著信息所支配，因此容易错过细粒度的细节。此外，CNN从整个输入图像中做出的决定不容易作出合理解释。相反，基于图像块的方法可以捕捉局部详细信息，并提供细节证据，从而揭示特定年龄的解释模式。然而，由于缺乏全局上下文信息，其性能有一定限制。

为了解决这个问题，我们提出了一种用于脑龄估计的双通道网络。一个通道从输入的脑部MRI中捕获全局上下文信息，另一个通道负责从局部图像块捕获细粒度信息。我们将局部细节和全局上下文信息与注意力机制融合在一起，灵感来自迁移学习中的自注意力机制。因此，我们将其命名为“全局-局部迁移学习”，如图1所示：

图1.“全局-局部迁移学习”脑龄预测框架（有N个相同的全局-局部迁移学习模型来迭代地融合全局和局部特征。）

A.我们的方法利用全局上下文和局部细节

全局路径基于整个输入图像进行决策，深层特征包含输入图像的全局上下文信息。然而，很容易收敛到信息量最大的可以产生较小的训练损失的区域，而包含细微年龄信息的其他区域则会被忽略。局部路径从局部图像块中学习年龄信息，强制网络学习很小的局部区域内的详细年龄信息，但是由于局部图像块的感受野大小受有限，因此性能有限。文献中的许多研究表明，融合全局上下文和本地详细信息可以提高性能。我们提出的方法使用注意机制最优地融合从全局路径提取的全局上下文信息和从局部路径提取的局部详细信息。

B.我们的方法不需要空间特征对齐

融合来自两个不同路径的全局和局部特征的常见方法是在局部区域的相同空间位置对全局路径的特征进行分割，并将它们连接在一起。然而，有两个限制：（1）它要求全局和局部路径的特征在空间上对齐，这对于神经网络中几个最大池化层之后的任意输入图像大小来说是困难的；（2）从全局路径裁剪的深层特征仍然包含来自局部区域的信息，而没有全局上下文信息。

我们使用注意力机制来优化融合来自全局和局部的深层特征。注意力可以从全局路径中选择最重要的信息，而忽略与上下文特征无关的信息。将所有位置处的全局上下文信息的加权和与来自局部的深度特征的每个位置上的特征融合，其中通过对应的全局和局部深度特征之间的相似性来计算权重（通过softmax归一化，命名为注意力）。因此，我们的方法不需要任何空间特征对齐，并且可以在来自全局和局部的特征之间的相似性的指导下捕获长程全局上下文信息。

C.我们的方法具有可解释性

有不同的方法来解释大脑年龄估计的深度学习方法。Levakov等人应用基于梯度的方法计算可以表示每个体素对脑龄预测贡献的个体解释图。我们之前的工作计算了一个群体中隐藏神经元和实际年龄之间的相关性图，以找到神经网络中最具鉴别力的神经元。对于迁移学习而言，注意力流可用于评估图形块的相对相关性。这些间接解释方法旨在了解神经网络在从从大脑图像中学到的内容及其所在位置，但有一个限制是神经网络受显著信息支配。

另一方面，直接解释方法通过直接在局部图形块上训练神经网络并量化每个局部图形块的预测精度来解释神经网络，以突出输入图像中信息量最大的图形块。一种有代表性的方法是BagNet，它基于从图像中分割出来的小局部块对图像进行分类，而不考虑它们的空间顺序，从而可以很容易地分析每个局部块的预测证据。与BagNet类似，我们的方法可以根据局部图形块来估计脑龄。因此，每个受试者的图形块级证据可以被利用和可视化以进行解释。我们所提出的方法具有BagNet的优点。此外，神经网络在局部图形块上的性能高于BagNet，因为它还通过注意力从全局路径中学习相应的全局上下文信息。

2. 相关工作

A.脑龄估计

表1. 在健康的脑部MRI上使用卷积神经网络进行脑龄评估的机器学习研究综述（MAE：平均绝对误差）

表1总结了文献中使用卷积神经网络进行脑龄估计的相关研究。大多数研究使用常见的网络结构对大脑MRI进行脑龄估计。文献[16]中提出了一种具有5个卷积层和一个全连接层的用于大脑年龄回归的3D神经网络，在18-90岁的年龄范围内提供了4.16岁的平均绝对误差（MAE）。残差网络的3D版本已在文献[17]中应用，通过组合多个CNNs，实现了MAE为3.631岁的预测。3D版本的VGG网络用于18-90岁受试者的脑年龄估计，MAE为5.55岁。Feng等人使用具有10个卷积层的神经网络对18-97岁的受试者进行大脑年龄估计，得出4.21岁的MAE。Levakov等人利用具有4个卷积层和2个全连接层的3D CNN对10176名受试者（年龄范围：4-94岁）的10个CNN求取平均，获得的MAE为3.07年。Peng等人提出了一种轻量级的简单全卷积网络（SFCN），在44-80岁的受试者中实现了2.14年的MAE。Bashyam等人开发了一种基于2D切片的脑龄预测DeepBrainNet，在一组大型MRI扫描中MAE为3.702年。

最近，Cheng等人提出了一种3D两阶段年龄神经网络，用于从T1w MRI中估计大脑年龄，分为两个阶段：第一阶段估计粗略的大脑年龄，第二阶段用于细化结果。6586名年龄在17-98岁的受试者的MAE达到2.428。我们之前的工作使用了注意力融合（FiA-Net）3D网络来融合强度和RAVENS通道，用于大脑年龄估计，在年龄队列（0-97岁）中的MAE为3.00年。

我们的方法在两个关键方面有所不同：（1）我们提出了一个双通道网络，它可以利用全局上下文和局部详细信息来估计大脑年龄。（2）我们将所提出的方法应用于从3D大脑MRI柱中提取的2D切片，这在计算上是高效的，并且在年龄（0-97年）上实现了2.70年的MAE。

B.迁移学习

迁移学习最初用于自然语言处理（NLP），最近在视觉识别中流行。核心思想是在输入序列上应用自注意层，以捕捉局部图像块序列之间的关系。输入序列首先被转换为三个不同的组件，即“查询（query）”,“关键词（key）”和“值（value）”。随后，基于“query”和“key”获得注意力，并将其应用于“value”以输出缩放序列。迁移学习已被用于图像识别、对象检测、手部姿态估计、图像超分辨率等。

我们方法的不同之处在于，“query”、“key”和“value”来自不同的特征：我们从全局路径计算“key”、“value”，从局部路径计算“query”。通过“key”和“query”，可以获得全局和局部信息之间的注意力，并将其应用于“value”，以计算局部图像块的全局上下文信息。因此，我们的方法可以将全局上下文和局部详细信息与注意力机制进行最佳融合，称为“全局-局部注意力机制”。具有“全局-局部关注”的相应迁移学习被命名为“全局-局部迁移学习”。

3.方法

A.深度特征提取的主干

我们使用卷积神经网络（CNN）作为主干从输入图像中提取深层特征。主干基于VGGNet，有少量层，这是基于“浅层神经网络在大脑年龄估计方面比深层神经网络提供更好的结果”这一事实。如图2所示，主干包含八个块。每个块由内核大小为3×3、填充为1的卷积层、批量归一化层和ReLU激活层组成。在每两个块之后应用内核大小为2×2、步长为2的最大池化层，以逐渐减小空间维度。每个块中使用的信道号类似于VGGNet，为[64，128，256，512]。主干将输入图像转换为深层特征，表示输入图像的抽象和高级特征。

图2.卷积神经网络的主干。（n表示n个通道，x2表示存在两个堆叠的相同的块）。

B.全局-局部注意力机制

图3.全局-局部注意力机制框架

与自注意力机制类似，我们也使用多头注意，其中全局和局部特征在通道维度上被拆分为h=8个平行部分。全局-局部注意力机制被应用于每个部分，并且输出值被连接，并投影到具有与输入特征相同大小的一个特征中。多头注意力成为迁移学习的标准组成部分。

C.全局-局部迁移学习

在本节中，我们展示了全局-局部迁移学习，如图1所示。我们将全局-局部注意力块的输出与局部特征连接起来，因为它包含来自全局路径的全局上下文信息。全局上下文信息是全局特征的加权和，该全局特征由全局和局部特征共同确定的相似度来确定。这两个不同的特征在前馈环节中被进一步融合。与标准迁移学习略有不同，前馈环节包含两个具有批量归一化和ReLU激活功能的线性变换（两个卷积层，具有512个通道，内核大小为1），以融合全局上下文和局部细粒度信息。输出中添加了受残差学习启发的局部特征。因此，包含全局上下文信息的是局部特征。全局上下文信息和更新的局部特征也可以被反馈到另一个全局-局部迁移学习变换器中。将相同的结构重复N次，以迭代集成全局上下文和局部详细信息。用于脑龄估计的每个分支上的最后一层是全连接层，用于将512维的特征向量（在平均池化层之后获得）映射到脑龄。

4.实验

在本节中，我们介绍了所提出的方法在一个大型健康队列中的实验结果。我们还将其与基线模型和最先进的神经网络架构进行了比较。

A.数据

在本文中，我们在健康队列中评估了所提出的方法：我们从8个公开数据集收集了健康大脑T1加权MRI数据（表2），共有8379个样本，年龄范围为0-97岁。其中，6个数据集用于交叉验证，CMI和CoRR数据集用于评估深度学习模型的通用性。

预处理步骤包括N4偏置校正、视场归一化和Multi-Atlas Skull Strip-ping (MASS)。通过FSL将颅骨剥离的T1w MRI数据配准到SRI图谱（体素大小为1×1×1 mm，由24个健康大脑的T1w构建）。通过去除黑色边界，将大脑的体素裁剪为130×170×120的尺寸。所有MRI扫描都经过手动检查以去除具有严重伪影或配准不良的失败MRI。

我们在水平面、冠状面和矢状面上提取3D大脑体素中心周围的2D切片，不同的2D切片可用于大脑年龄预测。要提取的2D切片的数量（如图5所示）是本算法的关键变量。此外，与3D神经网络相比，训练2D神经网络需要更少的参数。此外，在全局特征和局部特征之间的每个位置之间计算全局-局部注意力，需要3D神经网络的大量计算资源（计算时间和内存）。如表2所示，将来自BGSP、OASIS-3、NIH-PD、ABIDE-I、IXI和DLBS随机分为5个部分，并进行5折交叉验证进行评估；使用来自不同扫描仪的CMI和CoRR数据集来评估模型的通用性。

表2.健康队列中用于脑龄估计的数据集信息

B.网络训练

我们使用平均绝对误差作为损失函数，其定义为：

其中pi是受试者的已知实际年龄，

是神经网络估计的大脑年龄。最终的训练损失是全局路径和局部路径的损失之和。该网络由PyTorch平台中内置的Adam优化器进行训练，初始学习率为0.0001，在总共80个训练时期中，每25个周期减少一半。由于GPU内存的限制，批尺寸为18。在一个具有12G内存的NVIDIA RTX 6000 GPU上，神经网络的训练大约需要12个小时。

C.脑龄估计的性能评估

我们使用了三个指标评估模型性能：平均绝对误差（MAE）、相关系数（r）和累积得分（CS）。MAE（公式2）是一种广泛用于脑龄估计的指标。相关系数（r）被计算为预测年龄和实际年龄之间的Pearson相关性。CS是在给定阈值α下所估计的年龄的准确性，由以下公式给出：

其中是年龄估计的绝对误差e不高于阈值α的样本数，CS分数越高意味着性能越好。

D.与不同基线模型的比较

我们将所提出的全局-局部迁移学习与以下六种不同的基线模型进行了比较：

（1）ResNet18：我们训练具有18层的标准ResNet，可以直接在整个输入图像上估计大脑年龄。

（2）BagNet-ResNet18：受BagNet的启发，ResNet18应用于从输入图像分割的每个局部图像块。

（3）VGG：我们使用VGG主干作为对整个输入图像进行脑年龄估计。

（4）BagNet-VGG：在每个局部图像块上应用VGG骨干网络。这类似于BagNet-ResNet18模型，此处将ResNet18替换为VGG。

（5）全局-迁移学习：我们使用VGG从输入图像中所裁剪的局部图像块序列中提取特征向量，并将相应的特征序列输入到用于脑龄估计的标准迁移学习中。“查询”、“关键词”和“值”来自在整个输入图像上分割的局部图像块序列。

（6）局部-迁移学习：标准迁移学习应用于在每个局部图像块上提取的特征向量。“查询”、“关键词”和“值”来自从单个局部图像块中提取的深层特征。为了公平比较，所有模型都使用相同的训练配置进行训练。

E.与最先进的神经网络的比较

我们还将所提出的方法与其他以整个图像为输入的视觉识别神经网络进行了比较。比较的网络结构包括：（1）ResNet50和ResNet101：最流行的具有50层和101层的残差网络。（2）WRN-50和WRN-101：具有不同层的宽残差网络（WRN），可以减少残差网络的深度并增加残差网络的宽度。（3）DenseNet121和DenseNet201：具有不同层的密集连接卷积网络。（4）SqueezeNet和ShuffleNet v2：两个使用小内核或深度可分离卷积层进行视觉识别的高效网络。

F.与最先进的脑龄估计方法的比较

如上所述，大多数脑龄估计研究都使用了神经网络的常见结构（在前几节中进行了比较）。最近发表了三种专门用于大脑年龄估计的神经网络。因此，我们还将所提出的方法与它们进行了比较：SFCN、DeepBrainNet和FiA-Net。SFCN最初是基于3D图像设计的，名为SFCN 3D。我们将3D卷积核替换为2D卷积核，称为SFCN 2D，以比较2D和3D图像的性能。它包含七个卷积层、批处理层、激活层和最大池化层。DeepBrainNet基于Inception-Res-V2模型对2D切片进行处理。为了进行公平的比较，所有模型都采用了相同的训练配置。

G.单个图像块尺寸的性能

我们用固定的局部图像块尺寸来评估所提出方法的性能。尽管我们的方法可以在没有特征对齐的情况下分割任何位置的局部图像块，但为了提高计算效率，我们使用滑动窗口策略来裁剪图像块，步长设置为图像块尺寸的一半。脑龄的最终估计值是所有可能的局部图像块中所估计年龄的平均值。

H.多个图像块尺寸的解释

我们裁剪不同大小的局部图像块，并将它们输入脑龄估计模型的相同局部路径中。换句话说，所有大小不同的图像块在网络中共享相同的本地路径。尽管可以应用任意的图像块尺寸，但为了计算效率，我们将最小图像块设置为32，将最大图像块设置为102，步长为8。在训练过程中，从整个图像的不同位置随机采样30个具有不同大小的图像块，以训练所提出的神经网络。在测试过程中，我们对每个受试者随机抽取3000个小图像块，并在每个图像块上获得所预测的脑龄。所获得的预测脑龄的分布，用平均值m和标准差σ来描述（如图4所示）。标准差σ可以被认为是脑龄估计的不确定性，它测量不同大脑区域的预测年龄差异。由于脑龄可以在局部图像块上估计，因此可以找到MAE最低的图像块并将其可视化以进行解释。

图4. 多个图像块大小的脑龄估计图解。

5.结果

A.系统的参数评估

图5.不同参数下大脑年龄估计的性能：（a）不同的图像块大小；（b）不同切片数量；（c）不同数量的blocks；（d）不同的主干；（e）全局-局部路径。

首先，我们评估了所提出的方法在局部图像块使用不同尺寸时性能，实验结果如图5（a）所示。从图中可以看出，当图像块尺寸大于48时，结果之间没有显著差异。因此，我们在本节中将局部路径的图像块大小设置为64。其次，我们基于从中心开始的切片上估计的年龄接近实际年龄的事实，给出了从3D MRI扫描中分割出的2D图像切片数量不同时的脑龄预测结果（图5（b））。图5（b）显示，当切片数量从5到20时，性能没有显著差异。第三，我们还展示了系统中全局-局部迁移学习模块（如图1所示）数量不同时系统的性能（如图5（c）所示）。这表明，当全局-局部迁移学习块的数量约为N=6-10时，MAE较低。在下一节中，我们将切片数设置为5，将块数设置为N=6，以在性能、计算时间和内存之间进行评估。图5（d）显示了不同主干（ResNet18、VGG13和VGG8）下的性能。VGG13具有与VGG8相似的结构（如图2所示），但具有与VGG16相同的13个卷积层。使用具有8个卷积层的神经网络提供了最佳结果。图5（e）显示了所提出的全局-局部迁移学习的全局和局部路径的性能。局部路径的预测是来自所有局部图像块的平均预测年龄。局部路径利用全局路径的全局上下文信息捕获来自局部图像块的详细信息，比从整个输入图像中提取大脑年龄的全局路径产生更好的性能。因此，我们在以下章节中只报告了局部路径的性能，全局路径仅用于增强全局上下文信息以提高局部路径的性能。

B.与不同基线模型的比较

表3显示了不同模型在水平面、冠状面和矢状面三个平面提取的2D切片上的性能。我们还通过预测的平均年龄来融合从所提取的2D切片的预测结果：

，其中yi是从平面i∈{水平面，冠状面，矢状面}时所预测的脑龄。

表3.三种不同平面上不同基线模型的性能比较及其融合

图6显示了具有不同误差水平α的不同模型的CS曲线。其中两个效果较好的模型所预测的脑龄相对于被试实际年龄的散点图如图7所示。

图6. 不同模型在三个平面上0至5年误差水平α的累积得分（CS）及其融合。

图7. 基于两个最佳模型估计的大脑年龄和被试实际年龄的散点图：（a）VGG；（b）本文提出的全局-局部迁移学习。

可以得到几个观察结果：（1）对于基于BagNet的方法（BagNet-ResNet18和BagNet-VGG），它们的性能低于以整个图像为输入的网络（ResNet18和VGG）。这表明，仅基于局部图像块来估计大脑年龄，性能是有限的。使用自注意机制，带有VGG主干的局部-迁移学习可以提高性能，但结果仍低于ResNet18。一般来说，以局部图像块作为输入的神经网络性能低于以整个图像作为输入的网络。然而，我们提出的全局-局部迁移学习达到了最好的性能，这证明融合全局上下文和局部详细信息十分具有优势。（2）不同平面上的年龄信息略有不同。信息量最大的平面是水平面，它比冠状面和矢状面提供更好的结果。对于ResNet18、VGG、局部-迁移学习和全局-局部迁移学习，融合这三个平面可以提高性能。在下面的部分中，我们只报告了三个平面的融合性能，因为它可以提供比单个平面更好的结果。（3）在整个输入图像和局部图像块上，具有8个层的轻量级VGG网络比具有18个层的ResNet提供了更好的结果。这提示在脑龄估计方面，轻量级网络可以实现比ResNet更好的性能。（4）与三个平面上的所有其他模型和相应的融合模型相比，我们提出的全局-局部迁移学习模型在不同阈值α下给出了最低的MAE、最高的相关性r和CS。

为了进一步展示不同模型的详细估计性能，基于MAE的评估被分解为不同的年龄范围。表4显示了年龄组的表现，这些年龄组大致分为四组。对于所有模型，30-60岁受试者的估计年龄的MAE高于其他年龄组的受试者，这表明该年龄组的年龄估计比其他年龄组更具挑战性。表中的结果表明，与四个不同年龄组的所有其他六个基线模型相比，我们提出的方法总是提供最好的性能。

表4. 不同年龄段的平均绝对误差（MAE）表现

表5显示了不同数据集的性能，包括用于交叉验证的6个数据集和用于泛化能力检验的2个数据集。我们提出的方法在交叉验证中涉及的6个数据集以及CMI和CoRR数据集上提供了最低的MAE，并可推广到来自不同站点和扫描仪的不同数据集。

表5.每个数据集在平均绝对误差（MAE）方面的性能

C.与最先进的神经网络和大脑年龄估计模型的比较

表6显示了与八个最先进的深度学习网络和最近发表的两个大脑年龄估计模型在MAE、相关性r和CS（α=5年）方面的比较。所有这些模型都经过了五折交叉验证，并报告了三个平面的融合结果，以便进行公平的比较。我们用2D和3D卷积神经网络训练SFCN，在相同的数据上命名为SFCN 2D和SFCN 3D。从表6中我们可以看出，（1）在算法比较中，高效网络（ShuffleNet、SqueezeNet和SFCN 2D）具有最大的MAE（>3.5年）、最低的相关性（r<0.98）和CS（α）<80%。（2）DenseNet比其他神经网络（包括ResNet、WRN和DeepBrainNet）得到更好的结果。（3）SFCN的3D网络提供了比其2D网络更好的结果。（4）我们提出的方法优于其他通用神经网络，以及专门为大脑年龄估计设计的三个网络（SFCN、DeepBrainNet和FiA-Net]）。

表6. 基于五折交叉验证的脑龄估计方法与统计方法的比较

D.多图像块尺寸的解释

在本节中，我们提出了两种解释：受试者水平的解释：它突出了每个受试者水平最具鉴别性的图像块；组水平的解释显示了特定年龄范围内一组受试者最显著的脑区。对于受试者水平的解释，收集每个图像块尺寸中MAE最低的5个图像块，并构建热图，将信息最多的区域进行可视化。对于组水平解释，我们只在每个受试者上选择具有最低MAE的5个图像块，其大小为32和40，然后对年龄范围内受试者的所有选定图像块进行平均，以获得细粒度热图。热图显示了在大脑图像上可以获得最低MAE（最佳预测）的概率。

图8.每个大脑的热图（大脑区域能够达到最低MAE的概率）显示了从局部图像块中提取的大脑年龄证据。被试者实际年龄以红色突出显示，MAE范围（最小-最大预测误差）以白色显示。

图8显示了每个受试者通过对具有最低MAE的不同尺寸的图像块进行平均计算得到的信息量最大脑区域。对于每个大脑MRI，MAE最低的大多数图像块覆盖相同的区域，这表明显著区域（如图所示）比其脑区域包含更多脑年龄信息。此外，不同年龄的受试者大脑显著的年龄区域略有不同。为了计算大脑显著年龄区域的总体趋势，我们对特定年龄范围内受试者的显著区域进行了平均计算，结果如图9所示。

图9.不同年龄段受试者的平均热图。热图显示了每个年龄组大脑区域达到最低MAE的概率（红色表示高概率，蓝色表示低概率，如右侧彩条所示）。MAE范围（最小-最大预测误差）以白色显示。

随着时间的推移，大脑显著区域有变化的趋势。在儿童（0-5岁）中，最显著的大脑年龄区位于额叶。年龄范围为5-20岁为深灰色区。从20岁开始，在30-35岁时显著区域逐渐转移到顶叶，然后在35-40岁时移回，直到65-70岁。75岁后，有两个显著的区域包含了最多的年龄信息。

图10显示了标准偏差σ（不确定度测量）在整个寿命内的分布。大的σ意味着在不同的大脑区域估计大脑年龄的差异很大。研究表明，在20岁和65岁左右的年龄段差异最小，这表明在这些年龄段，整个大脑区域之间的差异最小。40岁左右的受试者差异最大。原因可能是这个年龄段的训练样本较少。

图10.由不同大小的局部图像块计算的大脑估计年龄的标准差σ的分布。红色曲线是每年平均σ的平滑曲线，它遵循左侧y轴的刻度。条形分布显示了每个年龄段的样本数量，遵循右侧y轴刻度。

图11的顶部条形显示了所预测的脑龄误差与基于SRI图谱自动分割的脑区的颅内容积（ICV）归一化容积值之间的Pearson相关性。我们发现交叉验证数据集不存在显著相关性（n=5441，r<0.1）。图11的底部显示了每个大脑区域（ROI）的箱线图。预测大脑年龄的平均误差（AE）在不同的大脑区域略有不同，范围从0.29年（Parietal Lateral GM Right）到-0.86年（Occipital Inferior GM Right）。还可以可视化每个大脑区域在整个寿命中的平均误差，图11显示了三个例子。

图11.顶部条形分布显示了ICV归一化区域体积与基于SRI图谱分割的每个大脑区域的预测脑龄误差之间的Pearson相关。每个自动分割的大脑区域上预测的大脑年龄的平均误差（AE）的箱线图。这些区域是根据中值按降序排列的。底部显示了三个不同大脑区域的误差分布。

6.讨论和总结

在本文中，我们提出了一种新的用于脑龄估计的神经网络模型，称为全局-局部迁移学习，该网络将全局上下文和局部详细信息与注意力机制实现了最佳融合。

我们在六个公开数据集上对5441名年龄在0-97岁的健康受试者进行了实验。通过与六种不同的基线模型进行比较，结果表明，在不同阈值的MAE、相关性和累积得分方面，全局-局部迁移学习在脑龄估计中表现出最佳性能（表3和图6）。此外，我们还将所提出的方法与八个最先进的神经网络和两个用于脑龄估计的特定网络进行了比较（表6）。结果都表明，融合全局上下文和局部详细信息可以提高2D切片上大脑年龄估计的性能。

我们提出的方法也可以用于解释大脑年龄估计的证据。我们展示了提供最低MAE的受试者水平的显著大脑区域（图8）和特定年龄范围内一组受试者的平均显著区域（图9）。它也可以用于计算不同大脑区域的大脑老化差异（图10）。这些结果证明了所提出的方法的优势，该方法不仅可以获得比其他模型更好的性能，而且可以可视化大脑年龄估计的证据。

本方法的局限性总结如下：（1）本研究专注于开发准确的脑龄估计模型，主要基于健康人队列，并没有使用患病群体的数据。在健康队列上建立一个高性能的机器学习模型是将其应用于患病队列的第一步，也将是我们未来工作。（2）我们还考虑了最后一个全连接层的性别信息，由于结果没有得到任何改善，因此没有报告结果。在未来，我们将研究在哪里以及如何在迁移学习模型中融合性别信息。（3）如表1所示，我们研究中使用的数据集并不是最大的数据集（文献[35]中的研究使用了19687名年龄为44-80岁的受试者）。收集一个大型数据集是一项挑战，尤其是涵盖0-100岁的寿命分布。未来，我们将继续收集数据集，以评估本方法在不同数据集下的性能。（4）如表4所示，我们的数据集是不平衡的。30-60岁的样本数量小于其他年龄组的样本数量，产生了最大的MAE（5.12岁）。未来，我们将通过对训练样本重进行新采样或使用数据扩充方法来平衡数据集。（5）将本方法与文献中的其他研究进行公平比较是一项挑战，因为不同的研究使用了不同的数据集、预处理和训练模型，而且目前还没有用于大脑年龄估计的基准数据集。我们在表1中总结了文献中相关研究的表现。我们的结果（MAE:2.70岁）低于其他具有寿命数据的研究（包括年轻人和老年人）。（6）我们提出的方法可以根据图谱计算整个寿命内每个脑区的预测误差，如图11所示。然而，在分割的大脑区域上，预测误差和归一化的大脑体积之间没有发现显著的相关性。结果表明，基于局部图像块解释年龄预测的机制可能不同于其他间接解释方法，例如基于以全脑图像为输入的梯度计算的解释图。一个未来的方向是研究直接解释和间接解释方法之间的差异及其与大脑形态学中其他自然变量的相关性。

总之，我们提出了一种使用卷积神经网络进行脑龄估计的全局-局部迁移学习方法，具有两条路径：提取全局上下文信息的全局路径和提取局部详细信息的局部路径，两者通过注意力机制进行融合。本方法可以实现最先进的性能，并可以突出信息最多的区域。未来的工作包括使用大型平衡数据集，将性别信息与MRI融合，并将该模型应用于患病受试者的MRI数据。

补充

我们提出的方法可用于在带有病灶的脑部MRI数据（例如脑肿瘤的MRI图像）上进行脑龄预测。肿瘤MRI的生物年龄不可用，只能从放射科医生的主观评估中获得生物年龄，这是一个耗时且主观的过程。在本文中，我们训练机器学习模型用于实际年龄估计，而不是生物年龄估计。

我们从BraTS收集大脑MRI数据，并且只使用大脑年龄可用的受试者。最后，共有382名受试者，年龄在17.4至86.6岁之间。我们将四种模式：T1w、T1GD、T2w、T2-FLAIR连接到具有多个通道作为输入的图像上。

我们使用与在健康队列上进行的实验相同的配置：在BraTS数据集上应用5折交叉验证，本节报告了三个平面的融合结果。表7显示了本方法与不同的基线模型、最先进的神经网络和最近发表的两个脑龄预测模型的性能比较。我们提出的方法在17个模型中取得了最好的性能。主要原因是：（1）我们提出的方法在局部图像块上预测脑龄。因此，它可以捕获患有肿瘤的受试者的非肿瘤大脑区域的大脑年龄信息；（2）通过注意力机制学习全局上下文信息，通过计算健康区域和肿瘤区域之间的相似性，可以自动找到肿瘤区域，消除肿瘤造成的影响。

表7. 基于BRATS数据集的五折交叉验证的脑龄估计方法与统计方法的比较

与第5-D节类似，我们还训练了具有多个图像块大小的全局-局部迁移学习，并可视化了图中信息量最大的区域（图12）。研究表明，显著的大脑区域与肿瘤区域不重叠，表明预测的年龄主要来自非肿瘤大脑区域。

图12.所提出的用于脑肿瘤受试者大脑年龄估计的全局-局部迁移学习发现的信息量最大的大脑区域。红色区域是由专家标记的肿瘤区域。