分享

Delta影像组学,帮你轻松冲击10分 !

 阮朝阳的图书馆 2022-06-21 发布于浙江

图片

大家好,这里是平鑫而论专栏,我是鑫仔。我们继续影像组学高分文献系列!

今天分享一篇2020年发表于Cancer Immunology Research的题为“Changes in CT Radiomic Features Associated with LymphocyteDistribution Predict Overall Survival and Response to Immunotherapy inNon-Small Cell Lung Cancer” 的利用影像组学特征进行预测的影像组学文章。

本文使用常规 CT 扫描量化基线和治疗后扫描之间肿瘤和瘤周区域的影像组学特征变化(前后扫描特征差值),得到特征集合DelRADx。并进一步对 DelRADx 在预测 ICI 治疗应答,总生存期预测,与免疫浸润细胞丰度的相关性等方面的进行了分析。结果表明:ICI治疗后NSCLC患者的基线和治疗后CT扫描之间结节内外的动态纹理变化与临床获益相关。

值得一提的是,这篇文章是由凯斯西储大学Anant Madabhushi教授团队发表,该团队在影像组学以及深度学习领域做出了突出的贡献,让你一直看一直爽。鑫仔以后也会对Anant Madabhushi教授团队的影像组学相关文章进行追踪报道!不要错过哦~

期刊信息

图片

题目要素拆解

研究疾病:非小细胞肺癌NCSLC

应用算法:线性判别分析LDA(用于统计分析的类别判别)

研究类型:回顾性队列研究

数据集:139名患者;两个队列:ClevelandClinic Foundation(CCF),Universityof Pennsylvania Health System (UPHS)

研究目的:利用治疗前后影像组学特征改变集DelRADx预测NSCLC患者ICI应答及OS

结局:临床疗效(近期疗效:免疫治疗客观应答;远期疗效:OS),免疫浸润细胞丰度

背景知识

线性判别分析Liner Discriminate Analysis

首先,介绍一下本文的分类器算法:线性判别分析LDA是一种对有标签数据的一种非常经典的判别方法(有监督),同样属于我们上期提到的线性回归的范畴。其基本思想与PCA一样——降维!但不同点是运用LDA可以进行类的判别。

提问:什么叫判别分析?

回答:判别就是根据研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法,例如:在本文中,可以暂且理解为区分我们提取的影像特征是属于ICI应答还是ICI非应答。简单理解起来就是用我们的工具(影像组学特征)去判断ICI有没有应答(有 vs. 无)。

提问:LDA的目的是什么?

回答:保留两个类别的区分信息

举个栗子:下图为两组完全相同的数据提供了两种不同的投影方式,那么大家看看哪一种能更好的满足我们的标准呢?

图片

不难看出,右图要比左图的投影效果好,因为落在线上的右图红点和蓝点较为集中,且类别之间的距离明显。左图则在边界处数据混杂。由此可见,LDA的基本思路是将数据降维,并且将数据尽量分开。同时我们还能发现,投影的方向对分类结果十分重要。

提问:什么叫能将数据分开?

回答:相同数据降维后距离尽可能紧凑,不同数据降维后距离尽可能远。这个是不是和我们部门间的设置类似,部门内的要求大家团结一致,思想和步调统一,部门间要求大家功能尽量差异化,交集少,分的最开。如果说得好听一点就是数据投影后类内方差最小,类间方差最大

图片

提问:如何衡量投影的结果?

回答:其实就是找到投影方向W的最优解,Fisher提出的Fisher准则可以解决这个问题。

图片

公式中,m2、m1分别代表两个类别的均值,相减在空间上就是两个类别间得距离;S1、S2分别代表两个类别的离散值,相加在空间上表示两组点间的离散程度。为了分得开,我们希望分子越大越好,分母越小越好。最终通过优化,可以求出投影方向W。

图片

或者,也可以采用梯度下降法迭代求解。通过鑫仔的连环问答,相信大家已经对LDA已经有了一个初步的理解了。本文对DelRADx特征的判别筛选就利用了LDA,并采用梯度下降法进行100次以上的迭代求得权值W。

实验设计

图片

本实验主要设计流程如图

01 研究队列纳入 & CT获取

本文将两个研究所(CCF &UPHS)获得的139名患者的数据分为了三个队列,包括1个训练队列D1(=50)和两个验证队列D2(=62)和D3(=27)。CT数据从所有被纳入患者的基线影像和在经过6-8周ICI治疗后的首次CT获取。

图片

图片

02 影像分割 & 掩膜

由具有8年影像经验的一名专家利用3D SLICER软件对CT影像进行分割和掩膜。值得一提的是,在掩膜区域周围设置了由15个2mm环组成的30mm的半径的环,环的尺寸大小由相关指南决定。

03 特征提取 & 特征选择

利用MATLAB 2018b的内部开发工具箱从每个分割区域提取了99个纹理特征(二阶特征),495个统计学特征(一阶特征),和24个形状特征。随后将数据标准化到(-1,1)之间。按特征统计的百分比排序计算产生DelRADx特征集。

为了确定在特征选择步骤中识别的哪些预测特征是稳定和可重复的,研究者在复测RIDER肺CT数据集的背景下评估了DelRADx特征。将组间相关系数ICC的cutoff值>0. 8作为稳定和可重复的特征。在这些特征中,用Wilcoxon秩和检验进一步筛选出预测特征。

小注:

组内相关系数(ICC)是衡量和评价观察者间信度(inter-observerreliability)和复测信度(test-retest reliability)的信度系数(reliabilitycoefficient)指标之一。ICC等于个体的变异度除以总的变异度,故其值介于0~1之间。0表示不可信,1表示完全可信。一般认为信度系数低于0.4表示信度较差,大于0.75表示信度良好。

最终筛选出瘤内和瘤周的DelRADx纹理特征前八名如Table 3所示。

图片

模型构建

线性判别分析(LDA)分类器与特征选择步骤中确定的稳定和可判别的DelRADx特征结合使用。在训练集 D1 中,分类器在 70% 的数据上使用排名靠前特征进行训练,获得一系列权重向量。并用剩余30%数据进行验证。分类器的分类结果由ROC曲线的AUC指标评价。

模型评价

1. 差异和相关性分析:DelRADx特征可以预测ICI治疗的应答   Figure 2 & Figure 3A ICI治疗前后纹理特征差异分析
 

图片


Fig2. A-B: 两个周期ICI治疗前后,代表性无应答和应答患者的神经结节内Haralick熵(灰度共生矩阵GLCM特征) DelRADx特征的判别能力。结果显示:与应答者相比,治疗后无应答者Haralick熵增加。

Fig2. C-D: 一名无应答者和一名应答者患者在两个周期的ICI治疗前后,结节周围低频Gabor滤波(相当于加一个卷积核进行特征提取)DelRADx特征的判别能力。结果显示:与非应答者相比,应答者在治疗后显示出更显著的特征表达。

Fig3. A: ICI治疗前后应答者和非应答者最显著的8个影像组学特征Haralick熵变化
 
Figure 3B-C 聚类分析

图片


Fig3. B 显示了基于纹理特征表达的聚类图,用无监督的方式对纹理特征筛选结果进行评价。其中,x轴为筛选出的8个最佳纹理特征,y轴为训练集的50名患者。结果显示:纹理特征的差异表达可以反应应答者和非应答者。

Fig3. C 显示了特征的共识聚类图。左图,结合了结节内纹理和形状特征进行聚类;右图结合了形状、结节内纹理和结节周围纹理特征进行聚类。结果显示:训练集训练出的特征既稳定又能对ICI应答进行判别。

小注:
这篇文章运用了很多聚类分析,之后鑫仔会专门为大家在其它文章的背景知识部分对聚类分析进行介绍!

Table S1 AUC指标评价

图片


研究者随后对训练集和测试集的AUC指标进行评价。结果显示:D1 AUC=0.88,D2 AUC=0.85,D3 AUC=0.81,分类器在训练集和预测集中均表现出很好的预测能力。同时, AUC 随着切片厚度的增加而略有下降(本研究没有选取完全相同的切片厚度)。

2. 生存分析:DelRADx特征可以预测总生存期OS

TableS2D1数据集中8个最优影像组学特征(自变量)的单因素cox回归分析以及6个协变量

图片


结果显示:在训练集D1中,Haralick熵纹理特征在所有其他特征中拥有最高的HR。与高于中位数的患者相比,Haralick熵值低于中位数的患者的生存曲线存在统计学显着差异。此外,在 D2 中,OS与年龄、性别、种族、吸烟状况、组织学或 EGFR突变没有显着差异。
 
TableS3D1D2D3OS的多因素cox回归分析

图片


结果显示:影像组学差异评分(DRS)与D1,D2,D3均具有相关性。与性别,是否吸烟等其它混杂因素无关。
 
Figure4利用KM曲线进行生存分析

图片


结果显示:在验证集D2与D3中相应的Kaplan-Meier 生存曲线显示低和高 DRS 患者的OS 存在显着差异。且与性别,种族,吸烟,组织亚型,EGFR表达等混杂因素无关。此外,图中也显示了治疗中,肿瘤体积与OS的相关性。研究者随后做了肿瘤体积与DelRADx特征的多因素cox回归,并说明在D1,D2,D3数据集中,DelRADx特征是独立的生物标志物。
 
Figure S1& Table 4 治疗前PD-L1的分层分析预测OS

由于PD-1的表达仅从CCF数据集中的25名患者收集到,所以研究者在这里对影像组学模型预测ICI应答以及OS进行了亚组分析。Table S4显示患者基于不同的PD-L1值分为PD-L1高评分组以及PD-L1低评分组。PD-L1表达差异可以判别患者的OS(P=0.031),但是HR值没有显著差异。并且Spearman相关性分析显示,PD-L1表达与患者免疫治疗应答无相关性。

图片

若在Cox模型中将结节外周的Gabor滤波的 DelRADx特征与PD-L1评分结合,评分结果将显著与OS相关,并且HR有显著差异。FigureS1显示了亚组分析的KM曲线。

图片

结果说明:在PD-L1不能预测免疫治疗应答时,结合外周Gabor 滤波的DelRADx特征,可以提高预测能力。

3.  在相关病理切片样本中,DelRADx特征与TIL密度有关

研究者在CCF数据集中选取36个病例的组织标本进行H & E染色,并且从生物活检组织样本中提取了76个特征。利用配对Spearman相关分析对影像组学特征以及活检组织样本特征进行相关性分析。利用非监督等级聚类分析得出10个DelRADx特征可以用于区分ICI治疗的应答者和非应答者。
 

图片

FigS2A展示了与无应答者相比,应答患者的TIL细胞丰度(粉点表示)。

FigS2B结果显示:影像组学特征出现的两个层次的聚类(红色/绿色)与不同的TIL 密度表达相关。一个分类簇含有大多数响应者(90%),而另一个分类簇含有大多数无响应者(69%)。两者相比,无响应者的TIL细胞丰度低。以上结果证明了在无监督学习下,影像组学特征与TIL的相关性。
 

全文总结

本文通过ICI治疗前后CT扫描的差异影像组学特征提取,利用LDA算法,建立DelRADx特征,评估并证明了DelRADx特征可以(i)预测对 ICI 治疗的反应;(ii) 改善 OS 的预后;(iii) 与相应诊断活检样本上的 TIL 密度相关。在晚期 NSCLC 患者的个性化决策中,可以帮助表征该疾病的不同表型,并作为一种非侵入性方法来确定将从免疫治疗中获益最多的患者。

图片


本文的流程图鑫仔已为大家画好。本文的优势首先在于结合了结节内和结节周围的影像特征,所得特征的判别能力更强;其次,运用了两个独立的测试集验证结果,并做了非常详尽的模型评价,尤其是生存分析部分十分全面;再者,做了很多的相关性分析,论证思路完整,论证结构是非常值得大家学习的!
 
但文章也是由不少Bug存在的,首先,很多重要的数据图表没有列出,例如文中多次利用多因素cox回归,但并没有表格展示结果,这不免让人怀疑数据的真实性。

其次,文章主要是针对影像组学特征改变进行分析,对分类器判别能力的分析是有限的。还有就是影像的切片厚度不一,在Table S1中我们是可以看出切片厚度对结果是有影响的,不过对于回顾性研究来说,影像切片厚度不一是常有的事,文章的Table S1是值得学习的。

文中的LDA判别过程并没有详细提及,也会让人产生很多疑惑。需要注意的是,文章与免疫指标的结合偏简单,做影像组学研究对研究疾病的深刻掌握也很重要。
 
不过呢,这篇文章在其它部分写的还是很详细的,整个框架特别是评估过程值得学习!

本文之所以能够发到一区,我觉得主要优势在以下几点①ICI队列,在population上创新;②多个数据集的验证,证据级别直接又提高一个档次;③多区域(瘤内和瘤周区域)的玩法,在主变量X上创新;④免疫治疗疗效与OS,Y上创新,临床价值大;⑤结合免疫指标,结合免疫这个治疗热点(其实检测指标非常容易,常规);

其实这样一个研究在中国可复制性是极强的,国内临床样本丰富,如果有心,很快就能构建起相类似的队列,百余例样本,常规的CT扫描,常规的病理检测TIL, PD-L1表达等,常规的随访结局(治疗应答与OS);如果我们行动起来,至少经典二区感觉也是可以企及的。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多