【原】2020年的新预后模型套路发5分+SCI！

科研菌 2020-12-17

展开全文

Deep neural network classification based on somatic mutations potentially predicts clinical benefit of immune checkpoint blockade in lung adenocarcinoma基于体细胞突变的深度神经网络分类具有预测肺腺癌免疫检查点阻断临床效益的潜力

一、研究背景

许多体细胞突变已被证实可以预测肺腺癌(LUAD)的免疫检查点封锁(ICB)治疗疗效，但因不同研究的测试平台，临界值定义等存在差异，所以需要开发更有效的临床预测工具来确定最有可能从ICB治疗中获得疗效的患者。近年来，深度神经网络(DNNs)作为一种实现人工智能的新技术受到人们的关注，不仅可用于智能图像识别任务，还可以从基因表达谱中提取特征，获得与预后相关的生物标志物。

二、分析流程

三、结果解读

1.基于体细胞突变的DNN可以预测免疫疗法的临床效益

作者在TensorFlow(基于Python的机器学习框架)中使用了DNNs对训练集（MSKCC，n = 143）和两个验证集（MSKCC，n = 36和VAN ALLEN队列，n = 47）的测序数据分析了体细胞突变。DNN由一个输入层、两个隐藏层、一个丢失层和一个输出层，激活函数RELU，损失函数cross-entropy组成，learning rate和迭代次数分别设置为0.0001和3000。输入层由100个体细胞突变组成，输出层对应治疗效果（DCB和NDB）。DCB定义为完全缓解（CR），部分缓解（PR）或持续≥6个月的稳定疾病（SD）;NDB定义为持续<6个月或进行性疾病（PD）。下表为本篇研究所用到的五个队列，五个队列数据均在cbioportal数据库中获得。

Data source	Tumor	N	WGS	WES	NGS	RNAseq	Neoantigen	Clinical outcome
TCGA	LUAD	510	－	＋	－	＋	＋	OS、DFS
Broad	LUAD	183	＋	-	-	-	-
TSP	LUAD	163	＋	＋	-	-	-
MSKCC	LUAD with anti-PD-1 and/or anti-CTLA4 therapy	179	-	-	+	-	-	DCB、PFS、OS
VAN ALLEN	LUAD with anti-PD-1 therapy	47	-	+	-	-	-	DCB、PFS、OS

图1.深度学习模型流程图

图2.ab显示随着迭代次数增加，准确率逐渐增加和损失值逐渐减小。最后作者确定了23个体细胞突变作为DNN的输入层，两个不同的亚组C1（分别为n = 55、19和15）和C2（分别为n = 88、17和32）与治疗效果（DCB和NDB）显著相关。在DNNs模型中，C1和C2组的23个体细胞突变中TP53，KMT2D，EGFR和STK11突变显著。

接下来的ROC分析进一步评估了不同变量的预测效果，包括TP53，KRAS，STK11和EGFR突变，TMB和C1与C2。其中，C1和C2的预测效果最好，AUC=0.884，Youden指数为0.769(表示诊断试验发现真正的患病和非患病者的总能力)，证实了DNNs在预测免疫反应的能力上显著超过单基因突变和TMB，并在MSKCC队列中得到了验证，VAN ALLEN可能因为样本太小，效果无显著差异（图2.c）。作者接下来还使用了单因素COX分析了4个基因突变，TMB和DNNs与DCB的关系，只有TMB与DNNs与DCB显著相关；还比较DNNs模型和结合了4个基因和TMB(+PD-L1)的多变量模型的预测效果，DNNs模型预测效果均比其他两种模型更好。作者还发现DNNs预测不同的免疫疗法，以及在不同的EGFR突变状态下的预测能力都是稳健的。

图2.d显示训练集和验证集中大多数C1组患者对免疫治疗反应较好(DCB)，C2组患者对免疫治疗反应较差(NDB)。对于接受抗PD-1 / PD-L1治疗的患者，与C2组相比，DNN的C1组表现出更好的OS和PFS，并在验证集中得到了验证（图3）。最后作者纳入其他临床因素和遗传因素进行单变量和多因素COX分析，证实了DNNs模型是抗PD-1 / PD-L1治疗预后的独立预测因子。

图2.基于体细胞突变的DNNs在训练和验证队列中的预测能力的评估

图3.C1组和C2组预测ICBs的临床疗效的生存分析

2.C1组中有更多的免疫细胞浸润和IFNγ相关基因的表达

基于DNNs分析，作者将具有WES和RNAseq数据的TCGA-LUAD队列(n=510)分为两个亚组(C1=176；C2=334)。首先通过确定22种免疫细胞中免疫相关的mRNAs表达水平来研究C1组与TME之间的关联，发现参与炎症反应和IFNγ途径的mRNA在C1组中显著富集（图4.a）。在TCGA-LUAD的免疫相关基因中，CD8A、CD3D和CD4在C1组中显著上调（图4.b），与活化的效应T细胞和IFNγ途径有关的基因，如STAT1、CCL4、CXCL9、CXCL10，TBX21和IFNG也显著上调（图4.ab）。

接着，作者采用CIBERSORT分析了每个肿瘤样本中22种免疫细胞类型的相对丰度(图4.c)，发现C1组表现出更多的肿瘤浸润CD8+CTL。同样地，在C1组中，活化的NK细胞和M1巨噬细胞的数量显著增加，这些细胞可能有助于提高抗肿瘤免疫应答。在C2组中，M2巨噬细胞的数量显著增加，可能与抗PD-1治疗的无效应答有关(图4.d)。

图4.C1和C2组免疫细胞浸润分析

3.DNNs分类与PD-L1表达、免疫表型的相关性

作者接下来评估了来自TCGA-LUAD的RNA-Seq表达数据，并研究了C1/C2与PD-L1表达的相关性。免疫检查点的平均mRNA表达如图5.a所示，PD-1、PD-L1、PD-L2、 LAG3、VTCN1、IDO1和TIM3在C1组中富集。C1组的PD-L1mRNA和蛋白(来自TCGA反相蛋白芯片RPPA分析)表达显著增高，利用MSKCC队列中的PD-L1免疫组织化学(IHC)评分，进一步证实了C1组PD-L1的高表达。(图5.b)

为了确定DNNs预测抗PD-1/PD-L1治疗反应的能力，作者使用免疫表型分析来研究免疫表型评分(IPS)与 C1/C2组之间的相关性。免疫表型图(图5.c)显示了TCGA中四种类型(CTLA4_negative+ PD-1_negative，CTLA4_positive + PD-1_negative, CTLA4_negative + PD-1_positive, CTLA4_positive + PD-1_positive)的IPS，IPS即基于肿瘤免疫重要的成份表达情况进行打分，包括MHC分子、免疫调节因子、效应细胞和抑制性细胞。作者发现，在PD-1_neg+CTLA4_neg中， C1组的IPS低于C2组。有趣的是，在PD-1_neg+CTLA4_pos和CTLA4_pos+PD-1_pos中，C1组IPS显著升高(图5.d)。这些结果表明，C1组患者对抗PD-1/PD-L1治疗或抗PD-1/PD-L1和抗CTLA4联合治疗均有较好的反应。

接着作者在TCGA-LUAD队列分析了DNNs预测接受肿瘤切除、化疗或放治而没有免疫治疗的的预测能力，C1和C2组的OS和无病生存期(DFS)没有显著差异 (图5.e)。

图5.C1和C2组PD-L1表达与IPS的关系

4.C1和C2组具有显著差异的肿瘤突变负荷和突变谱

虽然TMB和DNNs都涉及到体细胞突变，但LUAD患者中的DNNs与TMB的关系尚不清楚。作者对三个独立的队列中的非同义突变与两种DNNs分类(C1：n=75、52和 176；C2：n=108、111和334)进行了比较。与C2组相比，C1组在Broad、TSP和TCGA队列中均表现出更多的非同义突变。作者使用癌症免疫组图谱 Cancer Immunome Atlas(https:///home)预测新抗原的信息，在TCGA队列中发现C1组的新抗原多于C2组，这些均有助于增强C1组患者对抗PD-1/PD-L1治疗的免疫反应(图6.a)。

作者进一步分析了C1组体细胞突变中四个碱基(A、 T、C和G)的突变特征。在颠换transversions(T>A、C>G、C>A和T>G)和转换transitions(A>G和C>T)中，C1 组的转换和颠换都显著高于C2组(图6.b)。作者也研究了这两个队列的突变谱状态，发现C>A颠换频率的增加、C>T转换频率的降低与C1组中的高突变显著相关，这一结果在 TCGA-LUAD队列中得到了进一步的验证(图6.c,d)。最后作者计算了Broad和TCGA队列中每个样本的transversions和transitions(Tv/Ti)比率，并观察到C1组具有较高的Tv/Ti(图6.c,d)，而已知transversions更可能会改变氨基酸序列，从而导致翻译蛋白的突变。

图6.C1和C2基团通过改变肿瘤的突变谱表现出不同的肿瘤抗原性

小结

本篇文章基于体细胞突变的深度神经网络分类提供了一种可靠的抗PD-1 / PD-L1治疗预测方法，并通过发现由DNNs得到的两种分类(C1、C2)与TMB，新抗原负荷，PD-L1表达和免疫细胞浸润之间的显著关联，验证了DNN可以用作ICB的预测工具。而且作者开发的DNNs预测模型不需要临界值，与TMB和多种单个突变标志相比，预测结果更稳健，更具有临床可操作性。