从现在开始解读2018年4月的TCGA终结系列文章,因为涉及到的代码知识不多,我就不亲自出手了,会邀请我的几个学生来一一解读,当然,也欢迎广大粉丝投稿,运气的话有机会得到我的关注和指导。
2018年4月Immunity杂志上发表了文章The Immune Landscape of Cancer ,由34个单位共同合作完成。文章对TCGA中33种癌症,超过10,000个肿瘤样本进行了免疫原性分析,将所有肿瘤分成6种免疫亚型,即:
进一步分析:
分析流程step1. 下载TCGA平台33种癌症类型的6种分子平台数据(mRNA、microRNA、外显子测序数据;甲基化、拷贝数、蛋白质芯片数据) step2. 为全部非血液类癌症进行免疫表达特征(160种)评分,将TCGA全部肿瘤聚类成6种免疫亚型 step3. 根据DNA甲基化、mRNA和H&E图像分析确定白细胞类型及比例(用于评估免疫浸润细胞的组成) step4. 生存分析评估免疫亚型与预后的关系 step5. 分别以TCGA肿瘤类型、TCGA定义的分子亚型、6种免疫亚型分组,比较新抗原、病毒RNA表达、T细胞受体(TCR)和B细胞受体(BCR)、免疫调节因子(IM)表达与调控等特征(评估影响免疫原性和免疫浸润的因素间的关系)
step6. 鉴定与免疫浸润相关的体细胞变异(包括pathway, 拷贝数变异,driver mutation) step7. 评估性别与祖源是否对特定肿瘤类型的免疫反应有影响 step8. 鉴定控制肿瘤免疫应答的细胞内调控网络、参与形成肿瘤免疫微环境(TME)的细胞外通讯网络 癌症的免疫亚型计算160种免疫特征间的相关系数,聚类分析,得到5个核心模块免疫表达特征(巨噬细胞 , 免疫浸润淋巴细胞, TGF-β response , IFN-γ response, wound healing ) → 据此将TCGA中的非血液肿瘤聚成6种免疫亚型(C1-C6) → 6种免疫亚型中这5种免疫特征的分布情况。(图1A) 6种免疫亚型中肿瘤样本表现出的其它关键免疫特征(图1B,C) 每种肿瘤类型中免疫亚型的组成情况,图1D。 Figure 1. Immune Subtypes in Cancer 肿瘤免疫浸润的组成不同免疫亚型的主要免疫浸润细胞分布,图2A 白细胞比例(leukocyte fraction,LF)在不同免疫亚型间(图1C)和不同肿瘤类型间(图2B)存在差异。 肿瘤基质比例与白细胞比例的相关性在肿瘤类型中不同,图2C显示2种代表性的肿瘤。(该相关性在免疫亚型的差别见补充图2B)
通过TCGA的H&E染色图片分析估计出具有浸润淋巴细胞的肿瘤区域的空间比例,按免疫亚型查看,发现C2亚型的淋巴细胞浸润区比例最高,图2D。 Figure 2. Composition of the Tumor Immune Infiltrate 肿瘤免疫反应与预后6种免疫亚型OS生存分析(图3A):C3预后最佳;C1,C2虽然免疫成分多,但预后并不好;C4,C6免疫特征混杂,预后最差。(PFI结果见补充图3A) 计算5种免疫表达特征分数与OS的一致性指数,红色代表高风险。按免疫亚型和肿瘤类型分组(图3B),淋巴细胞特征与C1,C2的预后改善相关;5种特征中任何一个增加都会导致C3预后更差。
使用CoxPH建立免疫特征分数高低的生存模型,分数高低与生存显著相关,图3D是验证集的KM-polt,图3E显示模型的预测准确度。图3F说明添加肿瘤stage和tpye信息后模型预测更准确。 补充图3E,F讨论了其它免疫特征与OS的关系,某些肿瘤类型中免疫亚型与OS的关系 Figure 3. Immune Response and Prognostics 免疫反应与体细胞变异6中免疫亚型的免疫浸润(白细胞比例LF)与DNA损伤(包括CNV负荷、非整倍性、杂合性丢失LOH、同源重组缺陷HRD、肿瘤内异质性ITH)的相关系数热图,图4A。发现LF与C6和C2的相关性最强,从整体来看与非整倍性、LOH、HRD及突变负荷成正相关。 图B显示平均LF值在1-22号染色体上的观察值与预估值间的差异,左右图分别为拷贝数扩增和缺失,黑色部分代表差异显著。揭示了LF与拷贝数变异的相关性,如:chr1p扩增,LF高于预估值,缺失则LF低于预估值,据此进一步将该位置上的重要基因的CNV与免疫浸润相联系。
补充图4探讨了肿瘤内异质性ITH与预后、LF、免疫亚型间的关系。 将299个癌症驱动基因的突变与免疫亚型相关联,发现33个显著相关的基因,图C。 图D为LF-驱动基因变异火山图,x轴为基因变异与LF的多因素相关性(考虑了肿瘤类型和突变数量),y轴为显著性,橙色即为与LF显著相关的驱动基因变异。其中23个驱动基因变异与LF增加相关,12个与LF降低相关。 补充图4C分析了体细胞变异(突变+CNVs)对8种癌信号通路的影响。 Figure 4. Immune Response and Genome State 人口统计学因素及遗传变异与免疫反应考察了不同肿瘤类型中免疫细胞与性别和祖源的相关性,图4E。发现在某些肿瘤中,女性的PD-L1表达高于男性,非洲血统患者PD-L1表达较低。 免疫原性调查文章中的免疫原性主要讨论的是新抗原负荷,即SNV和Indel突变产生的预测能与pMHC结合并诱导免疫反应的肽。
突变与pMHC:图5A为与突变数量相关的pMHCs数量分布,标注了源于超过40个突变的pMHCs。99.8的pMHC由单突变产生,0.2%是由不同突变产生的相同pMHC。 常见pMHC:图5B为y轴表达共有pMHC的肿瘤数,标注了产生最常见pMHC的已知癌基因(PIK3CA, KRAS, BRAF等) 补充图5A,B讨论了pMHC数与预后的关系:在多数肿瘤中pMHC数与生存无关,但在某些免疫亚型中,pMHC数与PFI预后相关。 补充图5C讨论了病毒与肿瘤中免疫特征的关系,病毒含量会影响免疫细胞的组成。 Figure 5. The Tumor-Immune Interface 癌症中的适应性免疫受体库
根据RNA-seq数据评估TCR(T cell receptor)α和β、免疫球蛋白重链和轻链库。 发现TCR多样性值因免疫亚型而不同(图5C),C6和C2的多样性最高。(补充图5D展示了不同肿瘤类型的TCR多样性) 评估CDR3的α和β链,以确定具有相同TCR的患者频率。图5C为CDR3α-CDR3β pairs,颜色代表p值,圆的大小代表sample数目,至少在2种肿瘤中出现的α-β pairs有2812个。 检验SNV特异性pMHC-CDR3 pairs,图5D展示了206个pMHC-CDR3α pairs和196个pMHC-CDR3β pairs。(说明这些患者中抗原受体多,抗原少,多数T细胞抗原反应是由公共抗原介导)
在某些肿瘤类型中,TCR多样性与PFI改善相关,见补充图5F。 免疫球蛋白重链和轻链的多样性模式与TCR类似。 免疫调节剂的调控免疫调节剂(Immunomodulators, IM)基因的情况可以反映癌细胞对肿瘤微环境(TME)的调节。 IM基因的表达在免疫亚型中不同(图6A),图6B为亚型间差异最大的基因EDNRB和CXCL10的表达值。 许多IM的甲基化程度与表达值负相关,即表观遗传沉默(图6A),如图6C的C3亚型中的CD40基因。 294个miRNA可能是IM基因的调节因子,补充图6C。 拷贝数改变影响多个IM,并在免疫亚型中存在差异。C1,C2亚型中IM基因频繁扩增和缺失,C3和C5中IM基因变异较少(图6A)。KIR2DL3等基因在C5中明显缺失,CD40等基因常在C1中发生扩增(图6D)。
Figure 6. Regulation of Immunomodulators 免疫反应的网络调控免疫应答由肿瘤细胞、免疫细胞、基质细胞中的细胞内分子网络状态和细胞外通讯网络(包括细胞间直接互作、通过可溶性蛋白或细胞因子通讯)构成。 根据FANTOM5中记录的信息获得配体 - 受体,细胞 - 受体和细胞 - 配体对的网络,图A,B,C分别是提取的IFM-γ, TGF-β, T细胞的细胞外通讯子网络网络。展示了免疫亚型间的一些关联,例如C2,C3中,CD4 T细胞、CD8 T细胞和NK细胞都与IFM-γ及CCL5的表达相关;C2,C3,C6中,多种细胞都与TGF-β的表达相关…… 构建泛癌症转录调控网络,关联基因组事件 - 转录调控因子 - 下游靶基因 - 免疫浸润-预后 。使用Master Regulator(MR)和SYGNAL两种互补的方法,产生了2个转录调控网络:
综合2个调控网络,MR及SYGNAL中有7个共享的TFs,调节27个IM基因,推断AKAP9, HRAS, KRAS和PREX2基因突变影响IMs。 图7E展示免疫亚型-IM基因表达调控-肿瘤类型间的关系,可以鉴定不同免疫亚型内的IM基因调控因子。例如,C1和C2中的IM基因共同受BCL5B, ETV7, IRF1, IRF2, IRF4, PRDM1, 和SPIB调控;C3中IM受KLF15 and miR-141-3p调控…… 某些肿瘤中,bicluster的表达增加与预后相关,在KIRC, LGG, LUSC和READ中预后差,在SKCM中预后好。 Figure 7. Predicted Networks Modulating the Immune Response to Tumors 结果总结文章利用TCGA数据构建了癌症的免疫基因组学图谱:
数据和结果的补充表格下载地址:https://gdc./about-data/publications/panimmune (划重点!!!) 文章很清晰,做了pan-cancer的免疫亚型分类,然后把能用到的所有基因组指标和免疫指标都进行了分组比较。文章的数据量很大,用到的方法很多,方法介绍也写得很详细,需要时可以再详细了解;补充表格的数据有很多信息可以直接拿来用,避免重复分析一次。 |
|