分享

12+单细胞+泛癌生信思路,要素丰富,思路新奇,这篇文章也太值得了!!!

 智汇基因 2023-05-20 发布于广东

导语


微血管内皮固有地控制着恶性肿瘤的营养物质输送、氧气供应和免疫监测,因此代表了癌症的生物学前提和治疗脆弱性。近年来,细胞衰老已成为实体恶性肿瘤的一个基本特征。特别是,据报道,肿瘤内皮细胞获得了衰老相关的分泌表型,其特征是促炎转录程序,最终促进肿瘤生长和远处转移的形成。因此,作者假设肿瘤内皮细胞(TEC)的衰老是精确肿瘤学中生存预测和免疫治疗疗效预测的一个有前途的靶点。

1. 肿瘤环境中个体细胞群的衰老状态

在本研究中,作者假设TEC中与衰老相关的转录组变化是预测癌症生存率和预测免疫治疗反应的潜在靶点。为了证明这一假设,作者实现了五个已发表的不同癌症实体的单细胞核糖核酸测序(scRNAseq)数据集,包括肺癌、癌症、结直肠癌、前列腺癌症和膀胱癌症。作为细胞衰老的衡量标准,作者使用了一个已建立的衰老相关基因集(FRIDAN.senescence.UP)。在第一种方法中,作者提取并聚类了所有数据集的高质量细胞,如UMAP图所示(图1a–e)。基于FRIDMAN.SENSCENCE.UP对这些细胞进行的后续GSVA表明,TEC在肿瘤环境中表现出比肿瘤细胞或其他细胞群更高的GSVA评分,包括髓细胞、T细胞和B细胞,但癌相关成纤维细胞除外(CAF;图1a-e)。因此,TEC在恶性肿瘤的血管室中表现出最高的细胞衰老水平。

图1 评估肿瘤环境中单个细胞类型的衰老状态

衰老细胞的特征是表型与能够调节不同细胞激活状态的生物活性物质的分泌有关。为了进一步探讨衰老TEC与肿瘤环境中其他细胞群之间的整体联系,作者根据三个scRNAseq数据集(E-MTAB-6149,肺癌)、(GSE125449,肝癌)、,和(GSE195832,头颈部癌症)含有大量内皮细胞。作为细胞-细胞相互作用的衡量标准,作者通过网络分析和模式识别方法评估了HS-TEC的通信网络。在这里,作者证明,与LS-TEC相比,HS-TEC在肿瘤微环境中建立了更高数量的相互作用,主要与免疫细胞通信。为此,HS-TEC释放细胞因子巨噬细胞迁移抑制因子(MIF)和β-半乳糖苷结合凝集素(半乳糖凝集素),利用五种途径,包括MIF-CD74/c-X-c基序趋化因子受体4(MIF-CD74+CXCR4)、MIF-CD74.CD44(MIF-CD74+CD44)、半乳糖凝集素9-TIM3,和半乳糖凝集素9-CD44(LGALS9-CD44)。因此,作者的数据表明,TEC的衰老通过涉及MIF和半乳糖凝集素依赖性途径,特别促进与免疫细胞的相互作用。

2. 基于内皮细胞衰老的泛癌转录组特征的研究

下一步,作者旨在生成一个专门反映衰老TEC特征的泛癌基因特征(简称EC.SENESCENCE.SIG)。为此,使用18个包含15个癌症实体的scRNAseq数据集对TEC的基因表达水平和GSVA评分(基于FRIDMAN.SENESCENCE.UP)进行Spearman相关分析。在这18个数据集中,基因与TEC中的GSVA评分呈正相关(Spearman R > 0和FDR < 0.05)被认为是“Gx”,代表衰老相关基因。内皮细胞中上调的基因(logFC ≥ 0.25和FDR < 0.05)被认为是“Gy”,代表特定的内皮细胞基因。为了获得特定的内皮衰老调控基因,“Gx”和“Gy”交叉产生“Gn”(n = 1–18)(图2A)。G1-G18表示18个scRNA-Seq数据集中各自的Gx和Gy的交叉点。随后,计算了从“G1”到“G18”的每个基因的Spearman相关系数的几何平均值。最后,只有Spearman相关系数值的几何平均值高于0.2的基因被过滤到EC.SENESCENCE.SIG中,最终包含102个基因。为了定义EC.SENESCENCE.SIG的功能类别,作者在R'clusterProfiler’包中使用了两种用于基因注释的工具,称为GO通路和反应组通路数据库。在这里,作者发现EC.SENESCENCE.SIG主要由与细胞粘附和相互作用相关的途径相关的基因富集,如“整合素-细胞表面相互作用”、“层粘连蛋白相互作用”,“细胞-基质粘附”、“粘附分子连接”和“整合素结合”(图2B),这与先前报道的衰老内皮细胞的粘附特性增强以及HS-TEC与其他非恶性细胞的细胞-细胞通信增加一致。

图2 通过泛癌症scRNAseq分析建立肿瘤内皮细胞特异性衰老相关转录组特征

3. 使用EC.SENESCENCE.SIG对信号通路、免疫细胞反应和患者生存期的泛癌预测

为了进一步探讨不同癌症实体中EC.SENESCENCE.SIG的生物学特性,作者将GSVA方法应用于EC.SENESCENCE.SIG,以计算33个癌症实体中每个癌症基因组图谱(TCGA)患者的转录组签名得分。总的来说,作者的分析结果表明,实体恶性肿瘤包括肾透明细胞癌(KIRC)、胰腺癌症(PAAD)或甲状腺癌症(THCA)的EC.SENESCENCE.SIG评分较高,而血液恶性肿瘤如大B细胞淋巴瘤(DLBC)或急性髓细胞白血病(LAML)的评分较低。根据EC.SENESCENCE.SIG将TCGA泛癌队列中的患者细分为高GSVA评分和低GSVA评分(中值),通过基因集富集分析(GSEA)对每种癌症类型的先前报告的促癌途径进行富集研究。作者的结果表明,根据EC.SENESCENCE.SIG,使用GSEA对所有癌症类型进行分析,几乎所有分析的原癌信号通路在GSVA评分较高的恶性肿瘤中都得到了丰富(图3a)。

图3 EC.SENESCENCE.SIG的泛癌分析

接下来,作者评估了TCGA队列中基于EC.SENESCENCE.SIG的GSVA评分与患者生存率之间的关系。我们发现,在10多种癌症类型中,高GSVA评分与总生存率受损(OS)显著相关,包括胰腺癌症(PAAD)、肺鳞癌(LUSC)、胃癌(STAD)和肾乳头状细胞癌(KIRP)。只有在甲状腺癌(THCA)中,与低GSVA评分相比,GSVA评分高的患者表现出OS改善。此外,11种癌症的高GSVA评分与较短的无进展生存期(PFS)相关,而只有在肾癌(KIRC)中,高GSVA分数与增强的PFS相关(图3b)。最后,作者使用Cibersort[17]评估了GSVA评分(基于EC.SENESCENCE.SIG)与TCGA队列中22个免疫细胞亚群在不同癌症类型中的浸润的相关性。作者发现高GSVA评分与免疫细胞明显改变的肿瘤浸润有关。特别是,几乎所有癌症类型的GSVA评分与(致瘤)M2巨噬细胞肿瘤浸润呈正相关,与(抗肿瘤)CD8+T细胞肿瘤浸润呈负相关(图3c)。总之,作者建立了一个内皮特异性、衰老相关的转录组特征,作为原癌细胞信号转导、肿瘤促进免疫细胞反应失衡和患者生存受损的泛癌预测因子。

4. 使用EC.SENESCENCE.SIG预测抗PD-L1/PD-1或抗CTLA-4免疫检查点阻断反应

关于高EC.SENESCENCE.SIG GSVA评分与促进肿瘤免疫细胞浸润失衡之间的相关性,作者进一步假设,这种转录组学特征也提供了预测抗PD-L1/PD-1或抗CTLA-4免疫检查点抑制剂治疗反应的可能性。肿瘤突变负荷(TMB)此前已被确定为抗PD-L1/PD-1免疫治疗反应的可靠泛癌预测因子。因此,作者首先评估了TCGA队列中EC.SENESCENCE.SIG和TMB之间的相关性。在这里,我们发现TMB与大多数癌症类型(BRCA、HNSC、CESC、LIHC、STAD、MESO、LUSC、KIRP、LUAD、UVM、PRAD、UCEC和SKCM;图4a)中的EC.SENESCENCE.SIG呈负相关,这强烈表明该转录组学特征可以预测免疫治疗反应。因此,作者在三个批量RNAseq数据集中使用GSVA和GSEA研究了EC.SENESCENCE.SIG在免疫治疗应答和耐药患者中的富集,并报告了免疫治疗的临床结果。在这里,作者发现与免疫疗法应答患者相比,免疫疗法耐药患者的GSVA评分更高。与这些结果一致,在GSEA分析中,EC.SENESCENCE.SIG在抗PD-L1/PD-1或抗CTLA-4免疫疗法耐药的患者中显著富集。

图4 应用EC.SENESCENCE.SIG预测抗PD-L1/PD-1免疫疗法的疗效

除了在大量RNAseq数据中进行这些分析外,作者还从两个免疫治疗scRNAseque数据集(包括肾癌(PRJNA705464)和基底细胞癌(GSE123813)患者)中探讨了内皮细胞中的GSVA评分(EC.SENSCENCE.SIG)。根据作者之前的研究结果,来自免疫疗法耐药患者的内皮细胞表现出EC.SENESCENCE.SIG基因的富集(图4b,c)。

此外,作者使用了13个包含抗PD-L1/PD-1或抗CTLA-4免疫疗法结果的批量RNAseq数据集,其中仅选择治疗幼稚的患者进行进一步分析。在这十三个队列中,七个队列(n = 775,80%用于训练集,20%用于验证集)合并为一个训练队列,而其他六个队列用于测试开发的最终模型的预测能力(图4d)。为此,作者使用了十种不同的机器学习算法,并使用五次重复的十倍交叉验证对每个模型的参数进行了优化。随后,作者估计了验证队列中这些模型的曲线下面积(AUC)值。由于这些数学过程,我们最终选择了“KKNN”机器学习算法模型,该模型提供了0.72的最高AUC(图4e,f)。在六个外部队列中测试该EC.SENESCENCE.SIG模型的预测准确性,作者发现这些队列中的AUC值在0.66到0.79之间。

5. “EC.SENSCENCE.SIG”相关泛癌预测模型的构建和验证

为了优化EC.SENESCENCE.SIG用于泛癌生存预测,作者使用该转录组特征生成了LASSO惩罚Cox比例风险回归(LASSO-Box)模型。首先,将EC.SENESCENCE.SIG的102个基因纳入LASSO分析,并在泛癌TCGA队列中进行十倍交叉验证,然后确定50个非零系数基因进行进一步分析。然后,作者利用这50个基因,在TCGA泛癌训练集中使用逐步参数选择方法,建立了Cox比例风险回归模型。为了优化EC.SENESCENCE.SIG用于泛癌生存预测,作者使用该转录组特征生成了LASSO惩罚Cox比例风险回归(LASSO-Box)模型。首先,将EC.SENESCENCE.SIG的102个基因纳入LASSO分析,并在泛癌TCGA队列中进行十倍交叉验证,然后确定50个非零系数基因进行进一步分析。然后,作者利用这50个基因,在TCGA泛癌训练集中使用逐步参数选择方法,建立了Cox比例风险回归模型。

图5 EC.SENESCENCE.SIG相关泛癌模型在TCGA中的预测性能

此外,EC.SENESCENCE.SIG相关风险评分显示出对包括BRCA在内的其他各种癌症类型的总生存率具有很强的预测能力。为了进一步证实该风险评分的预后价值,作者在几个外部验证队列中使用相同的公式计算了风险评分。这些EC.SENESCENCE.SIG相关风险评分在预测这些数据集中的患者生存率方面也表现出良好的表现(图6a–i),表明作者的风险评分是各种癌症的可靠预测指标。

图6 EC.SENESCENCE.SIG相关泛癌模型在外部队列中的预测性能

6. 建立“EC.SENESCENC.SIG”相关风险评分诺模图

为了进一步增强上述风险评分的预测能力,作者在TCGA泛癌队列中生成了一个结合临床疾病分期和EC.SENESCENCE.SIG相关风险评分的列线图评分(图7a)。癌症诊断后前五年的疾病特异性生存率(DSS)校准曲线表明,预测的生存概率与实际生存率高度一致,表明该列线图在生存预测中的稳健性(图7b)。此外,描述列线图评分对TCGA泛癌队列总体生存率的影响的单变量Cox分析表明,列线图得分与大多数类型癌症的生存率受损相关(图7c)。重要的是,在TCGA训练集和测试队列中,诺模图评分预测的时间依赖性AUC表现优于单独的EC.SENESCENCE.SIG相关风险评分(图7d)。此外,该诺模图评分在不同癌症实体的外部验证数据集中显示了良好的预后性能(图7e)。最后,作者进行了一项预后荟萃分析,以检验这十个训练集和验证集的综合预后价值。在这里,列线图评分是癌症患者总体生存的一个重要风险因素(合并HR = 2.61,P < 0.001; 图7f)。

图7 EC.SENESCENCE.SIG衍生诺模图特征预测泛癌预后的有效性评估

7. EC.SENESCENCE.SIG的预后特征选择

为了促进EC.SENESCENCE.SIG在生存预后评估中的临床应用,作者使用了三种基于机器学习的算法,包括Random Forest、extreme gradient boost(XGBoost)和LASSO特征选择,从EC.SENESCENSIG中的所有基因中选择最重要的特征。为了预测TCGA泛癌队列的总体生存率,作者通过LASSO鉴定了50个基因,通过随机森林鉴定了9个,通过XGBoost鉴定了9种。随后,作者进行了交叉,获得了三个常见的基因,包括整合素亚单位α5(ITGA5)、转谷氨酰胺酶2(TGM2)和筋膜肌动蛋白结合蛋白1(FSCN1)。接下来,作者分析了TCGA队列中20种癌症类型的肿瘤和正常组织中这三个基因的差异表达。在这些基因中,与正常组织相比,FSCN1在所有癌症类型中上调,而ITGA5和TGM2仅在70%的肿瘤中上调。最后,作者重点研究了这三个基因与33种癌症患者生存预后之间的关系。在这里,作者发现FSCN1和ITGA5的高表达与十多种癌症的生存受损有关,TGM2的高表达也与五种以上癌症的不良预后有关。总之,作者的结果表明来自EC.SENESCENCE.SIG的这三个中心基因可能是预测泛癌的生物标志物。

总结

总之,作者的研究为恶性肿瘤血管室中与细胞衰老相关的各种分子和细胞过程提供了新的见解。从翻译的角度来看,本研究建立的内皮细胞相关、衰老相关的泛癌基因标志EC.senescence.SIG可能有助于精确肿瘤学的生存预测和免疫治疗反应预测。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多