生信图书馆
文献简介 发表年份:2022 影响因子:9.2 公众号回复“原文”领取本篇文献-文献编号0729 研究背景 影响肺腺癌(LUAD)预后的一个重要因素是肿瘤转移。研究表明,循环肿瘤细胞(CTC) DNA异常甲基化与肿瘤转移相关。基于CTC中在DNA甲基化中起重要作用的基因,作者建立预测肺腺癌预后的风险模型,并为肺腺癌的治疗提供策略。 # 数据来源: # 研究流程: 主要结果 # 1.鉴定差异甲基化驱动基因 从GSE74639数据集的CTC和原发肿瘤样本中共提取了2643个DEGs。其中92个DEGs在CTC样本中显著上调(图2A),富集于血小板和凝血通路(图2B)。2551个DEGs在原发肿瘤样本中显著上调,主要参与RNA剪接和核酸运输(图2C)。此外,分析了TCGA-LUAD队列转移和非转移组织相关的DEGs,获得1377个DEGs (图2D)。将两组DEGs取交集,得到176个与转移相关的重叠DEGs(图2E)。176个基因中有158个基因获得了甲基化探针数据。通过热图对GSE74639(图2F)和TCGA-LUAD队列(图2G)中158个基因的转录组数据进行了可视化。通过与R0和p0.05的相关性分析,发现了36个潜在的DMGs,其中6个代表用散点图表示(图2H-M)。 # 2.风险评分模型的构建 对36个甲基化驱动的DMGs进行了单变量Cox回归分析和时序检验(图3A),筛选了10个有预后价值的DMGs。利用随机森林算法估计10个基因的重要性,排除了RPL39L和PCNA (图3B)。通过自由组合,剩余8个DMGs有255个组合。使用GMM和ROC分析进行聚类后,发现Cluster 8的组合具有最优的预测性能(图3C)。Cluster 2的异常值组合MRPL51 SLK PRC1具有最高的AUC,而Cluster 8的3个基因均存在于各模型中。为获得简化模型,最终选择MRPL51 SLK PRC1组合作为预后模型。采用多因素Cox回归建立风险评分模型。TCGA-LUAD、GSE42127和GSE72094模型的C-index分别为0.6341、0.6771和0.6396,表明预测精度较高(图3D)。三个队列的tROC曲线显示,风险评分模型在预测患者OS方面非常成功(图3E)。作者为TCGA-LUAD队列中的每例患者分配了风险评分,并根据中位评分确定了高风险组和低风险组。根据KM曲线,高风险组患者的OS时间比低风险组短(图3F)。风险图显示高风险患者的生存状态较差,三种模型基因在高风险组中表达上调(图3G)。TCGA-LUAD队列的1、3和5年生存率ROC-AUC值分别为0.68、0.64和0.58,表明对LUAD患者模型具有相当的预测效度(图(3H)。 # 3.风险评分模型是LUAD患者生存的独立预后 TCGA-LUAD、GSE42127和GSE72094研究的饼状图显示了风险评分、年龄、阶段和其他特征的变化,结果显示,除了性别之外,高风险组和低风险组在所有参数上都存在显著差异(图4A)。与图4B中的性别、年龄和分期相比,风险评分的预测准确性最高。另外的单变量和多变量Cox回归分析表明,风险评分是LUAD生存的独立预后因素(图(图4C, D)。作者建立了一个列线图(图4E),并通过校准分析确定其在预后方面是准确的(图4F)。根据tROC曲线分析,列线图优于其他变量(图4G)。此外,DCA曲线显示,在大多数阈值下,列线图对3年生存率是可行的(图4H)。 # 4.三个模型基因的功能富集 从HPA数据库中检索到三个模型基因蛋白(MRPL51, SLK, PRC1)的免疫组织化学数据,发现它们在肺癌中表达上调(图5A)。根据研究,三个模型基因的表达和甲基化水平呈负相关(图5B-D)。此外,作者分析了三个模型基因的CNVs(图5E)。MRPL51更容易出现CNV扩增,而SLK和PRC1更容易出现CNV缺失。根据metascape富集分析(图5F),低风险组升高的基因多与抗原呈递和免疫应答相关,而高风险组升高的基因一般与细胞周期和DNA复制相关(图5G)。在GSEA富集分析中,细胞周期和p53信号通路与高风险评分相关(图5H),而与低风险评分相关的免疫功能通路包括哮喘、自身免疫、造血细胞系和自身免疫性甲状腺疾病(图5I)。 # 5.高风险人群和低风险人群的免疫状况 风险评分和免疫学评分呈负相关(图6A)。此外,高风险组的肿瘤纯度较高,而低风险组的免疫活性增强(图6B)。根据ssGSEA分析,除MHC1外,免疫通路在低风险组中较活跃。此外,在抗原呈递和肿瘤免疫方面,两组之间存在统计学显著差异(图6C)。高风险组和低风险组在侵袭肿瘤的免疫细胞分布上表现出明显的差异(图6D)。特别是,与低风险组的TME相比,高风险组的TME包括更多的Treg、M0巨噬细胞、M1巨噬细胞和活化的CD4 T细胞(图6E)。在热图中显示不同组的免疫细胞的地形图(图6F)。免疫检查点活性标志物中,高风险组的CXCL10、GZMB和IFNG水平升高,而低风险组的TBX2和TNF水平下调(图6G)。作者分析了风险评分与标志通路激活的关系。多个促癌通路以及细胞周期过程与风险评分相关,但多个代谢和免疫相关通路与风险评分无关(图(图6H)。 # 6.高风险人群和低风险人群的基因组变异 鉴于TMB的临床重要性,作者检查了TMB和风险评分之间的关系,并证明了显著的正相关 (图7A-C)。选取TMB >30 mb的31个基因,用瀑布图直观地展示(7D-E)。森林图显示突变频率最高的23个突变基因。高风险组的所有23个基因的突变频率均增加(图7F)。这23个基因表现出突变共线性(图7G)。考虑到CNV可能导致染色体改变,进一步研究风险评分与CNV之间的关系。高风险组CNV的扩增和耗损明显增加(图8A,B)。高风险组和低风险组CNV的形态如图8C所示。 # 7.潜在有效小分子药物及化疗耐药预测 从CTRP2.0和PRISM数据库中检索到6个CTRP2.0衍生物(BI-2536、GSK461364、KX2-391、紫杉醇、rogosertib、SB-743921)和5个PRISM衍生物(卡巴他赛、多西他赛、伊博赛尼、伊斯匹尼布、利特尼布)。在低风险组中,所有11种衍生物均显示出较高的AUC值(图9A, B)。紫杉醇和多西他赛这两种临床常用药物已被证明对高风险患者有效(图9C,D)。作者还研究TCGA-LUAD队列对五种常用化疗药物(顺铂、多西他赛、吉西他滨、紫杉醇和长春瑞滨)的敏感性。结果表明,低风险组患者对化疗的敏感性较低,因为低风险组的五种药物IC50值显著高于高风险组(图9E)。 # 8.免疫治疗反应预测 作者对GSE135222接受抗PD-1治疗的NSCLC患者数据集进行了更全面的评估,发现具有高风险评分的患者生存时间较短 (图10A)。在GSE126044数据集中,在对免疫治疗有应答的患者中观察到风险评分降低(图10B)。此外,卡方检验表明,低风险组对抗PD-1治疗的反应率高于高风险组 (图10C)。在IMvigor210数据集中,高风险评分患者的生存结果较差(图10D),抗PD-L1治疗有应答的患者评分较低(图10E)。根据卡方检验,低风险组对抗PD-L1治疗的应答率较高(图(图10F)。每例患者的新抗原和TMB数据被纳入IMvigor210队列。为了理解低风险评分患者为何更容易接受免疫治疗,作者评估了风险评分、新抗原和TMB之间的关系。在图10G-H中,发现TMB和新抗原与风险评分呈负相关,并且在低风险组中显著增加。TIDE评分显示TCGA队列中的低风险组患者对抗PD-1治疗更敏感(图10I)。子类映射(FDR=0.025)也支持这个结果(图10J)。这些数据表明,风险评分模型可以帮助肺癌患者做出治疗决策,低风险评分的患者也可能从免疫治疗中获益更多。 结论 综上所述,本研究基于CTC的DEGs创建了肺腺癌的预测风险评分模型,并识别了高、低风险个体之间的生物学功能、TME、遗传变异和临床结局的差异。该风险评分模型可以预测对化疗和免疫治疗的敏感性。看完之后小伙伴们应该能看出来,文章在思路上跟以往的预后模型构建类似,能发到9 与研究热点的选择有很大关系。 馆长会持续为大家带来最新生信思路,更多创新性分析思路请点击链接。想复现这种思路或者定制更多创新性思路欢迎直接call馆长,馆长竭诚为您的科研助力! |
|