分享

快来围观新鲜出炉的单细胞+预后模型生信文章,了解最新生信分析进展

 智汇基因 2022-04-20

导语

这篇生信文章主要讲的是单细胞和体细胞RNA测序的综合生信分析确定了一个基于B细胞标记基因的特征,用于预测肺腺癌的预后和免疫治疗反应。B细胞作为肿瘤微环境的重要组成部分,存在于肿瘤的各个阶段,在抗肿瘤免疫和肿瘤发生发展中发挥着重要作用。

1.B细胞标记基因表达谱的鉴定

经过数据处理和筛选,作者获得了三个LUAD样本的3583个细胞的基因表达谱,用于后续生信分析。作者通过使用2000个可变基因进行PCA来降低维度(图1a),并使用Seurat确定了九个细胞簇(图1b)。每个簇上的细胞类型注释是通过将每个簇中的差异表达基因与文献报道的标记基因来定义的,并且簇4和簇6中的细胞被归类为B细胞(图1c)。此外,作者还发现这两个簇有不同的基因表达谱,其中基因在九个簇之间的基因有差异表达(图1a)。结果,作者发现了258个LUAD的B细胞标记基因。然后,作者进行了GO和KEGG通路富集分析来探索这些标记基因的生物学功能。GO通路富集分析显示B细胞标记基因主要与中性粒细胞激活和中性粒细胞脱粒的生物学过程有关(图1b)。KEGG通路富集分析显示,B细胞标记基因主要参与吞噬体和抗原加工和呈递的通路(图1c)。

图1 单细胞RNA预测鉴定B细胞标记基因

2.基于B细胞标记基因的预后特征构建

为了确定基于B细胞标记基因的预后特征,作者使用TCGA队列作为训练集。作者首先进行了单变量Cox比例回归分析,发现72个B细胞标记基因与OS在统计学上的显著相关(P<0.05)。接下来,用LASSO Cox回归模型计算出最有用的预后基因,并选择了一个高于最低标准的SE,得到一个包含27个基因的模型。最后,采用了逐步Cox比例风险回归模型,确定了最后一组九个基因。随后,建立风险评分,并计算出每个病人的风险分数,根据中位截至点将病人分为 分为高风险组(n = 250)和低风险组(n = 250)(图2a)。热图显示了登记的九个基因的详细表达水平(图2b)。Kaplan-Meier生存分析显示,高风险患者的总生存率明显低于低风险患者(P < 0.001;图2c)。作者使用 2年、3年和5年后的OS的时间依赖性,ROC曲线评估了预后特征的预后准确性。这些时间的AUC值分别为0.722,0.718,和0.693。(图2d)。 

图2 TCGA数据库中B细胞标记基因特征的构建

3.在独立队列中验证BCMGS的预后价值

为了验证单细胞BCMGS的预后预测能力,作者在六个独立的GEO队列中计算了每个病人的风险分数。根据表达值、生存时间和生存状态,使用 "survminer "软件包计算出风险评分的最佳截止点。并将每个队列中的患者被分为高风险组和 根据最佳分界点,将每个队列的患者分为高风险组和低风险组。Kaplan-Meier生存分析显示,低风险组的患者的OS明显高于高风险组。

图3 六个独立样本中B细胞标记基因特征的验证

4.BCMGS相关途径分析

作者首先进行了相关分析,以确定与风险评分密切相关的基因与风险分数密切相关的基因(Pearson |R|> 0.5。P < 0.001)(图4a),有28个正相关基因和42个负相关基因。然后,利用R包,作者对这些相关基因进行了GO 和KEGG通路富集分析这些相关基因。结果 结果显示,GO分析中,这些基因更多地参与有丝分裂的生物学过程(图4b)。KEGG分析进一步显示,这些基因更多的与细胞周期和糖酵解有关。(图4c)。

图4 密切相关基因的功能富集分析与B细胞标记基因相关

5.BCMGS与免疫细胞浸润和淋巴细胞受体重合的相关性

由于B细胞在抗肿瘤免疫反应中起着重要的作用。作者探讨了单细胞BCMGS与LUAD免疫细胞浸润和淋巴细胞受体重组多样性的关系。使用CIBERSORT 分析表明,高风险的LUAD患者分数的LUAD患者有较高比例的T cell CD4 memory activated、NK cells resting,巨噬细胞M0,肥大细胞激活和中性粒细胞,但T cell  CD8、T cell CD4 memory resting、单细胞、树突状细胞 静止的和肥大细胞静止的(图5a)。然后,肿瘤浸润的B细胞受体(BCR)和T细胞受体(TCR)的生信多样性。TCR的生信多样性用Shannon生信多样性指数(图5b-e)。作者发现丰富度和Shannon生信多样性指数的增加。BCR和TCR丰富度在低风险的LUAD患者中有所增加。这表明低风险评分的LUAD患者有较高的BCR和TCR组合。

图5 B细胞标记基因与免疫功能的相关性

6.BCMGS的炎症和免疫概况

作者分析了标志物与七个基因集(HCK、IgG、interferon、LCK、MHC-I、MHC-II和STAT1)之间的关联,代表了不同类型的炎症和免疫反应。这些基因集在TCGA数据集中的表达模式如图所示(图6a)。然后,作者进行了基因组变异分析(GSVA)来计算七个基因集的表达量,并研究标志物和每个基因集之间的相关性。结果表明,风险分数与HCK、IgG、LCK、MHCI、MHC-II有负相关关系。和MHC-II(图6b)。 

图6 TCGA队列中B细胞标记基因特征的初步和免疫学研究

7.标志物与免疫治疗反应的关系

单细胞TIBs在肺癌中发挥着抗肿瘤免疫作用,而基于B细胞的免疫治疗策略可能会提供给肺癌患者。作者进一步评估了单细胞BCMGS与免疫治疗反应的关系,在TCGA队列分析了该特征与广泛认可的免疫治疗生物标记的相关性。首先,在高危组和低危组之间进行了比较PD-L1的蛋白表达,肿瘤突变负担(TMB)和新抗原的数量。结果显示,高危患者的PD-L1蛋白表达水平明显高于低风险患者(图7a-c)。为了全面的评估,作者进一步加入了TIDE生信数据库分析,正如预期高危患者的特点是显著较低的TIDE评分、较低的T细胞功能障碍评分和较高的T细胞排斥评分(图7d-f),这表明,高危患者往往对免疫治疗反应更敏感。总的来说,这些结果显示,高风险的患者更有可能从免疫治疗中受益。

图 7 免疫治疗反应生物标志物的比较

小结

最后,作者用单细胞+预后模型的生信分析方式开发并验证了一种由 B 细胞标记基因组成的特征模型,可以作为有效的预后生物标志物并可能预测患者对免疫治疗的反应LUAD。作者的研究为我们提供了一个新的生信视角免疫细胞标记基因在预后和免疫治疗中的作用LUAD患者的反应。对单细胞+预后模型分析思路感兴趣的老师,欢迎扫码咨询。

生信分析定制服务

请扫描下方二维码

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章