分享

6 分单细胞&免疫微环境特征生信思路

 昵称32772025 2022-07-02 发表于广东

临床生信之家目前有2种生信服务模式:

1.提供完整技术路线的设计和分析报告(包括原始数据,方法学,结果图及解读)

2.深度合作,协助完成从选题到发表的全过程,未达到协议目标,将全额退款!

 

扫码咨询相关分析套路的研究方法

今天跟大家分享一篇单细胞&免疫微环境特征基因生信文章思路。标题:A novel prognostic model based on single-cell RNA sequencing data for hepatocellular carcinoma。这篇文章从GEO数据库中的scRNA-seq数据集中鉴定了肿瘤组织和正常对照组织之间的不同细胞亚群的特征基因。采用加权基因共表达网络分析(WGCNA)算法探索TCGA数据库中与肿瘤最密切相关的共表达网络和关键模块。最终采用单变量Cox和最小绝对收缩和选择算子(LASSO)Cox回归来构建肿瘤免疫微环境TIME相关的特征基因风险模型。

图片

【摘要】

背景:免疫细胞浸润的肿瘤异质组成是肝细胞癌(HCC)治疗反应和预后的关键因素。然而,从基因和细胞水平全面了解肿瘤免疫微环境(TIME)仍然是一项重大挑战。

方法:HCC单细胞RNA测序(scRNA-seq)数据从基因表达综合(GEO)数据库下载,基因表达数据从癌症基因组图谱(TCGA)数据库和国际癌症基因组联盟(ICGC)数据库中检索。通过估计RNA转录物的相对亚群(CIBERSORT)进行细胞类型鉴定,以评估免疫浸润细胞的丰度。我们采用加权基因共表达网络分析(WGCNA)来构建基因共表达网络。进一步使用单变量Cox和最小绝对收缩和选择算子(LASSO)分析来构建风险模型。此外,通过qPCR评估模型基因的表达水平。

结果:我们基于scRNA-seq数据集(GSE149614)定义了25个细胞簇,这些簇被标记基因标记为各种细胞类型。然后,我们构建了一个加权共表达网络,共识别出6个模块,其中棕色模块与肿瘤的相关性最高。此外,我们发现棕色模块与单核细胞关系最密切(第21组)。通过单变量Cox和LASSO分析,我们构建了一个3基因风险模型(RiskScore=0.257*Expression CSTB  0.263*Expression TALDO1  0.313*Expression CLTA)。该风险模型在TCGA-LIHC和ICGC队列中显示出出色的预后预测功效。此外,发现具有高风险评分的患者不太可能从免疫治疗中受益。

结论:我们基于TIME的异质性开发了一个3基因特征(包括CLTA、TALDO1和CSTB)来预测生存结果和免疫治疗反应。

【核心结果】

1、四种不同类型样本的Umap。b细胞的样本类型

执行“ScaleData”函数从scRNA-seq数据集GSE149614中提取的所有基因,并执行PCA降维以找到锚点,发现了25个集群。

图片

2、5个亚群特征基因表达的小提琴图

值得注意的是,我们发现了5种细胞类型的多个亚群,包括肝芽肝细胞、CD4 细胞毒性T细胞、树突状细胞、枯否细胞和肝祖细胞。特殊表达的标记基因可用于在未来的研究中识别细胞亚群。

图片

3、HCC中共表达模块的鉴定

为了探索HCC中TIME的特征,通过CIBERSORT方法计算了TCGA数据库中肿瘤组织和癌旁组织中25个已识别细胞簇的丰度,发现肿瘤组织和正常组织中16个细胞亚群的丰度存在差异。为了进一步分析HCC中基因表达模式与不同细胞亚群之间的相关性,WGCNA方法基于TCGA-LIHC队列的371个肿瘤组织和50个正常组织的表达谱数据构建关键模块。Pearson相关系数计算每个基因之间的距离,并使用WGCNA构建无标度网络。然后,我们利用平均连锁层次聚类方法对基因进行聚类,一共得到6个模块,其中灰色模块是在其他模块中不会被聚类的基因集。

图片

4、基于关键基因的预后模型构建

对来自TCGA数据库的基因表达数据进行了差异表达分析筛选与肿瘤发生相关的关键基因。共鉴定出3864个差异表达基因(DEG)。通过对上调基因、棕色模块基因和单核细胞(C21)标记基因的重叠分析,发现棕色模块中共有10个基因为上调基因,属于C21标记基因和brown模块中的1个基因为下调基因,属于C21标记基因。然后,单变量Cox回归模型确定了TCGA-LIHC队列中与总生存期显着相关的7个基因。LASSO Cox回归分析用于进一步减少候选基因的数量。最终构建3基因模型公式如下:RiskScore = 0.257*ExpressionCSTB   0.263*ExpressionTALDO1   0.313*ExpressionCLTA

图片

5、评估TCGA-LIHC和ICGC队列中预后风险模型的预测效率

基于模型计算TCGA-LIHC队列中每位患者的风险评分,发现风险评分高的患者(n=185)的死亡风险明显高于风险评分低的患者(n=180)。生存分析结果显示,高分患者的预后比低分患者差。纳入ICGC数据库进一步验证模型的预测性能,同样在高分组的总生存时间明显短于低分组。

图片

6、HCC风险评分与浸润免疫细胞的关系

ESTIMATE方法分析风险评分与各类免疫细胞浸润水平之间的关联。结果显示,高危组的免疫评分高于低危组,而高危组和低危组的矩阵评分无显着差异。Pearson相关分析发现风险评分与初始B细胞、CD4记忆静息T细胞、单核细胞、M1巨噬细胞和静息肥大细胞的丰度呈负相关。风险评分与记忆B细胞、活化的CD4 T细胞、滤泡辅助T细胞、Treg、M0巨噬细胞、嗜酸性粒细胞和中性粒细胞的丰度呈正相关。

图片

7、3基因模型的免疫治疗预测功效

TIDE软件来评估高风险和低风险人群对免疫治疗的反应。较高的TIDE预测分数代表较高的免疫逃逸可能性,表明患者不太可能从免疫治疗中受益。在TCGA-LIHC中,低风险组的TIDE评分显着低于高风险组。此外,高危组和低危组的T细胞功能障碍评分没有显着差异。相关分析的结果表明,风险评分与TIDE评分和T细胞排除评分显着相关。

图片

8、与HCC中3基因特征相关的临床特征

随后,在研究临床特征与风险评分之间的关联性时,发现尽管不同性别、M分期、N分期和年龄的风险评分差异无统计学意义,但肿瘤和T分期的风险评分存在显着差异,且风险评分更高晚期HCC。使用了单变量和多变量Cox回归分析进一步探讨3基因模型在预测患者预后中的临床应用,证实风险评分是HCC的独立危险因素。

图片

结论】

通过整合bulk RNA-seq和scRNA-seq,集中鉴定了肿瘤组织和正常对照组织之间的不同细胞亚群,以及肿瘤最密切相关的共表达网络和关键模块。构建了一个肿瘤微环境异质性相关的基因特征。基于TCGA数据库分析基因特征对LIHC的预后作用,并研究其在LIHC中免疫治疗反应之间的关系。

图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多