文章信息 题目 : A novel prognostic model based on single‑cell RNA sequencing data for hepatocellular carcinoma 期刊 : Cancer Cell International (IF=5.722)日期 :2022-1-25DOI : https:///10.1186/s12935-022-02469-2
1、总体思路 (1)首先对来自GEO的HCC单细胞数据集,进行分群与细胞类型注释。
(2)基于此,使用CIBERSORT算法去预测TCGA每个样本的细胞类型组成比例。
(3)然后使用WGCNA算法得到一个与肿瘤最相关的module,以及与之最相关的cluster类型。
(4)之后取tumor deg、module gene、cluster marker gene交集进行cox回归与LASSO分析,得到一个3基因的risk model;
(5)再对这个模型进行验证以及预后分析。
2、分析结果 2.1 scRNA数据(GSE149614)分析 按照基本的Seurat单细胞数据分析流程,进行过滤--标准化--高变基因--降维分群--细胞类类型注释。
其中分为了25个cluster,为每个cluster鉴定marker gene
有5种细胞类型包含多个cluster,分别是CD4 + cytotoxic T cells、Kupffer cells、liver progenitor cells、dendritic cells 2.2 使用CIBERSORT算法计算TCGA样本的细胞组成 根据计算结果,有16个cluster比例在tumor与nomal中存在显著差异 2.3 使用WGCNA算法挖掘与tumor相关的基因模块 其中brown module与肿瘤最相关,而C21与brown module最相关 2.4 建立risk model预后模型 去tumor normal deg,brown module,C21 marker gene的交集作为候选基因
通过单变量cox回归,Lasso回归筛选出3个基因(CLTA, TALDO1, CSTB)用于建立预后模型,计算risk score
结合TCGA的生存数据,验证模型的预后能力;并通过ICGC数据集进行再次验证。 2.5 模型risk score分析 risk score与免疫治疗预测结果(TIDE)的关系 3、小结 这篇文章是一篇结合单细胞数据的TCGA数据挖掘文章,使用了CIBERSORT、WGCNA算法,筛选建模候选基因的思路值得借鉴与学习。