分享

基于单细胞转录组测序的肝细胞癌预后新模型

 健明 2023-02-15 发布于广东

文章信息

题目A novel prognostic model based on single-cell RNA sequencing data for hepatocellular carcinoma
日期:2022-01-25
期刊:Cancer Cell International
DOI:https:///10.1186/s12935-022-02469-2

摘要

肝细胞癌 (HCC) 是最常见的原发性肝癌,占病例的 75-85%。只有肝切除术和肝移植被认为是治疗 HCC 的潜在治愈方法。然而,大多数患者确诊时已属晚期,早期患者的治疗率低得令人失望。

近年来,免疫疗法已成为一种很有前途的癌症治疗策略,而只有少数 HCC 患者对免疫治疗有反应。因此,系统分析各种类型的肿瘤内免疫细胞的功能可能有助于开发新的生物标志物,以预测 HCC 患者的预后和治疗效果。

本文利用GEO数据库中的HCC scRNA-seq 数据集中鉴定了肿瘤组织和正常对照组织之间的不同细胞亚群,基于肿瘤样本和正常样本的TCGA表达谱数据,采用WGCNA方法计算了与肿瘤关系最密切的共表达基因模块。基于 scRNA-seq 和 bulk RNA-seq 数据的整合,作者筛选了与 HCC 中免疫细胞亚群相关的关键基因。最后采用单因素Cox 和LASSO 回归来构建风险模型。

数据处理

HCC scRNA-seq 数据集 是GSE149614 ,包括 10 名原发肿瘤(PT)患者、2 名门静脉癌栓(PVTT)患者、1 名转移性淋巴结(MLN)患者和 8 名正常肝组织(NLT)患者。

原始数据共包含 25479 个基因和 71915 个细胞。通过PercentageFeatureSet函数计算线粒体和rRNA的百分比,每个细胞表达的基因大于500个小于8000个,设置线粒体含量低于30%。此外,每个细胞中的UMI数量至少为500个。过滤后,有71139个细胞。

细胞分群

降维聚类得到25个clusters,然后进行了细胞类型的注释。

其中值得注意的是,发现了出现最多的5种细胞类型:

  • liver bud hepatic cells:c4特异表达FGF19基因,c6表达PAGE2B,c9表达CXCL10,c13表达HAMP,c14表达CCL26,c15表达SLCO1B3,c23表达GAST
  • CD4 + cytotoxic T cells
  • dendritic cells
  • Kupffer cells
  • liver progenitor cells

HCC 中共表达模块的鉴定

通过CIBERSORT方法计算了TCGA数据库中肿瘤组织和癌旁组织中25个已识别clusters的丰度,发现16个细胞亚群的丰度在肿瘤组织和正常组织之间存在差异:

  • liver progenitor cells (C2),
  • liver bud hepatic cells (C4),
  • liver bud hepatic cells (C6),
  • hepatocytes (C7),
  • exhausted CD8 + T cells (C8),
  • liver bud hepatic cells (C9),
  • myofibroblasts (C10),
  • Kupffer cells (C11),
  • liver bud hepatic cells (C13),
  • liver bud hepatic cells (C14),
  • liver bud hepatic cells (C15),
  • cancer stem cells (C16),
  • dendritic cells (C18),
  • Kupffer cells (C20),
  • monocytes (C21),
  • liver bud hepatic cells (C23)

然后使用 TCGA-LIHC 队列的 371 个肿瘤组织和 50 个正常组织的表达谱数据,进行WGCNA分析,以探索HCC 中基因表达模式与不同细胞亚群之间的相关性。结果共得到6个模块,发现癌症与棕色模块的关系最密切,而棕色模块与单核细胞 (C21) 的关系最密切。

基于关键基因的预后模型构建

为了筛选与肿瘤发生相关的关键基因,作者使用 limma 对来自 TCGA 数据库的基因表达数据进行了差异表达分析。共鉴定出 3864 个差异表达基因 (DEG),其中 2529 个基因上调,495 个基因下调。

对上调基因、棕色模块基因和单核细胞(C21)标记基因的取交集,作者发现棕色模块中共有10个基因为上调基因,属于C21标记基因;棕色模块中的1个基因是下调基因,属于C21标记基因。

单变量 Cox 回归模型在 TCGA-LIHC 队列中确定了 7 个与总体生存显着相关的基因。LASSO回归分析用于进一步减少候选基因的数量。最后得到CLTA、 TALDO1和 CSTB三个基因,作为风险模型。通过 qRT-PCR 进一步评估了 CLTA、TALDO1 和 CSTB 在 HCC 细胞系 SK-Hep-1 和健康活细胞系 LO2 中的表达。结果表明,这三个基因在 HCC 细胞系中均被上调。

评估 TCGA-LIHC 和 ICGC 队列中预后风险模型的有效性

根据模型计算了 TCGA-LIHC 队列中每个患者的风险评分,并绘制了患者的风险评分分布图。发现高风险评分患者 (n = 185) 的死亡风险明显高于低风险评分患者 (n = 180)。生存分析结果也显示,高分患者的预后较低分患者差。

另外在 ICGC 数据库中测试了该模型,同样,高风险分组的总生存时间明显短于低风险分组。

HCC 中风险评分与浸润性免疫细胞之间的关联

通过 ESTIMATE 方法分析了风险评分与各种类型免疫细胞浸润水平之间的关联。发现高危组的免疫评分高于低危组,而高危组和低危组的矩阵评分无显着差异。

通过pearson相关分析计算22种免疫细胞的丰度与风险评分之间的相关性。作者发现风险评分与naïve B cells, CD4 memory resting T cells, monocytes, M1 macrophages, and resting mast cells 的丰度呈负相关。与memory B cells, activated CD4 T cells, follicular helper T cells, Tregs, M0 macrophages, eosinophils and neutrophils的丰度呈正相关。

推测该风险模型参与免疫微环境调控,可能影响瘤内抗肿瘤免疫反应。

三基因模型的免疫治疗预测效果

使用 TIDE 软件来评估高危和低危人群对免疫治疗的反应。

较高的 TIDE 预测分数代表较高的免疫逃逸可能性,表明患者不太可能从免疫治疗中获益。在TCGA-LIHC中,低危组的TIDE评分明显低于高危组。此外,作者发现高危组和低危组的 T 细胞功能障碍评分没有显著差异。

HCC 中与三基因相关的临床特征

在确认 三 基因标签在预测 HCC 患者免疫治疗反应方面的表现后,作者随后研究了临床特征与风险评分之间的关联。

尽管性别、M 分期、N 分期和年龄的风险评分差异无统计学意义,但风险评分在肿瘤和 T 分期之间存在显著差异。

在 TCGA-LIHC 中使用了单因素和多因素 Cox 回归分析。结果表明,风险评分与预后显著相关。此外,多因素Cox回归分析进一步证实风险评分是HCC的独立风险因素。结果也证实了三基因具有出色的预后效率。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多