分享

单细胞+肿瘤新玩法,这篇5+SCI助你发表文章如有神助!

 智汇基因 2022-03-03

导语

今天给同学们分享一篇关于肿瘤+单细胞构建预后模型的生信文章 “ A novel prognostic model based on single-cell RNA sequencing data for hepatocellular carcinoma ”,这篇文章于2022年1月发表在 Cancer Cell International 杂志上,影响因子=5.722。免疫细胞浸润的肿瘤异质性构成是影响肝细胞癌(HCC)治疗反应和预后的关键因素。然而,在遗传和细胞水平上全面了解肿瘤免疫微环境(TIME)仍然是一个重大挑战。作者根据时间的异质性开发了一个3个基因的标记(包括CLTA、TALDO1和CSTB),以预测生存结果和免疫治疗反应

1.scRNA数据分析,用于单细胞可视化

作者执行“ScaleData”功能来缩放从scRNA seq数据集GSE149614提取的所有基因,并执行PCA降维以找到定位点。最后,找到了25个簇。作者通过“FindAllMarkers”函数筛选了25个簇的细胞标记 。图1a显示了四种样品的单细胞概览。来源于肿瘤组织和正常对照组织的细胞如图1b所示。所有细胞被分为25个簇(图1c)。这些簇被标记基因标记为各种单细胞类型(图1d)。此外,作者从CellMarker下载了人类细胞标记基因,并使用clusterProfiler包enricher函数定义了25个单细胞亚群。

图1 肿瘤样本和正常样本中的单细胞概述

2.细胞亚群

值得注意的是,作者发现了5种单细胞类型的多个亚群,包括liver bud hepatic cells、CD4 + cytotoxic T cells、dendritic cells、Kupffer cells、liver progenitor cells。对于liver bud hepatic cells,C4亚群特异性表达FGF19基因,C6特异性表达PAGE2B基因,C9特异性表达CXCL10基因,C13特异性表达HAMP基因,C14特异性表达CCL26基因,C15特异性表达SLCO1B3基因,C23亚组特异表达GAST基因(图2a)。CD4特异表达的标记基因 + CD4 + cytotoxic T cells(图2b)、Kupffer cells(图2c)、liver progenitor cells(图2d)和dendritic cells(图2e)也被识别。这些结果表明,这些特异表达的标记基因可能在未来的研究中用于鉴定细胞亚群。

图2 5个亚组特征基因表达的小提琴图

3.肝癌的WGCNA生信分析

为了探索TIME在HCC中的特征,作者通过CIBERSORT方法计算了TCGA数据库中肿瘤组织和癌旁组织中25个已识别细胞簇的丰度。作者发现肿瘤组织和正常组织中16个细胞亚群的丰度不同,包括liver progenitor cells(C2)、liver bud hepatic cells(C4)、liver bud hepatic cells(C6)、hepatocytes(C7)、exhausted CD8 + T cells(C8)、liver bud hepatic cells(C9)、myofibroblasts(C10)、Kupffer cells(C11)、liver bud hepatic cells(C13)、liver bud hepatic cells(C14)、liver bud hepatic cells(C15)、cancer stem cells(C16)、dendritic cells(C18)、Kupffer cells(C20)、monocytes(C21)和liver bud hepatic cells(C23)(图3a)。

图3 肝癌的WGCNA生信分析

为了进一步分析HCC中基因表达模式和不同细胞亚群之间的相关性,作者使用WGCNA方法,基于TCGA-LIHC队列中371个肿瘤组织和50个正常组织的表达谱数据构建关键模块。所有样本的层次聚类分析结果如图3b所示。作者利用皮尔逊相关系数计算每个基因之间的距离,并使用WGCNA构建无标度网络(图3c)。然后,作者利用层次聚类法对基因进行聚类,共得到6个模块,其中灰色模块是一个不会在其他模块中聚类的基因集(图3d)。作者进一步分析了每个模块与细胞亚群丰度之间的相关性(图3e)。作者发现癌症与棕色模块关系最为密切,而棕色模块与单核细胞(C21)关系最为密切。此外,为了探索brown模块中基因的功能富集分析,作者进行了KEGG和GO富集分析。

4.基于关键基因的预后模型的构建

为了筛选与肿瘤发生相关的关键基因,作者使用R软件包limma对来自TCGA数据库的基因表达数据进行差异分析。共鉴定出3864个差异基因,其中2529个基因上调,495个基因下调(图4a)。通过对上调基因、棕色模块基因和单细胞(C21)标记基因的取交集,作者发现棕色模块中共有10个基因是上调基因,属于C21标记基因(图4b),棕色模块中有1个基因是下调基因,属于C21标记基因(图4c)。然后,用单变量Cox回归模型确定了TCGA-LIHC队列中与总生存率显著相关的7个基因。LASSO-Cox回归分析用于进一步减少候选基因的数量。每个基因的变化轨迹如图4d所示。同时,在进行这些分析之前,作者已经对TCGA数据进行了相应的预处理,在原始表达式配置文件的值上加1,并使用2的对数作为对数,然后过滤样本方差大于0.5的矩阵。确定了三个基因CLTA、TALDO1和CSTB,并用于生成风险模型(图4e)。作者通过qRT-PCR进一步评估了CLTA,TALDO1和CSTB在HCC细胞系SK-Hep-1和健康活细胞系LO2中的表达。结果显示,这三个基因在HCC细胞系中均呈上调(图4f)。

图4 构建基于关键基因的风险模型构建

5.评估风险模型对TCGA-LIHC和ICGC队列预后的预测效率

在构建3个基因的模型后,作者根据模型计算了TCGA-LIHC队列中每位患者的风险评分,并绘制患者的风险评分分布。高风险评分(n = 185)的患者的死亡风险明显高于低风险评分(n = 180)的患者(图5a)。生信分析的结果还显示,高评分患者的预后比低评分患者差(图5b)。为了进一步验证作者模型的预测性能,作者在ICGC数据库中测试了该模型(图5c)。同样,高分组的总生存时间明显短于低分组(图5d)。所有这些证据表明,作者已经构建了一个良好的预后风险模型。

图5 评估和验证预后模型的预测效果

6.肝癌风险评分与浸润性免疫细胞的关系

为了估计3个基因的模型对HCC时间的影响,作者用RAID方法分析了风险评分与各种类型免疫细胞浸润水平之间的关联。结果显示,高风险组的免疫评分高于低风险组,而高风险组和低风险组的基质评分没有显著差异(图6a)。然后,通过皮尔逊相关分析计算22个免疫细胞的丰度与风险评分之间的相关性。作者发现,风险评分与B cells、CD4 memory resting T cells、monocytes、M1 macrophages和resting mast cells呈负相关(图6b-f)。风险评分与memory B cells、activated CD4 T cells、follicular helper T cells、Tregs、M0 macrophages、eosinophils和neutrophils呈正相关(图6g-m)。基于以上结果,作者推测该风险模型参与免疫微环境调节可能影响肿瘤内抗肿瘤免疫反应。

图6 进行评估以计算每位患者的免疫和基质评分

7. 3个基因模型的免疫治疗预测效果

在这里,作者使用TIDE软件来评估高风险和低风险组患者对免疫治疗的反应。较高的TIDE预测评分代表免疫逃逸的可能性更高,表明患者不太可能从免疫疗法中受益。在TCGA-LIHC中,低风险组的TIDE评分明显低于高风险组(图7a)。此外,作者发现高风险组和低风险组的T细胞功能障碍评分没有显著差异(图7b)。高风险组的T细胞排斥评分高于低风险组(图7c)。此外,相关分析的结果表明,风险评分与TIDE评分和T细胞排除评分显著相关(图7d-f)。综上所述,这些证据可能表明,为什么高风险评分患者预后差,以及为什么高风险患者往往对免疫治疗反应不佳。

图7 分析高风险组和低风险组之间TIDE评分的差异

8.与HCC中3个基因特征相关的临床特征

在确认3个基因特征在预测HCC患者免疫治疗反应方面的表现后,作者随后研究了临床特征与风险评分之间的关系。尽管按性别、M、N和年龄划分的风险评分差异无统计学意义(图8a-d),但肿瘤和T之间的风险评分存在显著差异,晚期HCC的风险评分更高(图8e和f)。

图8 3个基因特征在肝癌中的临床特征

进一步探讨3个基因的模型在预测患者预后中的临床应用。作者在TCGA-LIHC中使用了单变量和多变量Cox回归分析。结果显示,风险评分与预后显著相关(图8g)。此外,多变量Cox回归分析进一步证实,风险评分是HCC的独立危险因素(图8h)。总的来说,这些结果证实了3个基因特征具有良好的预后效率。

小结

在这项研究中,作者通过整合RNA-seq和scRNA-seq,作者分析了TIME在单细胞水平上的异质性,并构建了一个3个基因的模型,可以准确评估HCC患者的生存结果和免疫治疗反应。肿瘤+单细胞思路感兴趣的老师,欢迎扫码咨询。

生信分析定制服务

请扫描下方二维码

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多