分享

单细胞DNA测序揭示肝细胞癌的克隆进化

 健明 2023-02-13 发布于广东

文章信息

题目Single-Cell DNA Sequencing Reveals Punctuated and Gradual Clonal Evolution in Hepatocellular Carcinoma
日期:2022-01
期刊:Gastroenterology
DOI:https:///10.1053/j.gastro.2021.08.052

摘要

肝细胞癌 (HCC) 约占原发性肝癌的 80%,是全球癌症相关死亡率的第三大原因。目前的靶向疗法和免疫疗法在 HCC 中的疗效有限。目前对HCC的瘤内异质性 (ITH) 研究主要还存在于组织阶段,而由于基因组不稳定性引起的拷贝数改变 (CNA)是 ITH 的主要来源。

本文使用 11 个 HCC 病例的总共 1631 个细胞的 scDNA-seq 和来自另外 3 个 HCC 病例的 27,344 个细胞的 scRNA-seq。提出了 HCC 中双相拷贝数进化 (DPCNE) 的新模型,该模型也适用于其他癌症类型。基于该模型,发现了CAD是一种参与嘧啶合成的新型候选基因,与延长的渐进期、快速的肿瘤发生和降低的存活率相关。

单细胞 DNA 测序鉴定了肿瘤组织中的 3 个细胞亚群

作者分别对来自肿瘤组织的 1222 个细胞和来自相邻非肿瘤肝 (AL) 组织的 53 个细胞进行了 scDNA-seq。在肿瘤组织中鉴定出三个细胞亚群:

  • 整倍体细胞:没有任何 CNA 的细胞(整倍体细胞的百分比范围为 5.7% 至 66.5%)。推测这些整倍体细胞主要是非实质细胞,如内皮细胞和成纤维细胞。
  • 假整倍体细胞:有一些具有整倍体拷贝数分布的细胞出现了1-10个CNA。这在9/10的患者中均发现。
  • 非整倍体细胞:出现明显的CNA特征

为了探索这些细胞之间的异质性,作者专注于非整倍体细胞。每个细胞基因组改变的百分比,包括扩增和缺失,在患者内部以及患者之间存在很大差异。tSNE发现,同一患者的非整倍体细胞落入同一个cluster,不同患者的细胞落入不同的cluster。

HCC 肿瘤高 ITH 的进化模型

作者首先选择 P9 作为示例。P9 得到了 123 个细胞,包括 7 个整倍体、27 个假整倍体和 89 个非整倍体细胞。在 P9 中整个基因组的 71 个区域中的识别出总共 66 个 CNA。假整倍体细胞含有 1 到 16 个 CNA;非整倍体细胞,鉴定了 33 至 58 个 CNA。非整倍体细胞与假整倍体细胞共享的 CNA 百分比要高得多。意味着克隆多样性在早期阶段很大,然后随着肿瘤进展而减少,表明具有潜在的克隆扩增。

为了定量评估 P9 中的进化模型,比较了以下 3 种数学拟合:GCNE 模型的线性拟合、PCNE 模型的一步拟合和新型 DPCNE 模型的组合拟合。使用了4种评价指标:调整后的R^2、预测的R^2 、贝叶斯准则和Akaike 准则。DPCNE 模型(调整后的R^2 = 0.9988,预测的R^2  = 0.9987)优于两个 GCNE 模型(调整后的R^2 = 0.9417,预测的R^2 = 0.9414,P < 2.22E-16) 和 PCNE 模型(调整R^2  = 0.9848,预测R^2  = 0.9846,P < 2.22E-16)

为了探索 DPCNE 是否适合其他患者,作者为所有患者构建了系统发育树。大多数患者的发育树表现出短树干和长树枝,表明 CNA 逐渐积累是占据主导的。然后研究了这些患者的非整倍体细胞,CNA的差异范围为 8 到 25,远高于 PCNE 模型中提出的1- 3,表明肿瘤细胞在肿瘤进展的晚期不断获得 CNA。

在 P9、P6、P7 和 P8 中,作者观察到 DPCNE 拟合优于其他 2 个拟合的明显优势,这与这 4 名患者的长期进化阶段一致,这组被定义为G-group。在其余患者中,DPCNE 的拟合结果相对于 PCNE 模型显示出相对较小但显着的优势,与相对较短的渐进进化阶段一致,这组被定义为P-group。

然后定量比较了每个肿瘤与其他肿瘤的 PWD-CNA,在 G 组和 P 组肿瘤之间观察到最显著的差异;然后将每组的 PWD-CNA 值汇集在一起,发现 G 组的 PWD-CNA 明显高于 P 组。因此基于模型拟合对 P 组和 G 组肿瘤的分类是稳健的,并且具有渐进期的 G 组肿瘤表现出更高程度的 ITH。

CAD鉴定为 G 组的潜在驱动基因

为了探索 G 组中延长渐进阶段的潜在驱动基因,作者对 P 组和 G 组肿瘤之间的 CNA 进行了全基因组比较。两个组共有的CNA中有许多著名的驱动基因,例如TP53和AXIN1。有几个CNA在在 G 组中比较多,例如ARID2中出现的扩增以及TSC1和WNK2 的缺失。

作者根据 G 组肿瘤的 2 个特征(较短的 DFS 和较高的 ITH)设计了一种综合策略,以筛选 G 组富集的 CNA 中的基因。首先使用了 17 名具有不同 DFS 的 HCC 患者的大量 RNA-seq 数据,然后分为早期复发组(7 例,DFS < 6 个月)和晚期复发组(10 例,DFS > 24 个月),共鉴定出1146个差异表达基因,其中早期复发组613个基因上调,533个基因下调。之后作者在 G 组中鉴定了 19 个扩增基因和 28 个缺失基因,这些基因表现出与大量 RNA-seq 数据一致的表达模式。

接下来,作者在已发表的最大 HCC 数据集(TCGA-LIHC)中评估了 47 个候选基因与 ITH 之间的关联。发现一种新的候选基因CAD与 ITH 的程度呈最高正相关,CAD的表达在“ITH-高”组中更高。CAD编码氨甲酰磷酸合成酶2、天冬氨酸转氨甲酰酶和二氢乳清酶(CAD)。最后确定CAD与较高的 ITH 和早期肿瘤复发相关。

先前的研究发现,CAD会参与嘧啶合成,它的上调可以加速癌症中的尿素循环代谢,通过支持合成代谢来增加肿瘤增殖。因此,血浆和尿液中与尿素循环相关的代谢物可作为 G 组患者、较高细胞 ITH 和早期肿瘤复发的生物标志物。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多