分享

Nat Genet丨单细胞分析定义了息肉向结直肠癌的恶性转化过程中细胞状态和组成变化的连续性

 智汇基因 2023-08-25 发布于广东

1.在恶性转化过程中对分子变化进行映射

作者8个FAP和7个非FAP的捐赠者那里收集了81个样本的单细胞数据。对于每个组织,作者进行了匹配的scATAC-seq和snRNA-seq。作者80个样本中获得了447,829个高质量的单细胞染色质可及性剖面,大多数样本的转录起始位点富集度平均约为8。在去除低质量的snRNA-seq细胞和样本后,作者70个样本中获得了201,884个单细胞转录组。每当有足够的组织时,作者生成了显微病理学数据,发现大多数息肉是管状腺瘤,这是结肠镜检查中最常见的息肉类型。

2.T细胞和髓系细胞在息肉和结直肠癌中富集

免疫组分包括B细胞、T细胞、单核细胞、巨噬细胞、树突状细胞和肥大细胞。作者检查了已知标记基因的表达情况,以注释snRNA-seq数据,并检查与标记基因相关的染色质活性分数——即给定基因体内外的可及性度量——以注释scATAC细胞。作者scATAC数据中确定了一群疲劳的T细胞,其T细胞疲劳标记基因的基因分数和疲劳T细胞位点的可及性较高,并且根据已发表的数据集将其标记为疲劳的T细胞 。

作者接下来整合了作者scATAC-seq和snRNA-seq数据集,以便分析可能驱动基因表达的调控元件和转录因子。作者使用典型相关分析对数据集进行了对齐,并将RNA-seq的配置文件分配给每个scATAC-seq细胞。然后,作者将最接近的snRNA-seq细胞标记为scATAC细胞,这与手动免疫和基质注释非常一致。最后,作者确定了与作者数据集中邻近基因的基因表达高度相关的峰值,从而得到了52,443个基质峰值-基因链接。

3.scATAC揭示了preCAF人群

虽然CAF已知会促进CRC的进展,但作者接下来探讨了成纤维细胞在癌前病变中的作用。由于preCAF簇富集了来自息肉的细胞,作者检查了CAF标记基因周围的可及性,并发现这些基因在preCAF中的可及性要比其他成纤维细胞亚型更高。例如,CAF分泌WNT2以促进CRC中的细胞增殖和血管生成。CAF和preCAF在WNT2的转录起始位点上显示出最高的可及性,这表明染色质变化促进了CAF和preCAF中WNT2的表达。作者还观察到,与其他成纤维细胞亚型相比,preCAF表现出更高的多个CAF标记基因的整合表达。作者计算了所有成纤维细胞亚型的全局CAF可及性得分,发现preCAF除了CAF之外具有最高的CAF中位数得分。此外,CAF的可及性与preCAF之间存在最高的相关性;然而,与一个隐窝成纤维细胞亚型的相关性仅略低。这一点突出了CAF和preCAF之间的相似之处,并暗示preCAF可能具有类似于CAF的功能。

4.RUNX1与CAF中的广泛可及性相关联

作者发现CAF标记峰值富集了JUN/FOS和CEBP基序,而preCAF标记峰值富集了JUN/FOS和FOX基序。为了确定驱动不同基质细胞类型染色质可及性变化的转录因子,作者确定了基因表达与其DNA基序染色质可及性活性水平之间最高相关性的转录因子。在最相关的转录因子中,包括RUNX1、RUNX2和CEBPB。接下来,作者在基质细胞的统一流形近似和投影表示以及按每个细胞类型分组的小提琴图上绘制了这些转录因子的表达和基序活性,并注意到RUNX1和RUNX2的染色质活性水平最高,它们具有相似的基序,并且在CAF和preCAF中表达最高。然而,RUNX1主要在CAF和preCAF中表达,而RUNX2在CAF中的表达较低,这表明在CAF中,RUNX1比RUNX2更能够驱动RUNX基序的可及性。

5.息肉富含类干细胞的上皮细胞

作者检查了最初以未受影响、息肉或CRC疾病状态聚集的上皮细胞。为了分析这些数据,作者首先构建了由未患FAP的患者收集的正常上皮结肠细胞的RNA-seq和ATAC-seq参考文献。作者使用已知标记基因的基因表达和基因活性得分对这个正常组织中的细胞类型进行了注释。一个具有LGR5、SMOC2、RGMB、PTPRO、EPHB2和LRIG1高表达和可及性的干细胞群体是明显的,以及腺细胞和BEST4 + 肠上皮细胞。在手动注释之后,snRNA-seq和scATAC-seq数据集与CCA 25,35 对齐,scATAC细胞根据最近的snRNA-seq细胞进行标记,这与65%的细胞的手动注释一致,被错误标记的细胞通常被标记为分化轨迹中最近的细胞类型。为了量化样本中个体细胞的干细胞程度,作者为每个snRNA-seq和scATAC-seq细胞分配了量化干细胞程度的分数,并按照每个样本内干细胞分数的分布对样本进行排序。正如预期的那样,未受影响的样本通常具有较低的干细胞分数。一些息肉聚集在未受影响的组织附近,表明它们相对较良性。

6.干细胞形成潜在的恶性连续体

作者接下来将比较息肉和CRC干细胞样细胞与正常干细胞的基因表达和染色质可及性,以识别癌前病变和癌症病变中的异常基因表达和调控程序。在计算每个样本的干细胞样细胞与最近的正常细胞类型之间的差异峰值后,作者计算了这些峰值的对数 2 FC的主成分,然后按照其在这个空间中的位置进行样本排序,其中排序的位置可以解释为从正常组织到癌症的连续体中的位置。作者使用差异基因而不是差异峰值生成了类似的RNA轨迹。从snRNA-seq和scATAC-seq数据集定义的连续体中样本的排序显示出强烈的一致性。这种分析表明,干细胞和这些干细胞样息肉细胞之间的基因表达和染色质可及性的差异遵循了从早期息肉到晚期息肉再到浸润性CRC的固定进展。

计算轨迹后,作者使用所有未受影响的样本进行了差异分析,而不是使用正常样本,以增加背景组中的患者和细胞总数。作者观察到,在恶性程度连续变化的过程中,显著差异峰值和基因的绝对数量逐渐增加,其中腺癌样本显示出最多的差异峰值和基因。

7.基因表达在恶性连续过程中发生变化

作者通过选择至少在两个样本中差异表达的基因,然后将这些基因聚类成十个k-means聚类,来研究这种恶性变化过程中的基因表达变化。这些聚类对应于在恶性转化的不同阶段上表达差异的基因组。例如,聚类1-4包括在早期息肉中上调表达的干细胞样细胞中的基因,与未受影响的干细胞相比。聚类4的成员包括OLFM4,这是肠道干细胞的标记物,表明OLMF4在息肉中的干细胞中的表达随着其接近恶性程度的增加而增加。聚类4还包括GPX2,一种谷胱甘肽过氧化物酶,已知在CRC中上调表达,通过还原过氧化氢来缓解氧化应激,促进肿瘤发生和转移。这种上调不依赖于供体,并且作者在研究中观察到所有供体都有相同的趋势。

8.息肉显示出TCF和LEF的活动增加

为了识别与侵袭性转化相关的息肉群体,作者将与最近的未受影响细胞类型相比,在至少两个样本中显著差异的36,374个峰值聚类成十个k-means聚类,揭示了在癌症转化过程中不同阶段变得更易接近的五个聚类和变得不易接近的五个聚类。为了确定在从正常结肠到CRC的转化过程中驱动染色质可及性变化的转录因子,作者计算了图4f中每个峰值聚类中的基因组富集超几何分布,并确保这些结果的稳定性。

在恶性程度连续变化过程中丧失的基序包括HOX家族基序、KLF基序和GATA基序,恶性程度连续变化中特定的KLF转录因子。聚类4和5仅在CRC样本中显示出大幅度的可及性增加,并且具有最高的HNF4A基序富集。这一观察结果表明,在息肉中,HNF4A的使用存在差异,它在驱动WNT信号传导过程中下调,而在CRC中则上调,以驱动癌症特异性可及性差异。

9.恶性连续过程中的细胞组成重塑

作者根据恶性程度连续变化的位置,计算了每个细胞类型在每个样本中的分数贡献,并发现某些细胞类型与恶性程度连续变化的进展高度相关。例如,样本中干细胞的比例在恶性转化过程中逐渐增加。类似地,成熟肠上皮细胞的数量在息肉转化为癌症时逐渐减少。Milo分析显示,干细胞邻域在恶性程度连续变化的末端往往更为丰富。在主要由未成熟和成熟腺细胞组成的分泌区域中,作者观察到许多息肉中未成熟腺细胞的比例增加。在癌症中,作者看到分泌细胞系的分化普遍缺乏,有效地消除了未成熟和成熟腺细胞。这一观察结果与先前的研究一致,报告了非黏液性结肠腺癌中腺细胞的减少。 之前的研究还发现,MUC2的敲除导致小鼠形成更多的腺瘤和癌瘤,这表明未成熟和成熟的杯状细胞的丧失甚至可能促进肿瘤发生。

10.CRC DNA甲基化变化与连续可访问性进行比较

对于重叠的低甲基化探针峰,约三分之一(534个)属于在连续过程中显著增加可及性的簇,而不到0.5%(5个)则显著减少可及性。作者观察到重叠的高甲基化探针峰也有类似的对应关系,约四分之一(754个)减少可及性,而不到0.5%(9个)增加可及性。因此,结直肠癌中的高甲基化和低甲基化几乎完美地预测了该位点的可及性要么减少,要么增加,或者保持不变。在未达到显著性阈值的峰中,作者仍然观察到重叠的高甲基化探针峰内的可及性较低,而重叠的低甲基化探针峰内的可及性较高。然而,作者还观察到79.4%(2,096个)显著增加可及性的峰和76.3%(2,440个)显著减少可及性的峰与非差异性探针重叠,这意味着大多数染色质可及性变化可能不是由甲基化驱动的。

CRC中的高甲基化DNA区域也被纳入了CRC筛查测试中,包括BMP3和NDRG4的启动子区域的高甲基化。作者观察到BMP3周围的多个远端元素在恶性连续体的中间变得无法访问。作者观察到许多区域具有类似的行为:在恶性连续体的特定点上,可访问性急剧增加或减少。作者推测,在这些位点测试可访问性或甲基化可能使息肉在恶性连续体上分期。这种方法还确定了CRC中特定于恶性转化的甲基化标记/位点,以及其启动子与CRC甲基化变化重叠的差异基因。

这篇文章的探讨到此结束,概括如下:首先,作者深入地描述了固有免疫和适应性免疫中的ILCs与ILTCs的独特性;接着,文中详细阐述了它们在癌症免疫响应中的核心地位;第三部分深入探讨了固有免疫与适应性免疫的交互关系;最后,文章讨论了基于ILC和ILTC的免疫疗法及其在未来的应用前景。文章内容深入且全面,为作者提供了众多生信分析的新思路,免疫研究的朋友们绝对不应错过!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多