分享

文献解析之11 种肿瘤类型的癌症转变过程中的表观遗传调控

 科研资料帮 2024-03-06 发布于广东

大家好,今天给大家解读一篇题为Epigenetic regulation during cancer transi tions across 11 tumour types(11种肿瘤类型癌症转移过程中的表观遗传学调控)染色质可及性对于调节基因表达和细胞特性至关重要,可及性的改变与驱动癌症的发生、进展和转移有关。

01

研究背景

染色质可及性在调节基因表达和细胞身份方面至关重要,可及性的改变与驱动癌症的发生、进展和转移有关1、2、3、4.尽管已经研究了遗传对致癌转化的贡献,但表观遗传驱动因素仍然鲜为人知。在这里,我们使用来自 225 个样本的单核染色质可及性数据(使用转座酶可及染色质的单核测定)和来自 206 个样本的匹配单细胞或单核 RNA 测序表达数据构建了泛癌表观遗传和转录组图谱。

通过富集可触及的染色质区域、转录因子基序和调节子,分析了来自每个平台的 100 多万个细胞,我们确定了与癌症转变相关的表观遗传驱动因素。一些表观遗传驱动因素出现在多种癌症中(例如,ABCC1 和 VEGFA 的调控区域;GATA6 和 FOX 家族基序),而其他基序是癌症特异性的(例如,FGF19、ASAP2 和 EN1 的调节区域以及 PBX3 基序)。

在表观遗传改变的通路中,TP53、缺氧和 TNF 信号传导与癌症发生有关,而雌激素反应、上皮-间充质转化和顶端连接与转移转化有关。此外,我们揭示了增强子可及性和基因表达之间的显着相关性,并揭示了表观遗传和遗传驱动因素之间的合作。该图谱为进一步研究癌症转化中的表观遗传动力学奠定了基础。

见图一

11种癌症类型的染色质可及性模式。

图一

a,数据生成和研究设计的示意图,显示收集的癌症类型和样本类型,图谱的构建、注释和整合,以及所研究的生物实体。

b,整合泛癌 snATAC-seq 对象的均匀流形近似和投影 (UMAP) 图,显示了 250,222 个免疫细胞、69,684 个基质细胞、69,506 个正常上皮细胞和 588,895 个癌细胞在 225 个样本中的分布。扩展数据图中显示了 36 种不同细胞类型的详细细分。1b 和 2a,b。

c,来自每个肿瘤的癌细胞与肿瘤起源组织的正常细胞类型之间的皮尔逊相关系数。细胞类型按增加每个队列的中位相关系数排序;最右边的细胞类型被认为是CNC,随后被用作识别癌症相关表观遗传驱动因素的参考。

d,通过比较癌细胞与CNCs鉴定的顶级癌细胞相关DACR。气泡大小显示具有可访问 DACR 的癌细胞的百分比,颜色表示对数2[FC].x 轴显示每个 DACR 的最近基因。基因按癌症之间共享的基因和癌症类型特有的基因进行分组。根据特异性和每种癌症类型(列)的倍数变化 (FC) 或是否由最大癌症数量共享(共享)来选择癌症特异性 DACR。正日志2如果 ACR 在 >5% 的癌细胞中可及,则显示 [FC]。与 EpiMap 数据库中的启动子和增强子重叠的基因的 DACR 以粗体突出显示。

见图二

CREs调节癌症中的转录程序。

图二

a,根据重叠 EpiMap 增强子区域(左)、重叠 EpiMap 启动子区域(中)和 RNA 转录本(右)的 ACR 的可及性计算的来自同一组织的癌细胞和正常细胞的样本 Pearson 相关性(snMultiome-seq 样本)。左侧热图采用单连杆聚类方法和欧几里得距离聚类,中心和右侧热图遵循相同的顺序。

b,按癌症类型划分的 ACR 与基因链接的计数,并通过 ACR 的 EpiMap 注释着色。

c,UpSet 图显示大多数增强子与基因的连接是癌症类型特异性的。右下角的连接点表示所表示的癌症类型之间共享的 ACR 到基因链接。

d,与PDAC癌细胞中基因表达(下图)相关的ACR(上图)的可及性。热图显示了按癌细胞样本和正常胰腺细胞按细胞类型聚合的平均归一化和缩放的 snATAC-seq 和 snRNA-seq 值。使用Ward最小方差法(R的Ward.D2)和欧几里得距离对顶部热图进行聚类。底部的热图列和行遵循顶部热图的顺序。Acinar,腺泡细胞;腺泡REG,再生蛋白高表达的腺泡细胞;ADM,腺泡导管化生;dELS,具有增强子样特征的远端顺式调节区 (CRE);导管样-1,具有高 SPP1 和 CRP 的导管细胞;导管样-2,具有增加粘液基因和三叶因子基因的导管细胞;胰岛,朗格汉斯细胞的所有胰岛;pELS,具有增强子样特征的近端 CRE;PLS,具有类似发起人签名的 CRE。

见图三

泛癌和癌症特异性调节子。

图三

a,使用 SCENIC 在 sc/snRNA-seq 数据上鉴定的组织和癌细胞特异性调控子(列),其中调控子是 TF 及其 n 个靶基因,基因数量显示在顶部。热图显示了来自每种癌症的 200 个肿瘤和 200 个随机选择的正常细胞(行)的曲线下面积 (AUC) 评分。与CNC相比,癌症特异性调节子在癌细胞中显示出更高的活性。几种癌症中共有的顶级癌细胞特异性调节子以粗体突出显示。

b, 原发癌细胞和相应CNCs的调节子活性评分(上图;n = 2,211 (PDAC)、n = 744(导管样 2)、n = 5,000 (ccRCC)、n = 714(近端肾小管)、n = 446 (CRC)、n = 184(远端干细胞)、n = 3,600 (GBM)、n = 842 (OPC)、n = 389(星形胶质细胞)、n = 800 (SKCM) 和 n = 20(黑色素细胞))和 TF 基序可及性评分(底部;n = 30,428 (PDAC)、n = 1,652(导管样 2)、n = 106,250 (ccRCC)、n = 11,471(近端肾小管)、n = 6,243 (CRC)、n = 860(远端干细胞)、n = 83,507 (GBM)、n = 933 (OPC)、n = 996(星形胶质细胞)、n = 7,844 (SKCM) 和 n = 20(黑色素细胞))。 方框按癌症类型着色,绿色方框代表正常细胞。FDR调整的Wilcoxon双侧P值如图所示(补充表4c,e)。对于箱形图,中心线显示中位数,箱形极限显示第一和第三个四分位数,上下胡须从铰链延伸到最大值或最小值不超过 1.5×距铰链的四分位距 (IQR)。

c,其中靶基因富集 TF 特异性 ACR 到基因链接的 TF(ACR 包含该 TF 结合位点)。颜色表示日志2[FC] 观察到的具有此类链接的靶基因数量超过预期数量(K1, ..., n)的随机基因。根据高斯 z 评分计算每个调节子的单侧 P 值,z = (M − μ)/σ,其中 M 是观察到的与 TF 基序相关的靶基因数量。

d,在随机采样的基因中发现的具有 PPARG 特异性 PDAC ACR 与基因链接的基因数量的正态分布示例。观察到的具有 PPARG 特异性 ACR 与基因链接的 PPARG 靶基因数量由红线表示。

e, 靶基因TSS周围存在ChIP-seq峰(ENCODE)、snATAC-seq峰或CUT&RUN峰。

见图四

癌症转移中激活的表观遗传程序。

图四

a,在四种癌症类型中,转移和原发样本之间具有不同基序可及性的TFs。y 轴显示使用双侧 Wilcoxon 秩和检验计算的 FDR 校正 P 值。表达式分数对应于日志的绝对值2转移细胞和原发癌细胞之间 TF 表达中的 [FC],使用每个样本的平均值,并且需要与同一 TF-癌症对的基序评分差异相同的倍数变化方向。

b,PDAC小鼠模型中GATA6(红色)表达的mpIHC分析。CK19(绿色)标记癌细胞,DAPI(蓝色)标记细胞核。比例尺,100 μm(主图像)和 50 μm(插图)。

c、GATA6 和 GATA6+高与匹配的转移性 (met.) 相比,原发性 PDAC 的癌细胞百分比更高。PDAC的。n = 6。图中显示了使用双侧配对 t 检验计算的 P 值。对于箱形图,中心线显示中位数,箱形极限显示第一和第三个四分位数,上下胡须从铰链延伸到距铰链不超过 1.5 × IQR 的最大值或最小值。

d,转移性肿瘤与原发性肿瘤中上调的 DACR 的显着和提示性 (FDR ≤ 20%) 标志通路富集。气泡的大小和颜色传达了基因计数和对数10[罗斯福]。分析中使用的每种癌症类型的DACR总数以对数上限为5,0002[足球俱乐部](顶部)。每个通路中注释的 DACR 总数如右图所示。

e,f,结直肠癌病例(e)和UCEC病例(f)的成对原发性和转移性样本的UMAP图(左)。小热图显示了基于每个样本中每个簇平均的 TF 基序分数的 Pearson 相关系数。散点图显示了沿着 Slingshot 识别的轨迹排序的细胞(中),散点图显示了 PBX3 (e) 或 SNAI1 (f) 基序可及性与伪时间进展之间的关联(右)。

见图五

遗传驱动因素对染色质可及性的影响。

图五

a,从snATAC-seq数据和WES数据中检测到五种癌症类型的TERTp突变(C228T和C250T)。图中显示了批量 WES 数据(上图)和 snATAC-seq 数据(下图)中支持参考或突变等位基因的读取计数。分别对癌细胞和正常细胞的 snATAC-seq 支持的读长进行计数,然后归一化为每组中的细胞总数。底部的热图显示了每个样本在癌症和正常细胞中的TERT表达。

b,使用 snMultiome-seq 数据鉴定的已知癌基因的表观遗传调控。每个点显示一个增强子到基因链接 z 分数。增强子到基因 z 分数是通过平均所有 ACR 落入一个增强子的 ACR 到基因链接 z 分数来计算的,如 EpiMap 或 GeneHancer 数据库中所述。点颜色对应于鉴定出 ACR 与基因链接的癌症类型,点大小对应于 x 轴上显示的基因的归一化 RNA 表达。

c, BRCA基底癌、CESC、HNSCC癌细胞和CRC癌细胞中EGFR区域的覆盖图。仅纳入中性EGFR CNV的样本。EGFR型RNA表达如右图所示。

d,Kaplan-Meier图和按PITX3调控子活性分层的TCGA-GBM队列(上图)和按KLF6调控子活性分层的TCGA-PDAC队列(下图)的无进展生存期分析。误差带表示 95% 置信区间。表示使用对数秩 (Mantel-Cox) 检验计算的双侧 P 值。高调节活性组和低调节活性组分别根据高于和低于中位数的值进行定义。为每个患者亚组指定 n。

e,本研究的HPV阳性和HPV阴性HNSCC样本(上)和TCGA-HNSCC(下)中KLF4的调节活性。图中显示了使用双侧 Wilcoxon 秩和检验计算的 P 值。

02

研究结论

了解肿瘤染色质结构的景观、关键癌症转变时的染色质可及性变化以及染色质可及性、遗传改变和转录模式之间的相互作用对于推进癌症生物学和临床实践至关重要。染色质可及性的某些变化代表了癌症发生和转移扩散的关键事件/驱动因素,可能是潜在的治疗靶点。尽管TF本身很难用传统疗法靶向,而且它们在正常组织中的多种作用引起了对脱靶效应的担忧,但我们通过关注广泛的转录程序来强调潜在的靶向元素。最后,我们预计该图谱将成为未来癌症研究的宝贵资源。

好了,今天的文献解读就到这儿来,我们下期再见!如果你正在开展临床研究.需要方案设计.数据管理.  数据分析等支持.也随时可以联系我们。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多