分享

文献解析 | 联合表观基因组分析揭示了人类皮质类器官中细胞类型

 科研资料帮 2024-05-22 发布于广东

大家好,今天跟大家分享一篇题为Joint epi genome profiling reveals cell-type-s pecific gene regul atory progra mmes in human cortical org anoids(联合表观基因组分析揭示了人类皮质类器官中细胞类型特异性基因调控程序)基因表达受到多种表观遗传机制的调节,这些机制在发育和疾病中相互协调。

01

研究背景

基因表达受多种表观遗传机制调控,这些机制在发育和疾病中协调一致。然而,目前的多组学方法通常一次仅限于一种或两种模式,这使得获得全面的基因调控特征具有挑战性。在这里,我们描述了一种方法——3D 基因组、RNA、可及性和甲基化测序 (3DRAM-seq)——该方法可同时以高分辨率询问全基因组的空间基因组组织、染色质可及性和 DNA 甲基化。

我们将 3DRAM-seq 与皮质类器官中的 immunoFACS 和 RNA 测序相结合,以绘制跨多个表观遗传层的人类神经发育的细胞类型特异性调控景观。最后,我们应用大规模平行报告基因测定来分析类器官中细胞类型特异性增强子活性,并在功能上评估关键转录因子对人类增强子激活和功能的作用。更广泛地说,3DRAM-seq可用于分析稀有细胞类型和不同组织的多模态表观遗传景观。

见图一

3DRAM-seq能够对3D基因组组织、染色质可及性和DNA甲基化进行联合分析。

图一

a, 3DRAM-seq的示意图。

b,以基序为中心和定向 CTCF ChIP-seq 峰 (5 bp bin) 的平均 CpG 甲基化和 GpC 可及性水平。

c,与 b 相同,但用于以基序为中心的 NRF1 ChIP–seq 峰(2 bp bin)。

d, TADs的平均接触富集、DNA甲基化和GpC可及性水平。exp,预期;obs,观察到。

e, ChIP–seq 峰内收敛 CTCF 基序之间的聚集接触富集。右下角的数字表示中心富集度与四个角的平均值之比。

f,接触图谱和基因组轨迹,显示 Sox2 基因座的 DNA 甲基化、GpC 可及性、ATAC-seq、H3K27ac ChIP-seq 和 RNA 测序。

g,f中表示的虚线黑匣子的放大区域。

见图二

3DRAM-seq与其他多组学方法的比较。

图二

a,饼图,描绘了3DRAM-seq GpC可及峰与仅ATAC-seq峰重叠、仅DHS峰、ATAC和DHS或两者都不重叠的百分比。

b,3DRAM-seq、GpC-seq、ATAC-seq、DHS-seq 或随机区域(5 bp bin)的平均 GpC 可及性水平。

c,显示通过 GpC 甲基化测量的可及性的热图、ATAC-seq(来自基因表达综合 (GEO) 数据库的数据,登录号 GSE113952)、DHS(数据来自参考文献)。57),以及核小体占有率(MNase-seq;数据来自参考文献)。58) 跨越 GpC 峰值。RPM,每百万次映射读取的读取次数。

d, 不同方法的覆盖率比较。黑点和胡须表示标准±的平均值(n = 1-4 个生物学重复)。甲基-3C数据来自参考文献。9;Methyl-HiC数据来自参考文献。10;全基因组亚硫酸氢盐测序 (WGBS) 数据来自参考文献。

e, 3DRAM-seq、Methyl-3C和Methyl-HiC的测序统计。具有平均值±标准差的条形图;圆圈表示单个数据点(n = 1-4 个生物重复)。

f,在原位Hi-C数据中识别的环之间不同方法的平均接触富集(来自参考文献)。5) 以 5 kb 分辨率使用 HICCUPs59.请注意,此面板和下一组的分辨率与每个数据集的测序深度高度相关(联系人:3DRAM-seq、311 × 106;甲基-HiC, 32 × 106,甲基-3C, 180 × 106;和 Hi-C,2.950 × 109).g,比较不同方法的接触图谱和 DNA 甲基化模式,以及 CTCF ChIP-seq 跟踪。甲基化轨道中的每个点代表一个单独的 CpG 二核苷酸。源数值数据在源数据中可用。

见图三

3DRAM-seq 可在单分子分辨率下进行配对共可及性测量。

图三

a,单分子共及性测定的示意图。

b,以收敛的 CTCF 基序为中心的 100 bp 窗口中的聚类平均配对共可及性水平,间隔至少 1 kb(k-均值聚类,k = 4)。

c,与b相同,但显示每次读数中单个GpC二核苷酸的甲基化状态。

d,在 ±500 bp 窗口内,包含 CTCF 前向基序的相同读取 1 区域的平均 CTCF ChIP–seq 信号和 GpC 可及性水平,如 b 所示。

e,显示 CTCF 或 SMC1 的箱线图(参考60) ±100 bp 窗口中的 ChIP–seq 信号,以识别和聚集在 b 中的区域以及每个区域(n = 483 (C1)、376 (C2)、418 (C3)、302 (C4) 和 1,576(对照)区域)的随机对照区域为中心。

f,g,与 b 和 c 相同,但用于读取 1 时包含 CRE(定义为远端开放色区)和读取 2 时包含 TSS 的读取对。读取对至少跨越 5 kb。比值比 = 1.07,P = 0.6。h,ATAC-seq信号和GpC可及性,在±5 kb窗口内,与f相同。

i,箱线图在以 CRE 或 TSS 为中心的 ±250 bp 窗口内显示 ATAC-seq 和 H3K27ac ChIP-seq 信号,每个窗口都有随机控制区(n = 288 (C1)、310 (C2)、155 (C3)、181 (C4) 和 928(对照)区域)。簇,如 f 中。所有箱线图都显示中位数(折线)、第 25 个和第 75 个百分位数(框限制)以及第 10 个和第 90 个百分位数(晶须)。

见图四

将 3DRAM-seq 与 immunoFACS 相结合,可以对人类皮质类器官中细胞类型特异性表观遗传景观进行多模式分析。

图四

a,人类皮质类器官生成的实验概述,然后通过免疫FACS分离RGC和IPC。D, 天;EB,胚状体。

b,第 45 天在皮质类器官内形成的神经玫瑰花结的代表性免疫荧光图像。

c,散点图描绘了RGC到IPC分化中显著(错误发现率(FDR)<0.05)上调或下调基因。紫色,与RGC相比,IPC中的基因上调。绿色,基因在IPC中下调。

d, 差异调控基因的GO术语富集(生物过程)。圆圈的颜色和大小分别表示 Benjamini-Hochberg 校正的 P 值(超几何检验)和基因数量。

e,f、CpG 甲基化 (e) 和 GpC 可及性 (f) 水平在 CTCF 基序为中心的 RGC 和 IPC 的 GpC 峰下。

g,3 号染色体的接触图(上)和 CpG 甲基化和 GpC 可及性水平(下)(200 kb bins)。

h, RGCs和IPCs在TADs下的平均接触富集、CpG甲基化和GpC可及性水平。

i,接触图、GpC 可及性、DNA 甲基化和 RGC 和 IPC 在 SOX2 位点的表达水平。基因组轨迹中的黑色虚线圆圈和方框表示推定的 CRE。

见图五

与皮质类器官表观基因组重塑相关的TF。

图五

a,散点图描绘了RGC和IPC中单个GpC峰的GpC可及性水平。丢失的峰值 (RGC DAR;n = 6479)或获得可访问性(IPC DAR;n = 12,837)分别是彩色的。灰点表示 GpC 峰不变 (n = 46,964)。

b,RGC(顶部)或IPC(底部)DARs(10 bp箱)下RGC或IPCs的平均CpG甲基化水平。

c,基于染色质接触的RGC(上)或IPC(下)DAR相关基因的GO术语富集分析(方法)。

d, 火山图,显示了RGC DARs中TF基序的富集。红点和蓝点分别表示显著(P ≤ 0.01;log(绝对倍数变化)≥0.25)富集或耗尽的基序。

e, 含有 LHX2 基序的 RGC DAR 对的聚合接触富集 (n = 3459)。右上角的数字表示中心富集度与四个角的平均值之比。

f,g,与 d 和 e 相同,但分别用于具有 NEUROG2 基序 (n = 9,116) 的 IPC DAR 和 IPC DAR。

h,i, GAS1 (h) 和 NFIA (i) 位点的 RGC 和 IPC 的接触图、GpC 可及性水平和基因表达。

j,含有LHX2和/或SOX2基序重叠RGC峰的配对读段(相隔100-300 bp)的单分子共可及性水平。

k,含有EOMES和/或重叠IPC峰的NEUROG2基序的配对读长(相隔100-300 bp)的单分子共可及性水平。

见图六

MER130 和 UCON31 重复元件与可及性的变化相关,并富集了神经源性 TF 基序。

图六

a,b,散点图描绘了不同类别重复基因组元件的中位可及性(a)或DNA甲基化(b)水平。

c,d, 表示 MER130 的 GpC 可及性和 DNA 甲基化水平的箱线图 (c;n = 181) 和 UCON31 重复 (d;n = 117)。使用配对双侧 Wilcoxon 秩和检验计算统计学显着性。

e,f, MER130 (e) 和 UCON31 (f) 重复元件的 TF 基序富集。

g, UCON31重复元件相关基因的GO术语富集分析(方法)。

h,描述与 UCON31 (n = 121) 或 MER130 (n = 174) 相互作用的基因表达变化(IPC 与 RGC)的箱线图。使用双侧 Wilcoxon 秩和检验计算统计显着性。所有箱线图都显示中位数(折线)、第 25 个和第 75 个百分位数(框限制)以及第 10 个和第 90 个百分位数(晶须)。

见图七

人类皮质类器官中的细胞类型特异性MPRA。

图七

a,人皮层类器官中免疫MPRA的实验概述。

b,小提琴和箱线图显示每个CRE获得的唯一条形码数量(RGC、IPC和N单元格分别为n = 5,822、5,831和5,801)。

c, 描述加扰对照的MPRA信号的箱线图(Scr;n = 492)和与RGC(n = 273)或IPC(n = 548)增强子相关的显著活性CREs。

d, 所有细胞类型中显著活性 CRE 的 K 均值聚类 (k = 5)。每行代表一个 CRE 及其 MPRA 信号,位于 RGC、IPC 和 N 个单元中。

e,描绘了来自d的5个显著CRE簇的基序富集的热图,以及在任何条件下(NS)均不显著的CRE。

f,g,描述含有野生型 (WT) 或突变 (Mut) NEUROG2 (n = 83) 或 EOMES (n = 23) TF 基序的 IPC 中显着活性 CRE 的细胞类型特异性 MPRA 信号的箱线图。

h,i,显示包含指定基序的显著活性 CRE 的 IPC (h) 和 RGC (i) 中 MPRA 信号的箱线图。

j, PCDH9位点RGC和IPC的接触图、GpC可及性和基因表达。虚线圆圈表示同时包含 NEUROG2 和 EOMES 基序的 IPC DAR。

k, 条形图显示 j 中指示的 CRE 的 MPRA 活性,有或没有基序突变。

l,与 j 相同,但用于 FBXO32 基因座。m,n, 与 E2 FBXO32 增强子相关的数据。

m,条形图,显示通过FACS量化的GFP细胞群中mScarlet细胞的百分比(n = 3)。使用双侧非配对 t 检验计算统计学显着性。

n,共电穿孔人皮质类器官的代表性免疫荧光图像(来自n = 3个独立实验)。比例尺,50μm。所有箱线图都显示中位数(折线)、第 25 个和第 75 个百分位数(框限制)以及第 10 个和第 90 个百分位数(晶须)。源数值数据在源数据中可用。

02

研究结论

总体而言,MPRA在皮质类器官中的应用使我们能够直接量化细胞类型特异性增强子活性,剖析关键TF对其在人类神经发生中的调节的重要性,并验证RGC的人类增强子。

好了,今天的文献解读就到这儿来,我们下期再见!如果你正在开展临床研究.需要方案设计.数据管理.  数据分析等支持.也随时可以联系我们。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多