分享

scRNA-seq联合scATAC-seq解析人大脑皮层发育的基因调控

 里凤山民 2022-03-25
图片

研究背景

在真核生物发育过程中,转录因子和DNA的相互结合所驱动的基因表达顺式作用元件(cis-regulatory element, CRE)活力的动态变化在细胞表型转化中起中心作用。在单细胞的尺度上衡量染色质开放性(例如scATAC-seq)有助于精确理解CRE的活性变化,尤其与单细胞转录组测序技术(scRNA-seq)相结合,可以帮助解析不同转录因子如何协同的调节基因表达网络,从而调节细胞和组织的发育过程。例如,人大脑皮层发生是一个动态的、高度调节的过程。位于室管膜区(ventricular zone, VZ)和室管膜下区(subventricular zone, SVZ)的放射状胶质(radial glia, RG)和中间前体细胞(intermediate progenitor cell, IPC)采用一种所谓的由内向外(inside-out)的方式分化成兴奋性神经元,以及星型胶质细胞和少突胶质细胞。而GABA能抑制性神经元、小胶质细胞以及一些少突胶质细胞产生于背侧前脑,然后迁移并整合进大脑皮层。在单细胞尺度上精确理解大脑皮层发生中的基因表达调控必然需要同时在单细胞上研究染色质开放性和基因表达水平。

方法流程

为了实现这项研究,单细胞测序领军人物,ATAC技术开发者William Greenleaf教授领导的研究团队对孕期16周、20周、21周和24周的胎儿大脑皮层组织进行单细胞研究,然后利用单细胞测序分析平台做独立的scRNA-seq和scATAC-seq,分别获得57868个单细胞转录组和31304个单细胞表观基因组。通过非监督学习对单细胞转录组进行聚类分析;采用一个迭代算法[1]对scATAC-seq结果进行分析,得到可能作为CRE的657930个峰。作者采用典型相关分析(canonical correlation analysis, CCA)算法[2]对两组测序结果进行相互映射,得到64878个CRE-gene对,每一对CRE-gene可以代表每一个enhancer-gene的相互作用,最终得到185个可以根据染色质开放程度预测表达水平的基因(genes with putative chromatin, GPCs)。在对这些结果进行验证之后,作者接下来分别分析了兴奋性神经元和胶质细胞的转录因子和转录因子motif的活性的动态调控。

图片

研究结果

1. 人大脑皮层发育的单细胞调节图谱

作者对孕期16周、20周、21周和24周的胎儿大脑皮层细胞进行独立的scRNA-seq和scATAC-seq,分别获得57868个单细胞转录组和31304个单细胞表观基因组。首先对scRNA-seq结果进行UMAP聚类分析,同时对scATAC-seq的数据进行迭代分析,得到一个低维的包含657930个 CRE峰的聚类。总体上来看,scRNA-seq和scATAC-seq的聚类是比较相似的,且主要和细胞类型以及孕周有关。作者发现,皮层发生中几个重要的转录因子,SOX9, EOMES, NEUROD2和DLX2均表现聚类特异的富集,证明了这样的聚类分析是可靠的。

图片

作者接下来对这两个数据集根据已知的基因表达数据或基因活性数据进行注释,作者注释到了分裂中的细胞(Cyc)、放射状胶质(RG),其中RG根据在不同的样本分布,可以分为早期RG(early RG)和晚期RG(late RG),后两者表达不同的标志物。作者同样注释到多能前体细胞(multipotent glial progenitor cell, mGPC)、更多的神经元中间前体细胞(neuronal IPC)以及兴奋性神经元(GluN),以及部分小胶质细胞、内皮细胞等等。作者注意到,很多标志物基因在scATAC-seq的活性评分(gene activity score)是动态变化的。

图片

作者用典型相关分析(canonic correlation analysis, CCA)算法将基因活性评分和基因表达水平相整合,整合的结果显示,除了Cyc细胞,其他cluster的类别前后是一致的。通过这种方式,作者分离出了64878个CRE-gene对,其中每一对CRE-gene代表可能的enhancer-gene相互作用关系。在这些CRE-gene对中,CRE的开放性和基因表达水平共同可以区分出每个cluster,并且这两者是协同变化的。

图片

接下来,作者对CRE-gene的相关性进行排序,希望找到可以根据CRE的开放性来预测出该gene表达水平的基因。作者假设这些基因应该是一群高度受调节的基因,并且在皮层发生过程中对细胞命运起重要作用。作者取了前10%作为可以根据染色质开放性预测表达的基因(genes with predictive chromatin, GPCs),共185个。GO富集分析表明这些基因基本富集在和转录相关的条目上(transcription regulator activity, DNA-bind TF activity)。

图片

2.大脑皮层神经元发生的连续轨迹分析

作者接下来对一群主要的细胞类型,兴奋性神经元(GluN)进行进一步的专门的发育轨迹分析 ,以期望找到神经元特化、迁移和成熟过程中的基因表达调控机制和网络。这里主要通过对scRNA-seq的拟时序分析来研究这个问题。作者首先通过其他数据验证了拟时序结果的可靠性,然后将拟时序的时间值赋予在scATAC-seq上最近邻居的细胞以映射,获得在scATAC-seq上一个连续的拟时序结果。同样利用和之前一样的CCA算法,在GluN上分离出13989对CRE-gene对,并且分为五大群。GO富集分析显示,在拟时序上早期起作用的基因富集的条目包括细胞分裂和神经元祖细胞分化,而晚期的基因富集在神经元形态发生、迁移和成熟。有趣的是,编码转录因子和DNA结合蛋白出现在中期。相反,作者同样也找到了一些富集在早期和中晚期的DNA motif。

图片
图片

作者接下来研究了在拟时序上,转录因子调控的基因表达动态变化。作者观察到首先是早期 的PAX6, SOX2/6/9, GLI3和 ASCL1的motif,然后是中期的EOMES, NF1A, NF1B, NEUROD1,最后是晚期的NEUROD2, BHLHE22, MEF2C,表明在神经元发育过程中,DNA motif的时序激活。

图片

作者通过计算基因组层面上的转录因子和DNA motif的协同性和相关性,想知道在皮层发生过程中,各转录因子是如何协调的。他们发现在拟时序上,存在三大类motif,早期的 motif是中度的协同,包括SOX,GLI,PAX,中间态的motif之间非常高的协同程度,包括NFI,TBX/EOMES,而晚期的motif呈现最不协同作用,包括NEUROD2,BHLHE22,MEF2。

图片

3.基因表达和细胞命运决定的关系:模块分析

由于各胶质细胞cluster基因表达存在一定的重叠,作者接下来采用了fuzzy c-means clustering (FCC)的方法来对各cluster进行基因模块的聚类和注释。FCC方法得到了14个基因模块,并且在拟时序上,样本类型和之前的cluster都可以被每个基因模块区分,每个基因模块也富集不同的GO term。因此,这种模块的分析让作者有可能去研究不同模块之间所包含的基因重叠的程度,而这种重叠程度有助于理解各cluster之间的发育分化关系。

采用这种方法,作者发现ASCL1+的表达m3和m8的细胞最终分化成EOMES+的nIPC细胞;HES4+的表达m6的细胞分化成星型胶质细胞和室管膜细胞;ASCL1+/OLIG1+表达m12,m1,m4的细胞产生两个分支,表明ASCL1+/OLIG1+很可能是星型胶质细胞和少突胶质细胞的共同前体细胞。

图片

4.星型胶质细胞的异质性分析

人皮层星型胶质细胞存在很大的异质性,但是异质性是如何产生的至今不清楚。作者发现表达星型胶质细胞标志物的m2,m13,m14 模块存在相互联系,提示这可能是研究上述问题的一个切入点。作者计算了m13、m14包含的基因和其enhancer的motif的富集程度,发现ASCL1和NHLH1在m13富集,而SOX21在m14富集。而ASCL1和NHLH1和OLIG1相关,因此,作者提出OLIG1和SOX21 motif的开放性不同即区分了不同的星型胶质细胞基因表达模式。作者检查了m2/m14和m13的不同的基因表达,发现前者高表达HES4和CAV2,后者高表达SPARCL1,ID3和IGFBP7,印证了存在星型胶质细胞的祖细胞的异质性。

图片

5.GPCs和细胞命运决定

作者探究祖细胞中的染色质状态如何决定下游细胞获得不同表达模式从而获得不同的细胞命运。作者关注了表达细胞周期相关基因模块的细胞病研究其异质性。作者投射了13378个胶质细胞,同样使用CCA算法,将染色质开放性的数据和转录组数据相关联。scATAC-seq鉴定出几个不一样的细胞分支,作者发现,根据基因活性评分得到的每个分支的特异性基因均和GPCs有部分的重叠,包括HES1,RFX4,OLIG1,OLIG2,NEUROD6, EOMES。并且,总体上分裂细胞的三个分支的不同表达基因也在GPCs基因列表中富集。每一个分支在前五个特异基因(BHLHE40, OLIG1, OLIG2, NEUROD6, NEUROD4)中至少富集一个基因。这些结果表明染色质的不同活力以及GPCs的表达水平决定了Cyc细胞向何种细胞类型分化。作者发现,在Cyc细胞中,GPC基因的染色质模式已经提前建立了,即进入细胞周期的祖细胞已经在表观遗传学上发生了命运决定的修饰,并且特异性的由GPCs编码。

研究结论

本研究结合scRNA-seq和scATAC-seq对四个时期的胎儿大脑皮层细胞进行联合分析,完成了人大脑皮层发生过程中各细胞类型的单细胞基因表达和调控图谱,发现了在皮层发生过程中,一系列可以通过染色质开放性预测表达水平的基因,进一步的深入研究,发现了神经元和胶质细胞发育分化的路径以及不同的转录因子在这些过程中的调控机制,同时还发现在星型胶质细胞祖细胞中即存在异质性。

参 考 文 献

1. Granja, J.M., Klemm, S., McGinnis, L.M., Kathiria, A.S., Mezger, A., Corces, M.R., Parks, B., Gars, E., Liedtke, M., Zheng, G.X.Y., et al. (2019). Single cell multiomic analysis identifies regulatory programs in mixed-phenotype acute leukemia. Nat. Biotechnol. 37, 1458–1465.

2. Stuart, T., Butler, A., Hoffman, P., Hafemeister, C., Papalexi, E., Mauck, W.M., 3rd, Hao, Y., Stoeckius, M., Smibert, P., and Satija, R. (2019). Comprehensive Integration of Single-Cell Data. Cell 177, 1888–1902.e21.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多