分享

m6A,RNA甲基化研究文献分享

 生物_医药_科研 2018-12-30

RNA甲基化的综合分析揭示了其在3’UTR和近终止密码子处富集

Comprehensive Analysis of mRNA Methylation Reveals Enrichment in 3' UTRs and Near Stop Codons


众所周知,基因组DNA和组蛋白上存在可逆的表观遗传修饰,这些修饰可调控基因的表达,并由此决定细胞的状态,影响细胞的分化和发育。近年来人们又发现,除了传统表观遗传修饰外,mRNA和其它RNA上也存在这一类修饰,发挥着固定的生理学功能。RNA甲基化在近几年成为研究领域的热点。

RNA甲基化(RNA methylation)是一类新认知的表观遗传修饰,在真核生物中主要包括 6-甲基腺嘌呤(N6-methyladenosine,m6A)和 5-甲基胞嘧啶(C5-methylcytidine,m5C)两类 RNA 转录后修饰。


2012年发表在CELL杂志上的文献(Comprehensive Analysis of mRNA Methylation Reveals Enrichment in 3' UTRs and Near Stop Codons)阐述了mRNA甲基化(m6A)在3’UTR和近终止密码子富集。

Abstract

肥胖风险基因FTO编码m6A去甲基化酶,表明m6A是生理过程的重要调控因子。在此,本文提出了一种全转录组m6A定位的方法,该方法结合了m6A特异性甲基化RNA免疫沉淀和下一代测序(MeRIP-Seq)。然后利用该方法对7676个哺乳动物基因中含有m6A的mRNA进行了鉴定,表明m6A是一种常见的mRNA碱基修饰。m6A修饰表现出组织特异性调节,并在整个大脑发育过程中显著增加。并且本文发现m6A位点在3' UTRs和终止密码子附近富集,并发现了m6A残基与3' UTRs内microRNA结合位点之间的联系。这些发现为识别腺苷甲基化的底物转录本提供了资源,并揭示了哺乳动物转录组表观遗传调控的见解。

文章主要得到了以下几个结果:

1. 哺乳动物mRNA中m6A的检测

由于m6A与未修饰的腺苷具有相同的碱基配对,因此无法通过标准测序或基于杂交的方法检测到。另外,m6A不易受化学修饰的影响,否则可能促进其检测,例如用于检测DNA中5mC的亚硫酸氢盐处理。迄今为止用于检测m6A的方法为用放射性标记的甲硫氨酸处理细胞,随后用薄层色谱或HPLC绘制放射性标记的m6A残基。为了简化m6A的检测,我们寻求开发免疫印迹策略。对于这些实验,作者使用m6A抗体。为了确保该抗体对m6A的特异性,作者使用固定在膜上的修饰寡核苷酸进行斑点印迹。m6A抗体选择性地与含有单个m6A残基的寡核苷酸结合,并且与含有未修饰的腺苷的寡核苷酸的结合可忽略不计,通过将抗体与增加浓度的富含m6A的竞争物RNA一起培育来竞争结合,然而,含有未修饰的腺苷的RNA不竞争结合。如下图所示:

 

为了探索各种RNA群体中m6A的丰度,我们从几个小鼠组织中分离RNA,并使用m6A抗体进行免疫印迹分析。我们发现m6A存在于所有测试的RNA样本中,表明这种修饰的核苷酸广泛分布在许多组织中,在肝,肾和脑中具有特别高的富集。如下图所示:

 

此外,我们观察到各种永生细胞系(包括几种癌细胞系)的m6A含量存在巨大差异,这进一步表明不同细胞群中存在m6A水平的巨大差异。

为了确定m6A是否存在于poly(A)尾部,我们使用oligo(dT)杂交和RNase H处理从细胞mRNA中选择性地去除poly(A)尾巴。缺少poly(A)尾的转录物没有表现出明显的m6A水平降低,此外,单独的免疫印迹poly(A)尾部显示出最小的m6A免疫反应性。总之,这些数据表明m6A主要是内部修饰,其在poly(A)尾部基本上不存在。如下图所示:

 

2. m6A的动态调控

本文观察到m6A在大脑内高度富集,这促使作者研究神经发育不同阶段m6A水平的时间动态。用m6A抗体免疫印迹RNA样品表明m6A在胚胎发生过程中以低水平存在于mRNA中,但在成年期显著增加。如下图所示:

 

另外,作者观察到FTO在哺乳动物细胞中过表达时降低了m6A水平,并且发现FTO的过表达导致大范围的RNA表现出降低的m6A免疫反应性。如下图所示:

 

结果3. MeRIP-Seq在整个转录组中识别含有m6A的RNA

为了识别整个转录组中的m6A位点,我们开发了一种方法,该方法将m6A特异性甲基化RNA免疫沉淀(MeRIP)与下一代测序(RNA-Seq)相结合。 MeRIP-Seq的方法涉及在免疫沉淀之前将RNA随机片段化为约100个大小的片段,如下图所示:

 

因为m6A位点可位于给定免疫沉淀的100nt片段长度的任何位置,所以预期测序reads将映射到其中心附近含有m6A位点的区域。在极端情况下,预计该区域大约200 nt宽。接下来利用MeRIP-Seq识别总小鼠脑RNA中的m6A位点。 从经常映射到mRNA的MeRIP样本中读取并聚集为不同的峰。正如预测的那样,这些峰值经常会聚到靠近中点的大约100 nt宽的区域,如下图所示:

 

结果4 在非编码rna中检测到m6A

本文发现m6A高峰(94.5%)主要是在mRNA中发现的。然而,作者也观察到,236个峰值(1.1%)映射到在RefSeq数据库中标注的非编码Rna上。此外,588个m6A峰没有与已知的RefSeq mRNA或ncRNA相对应。为了确定这些未加注释的峰值是否定位于其他数据库中预测的ncRNA,我们将它们与哺乳动物非编码RNA数据库中获得的小鼠(FANTOM3) RIKEN功能注释数据集的一组32,211个ncrna的基因组区域进行比对,作者发现其中216个峰映射到FANTOM3 ncRNA。这些ncrna的长度均大于200 nt,说明长ncrna是腺苷甲基化的底物。

结果5含m6a转录本的生化验证

作者接下来试图验证在经MeRIP-Seq鉴定的mRNA中是否存在m6A。为此,我们使用RNA pull-down实验,通过与目标特异性探针杂交,从小鼠大脑总RNA中分离出单个mRNA。分离出的mRNA使用m6A抗体进行免疫印迹分析,检测m6A的存在。利用该方法,我们验证了低密度脂蛋白受体(Ldlr)中m6A的存在。如下图所示:

 

结果6 包含m6a的mRNA参与重要的生物学通路

为了预测m6A的潜在信号通路和细胞过程,我们使用DAVID来识别富含m6A转录本的GO功能。我们发现编码含m6a RNA的基因参与了多种细胞功能,包括转录调控、RNA代谢和细胞内信号级联。此外,我们观察到m6A峰值映射到许多与神经发育和神经障碍相关的基因,如Bdnf、Dscam、Lis1、Ube3a,以及神经新生素和一些神经配体。总之,这些数据表明,含有m6a的RNA参与了与细胞信号和疾病相关的多种生物学通路。

结果7不同模式的m6A位于转录本

作者又研究了mRNA中腺苷甲基化的模式。来自许多基因的mRNA(46.0%)显示一个m6A峰,与一个m6A位点或一簇相邻的m6A残基一致。然而,37.3%包含两个m6A峰,11.2%包含三个峰,5.5%包含四个或更多峰。几个基因包含10个或更多的m6A峰,表明在其长度上存在多个m6A残基。事实上,在20个表现出最多m6A峰的基因中,所有的基因在其长度上都有15个或更多的m6A峰。此外,在包含一个以上m6A峰的基因中,90.1%包含两个或两个以上相邻的m6A峰,这表明m6A位点经常沿着转录本聚集在相邻区域。接下来作者确定哪些mRNA含有甲基化程度最高的m6A位点, 为此,作者开发了一种计算单个m6A峰处m6A富集水平的方法,该方法将每个峰内MeRIP样本读取的数量归一化为该峰所在的单个转录本的丰度。因此,局部m6A富集水平最高的峰可能代表一个具有高度甲基化的腺苷残基,或者多个甲基化程度较低的相邻m6A残基。然而,在这两种情况下,在这些位点观察到的高甲基化可能表明转录本受m6a依赖性调节过程的影响最大。

结果8 m6A在终止密码子附近和mRNA的3 ' UTRs中富集

接下来作者研究了转录组区域内m6A峰的分布。大多数(94.8%)m6A峰发生在基因内的区域。这些m6A峰主要富集在编码区(cd;50.9%)和非翻译区(UTRs;41.9%),内含子区相对较少(2.0%)。此外,在5 ' UTR(7.0%)中m6A峰的数量也少于3 ' UTR(93.0%)。虽然内含子区域中m6A峰的百分比较低,但由于样品未富集未剪接的pre-mrna,因此可能存在额外的甲基化内含子序列。如下图所示:

 

并且,研究发现,m6A在编码区的5 ' UTR和5 '端处于低水平。在编码区中,m6A的百分比随着转录本长度的增加而稳步上升,在编码区结束时比开始时高出5-6倍。在3 ' UTR中,峰值在终止密码子附近富集,并沿3 ' UTR长度富集递减。总的来说,这些数据表明m6A峰高度聚集在mRNA的停止密码子附近。如下图所示:

 

结果9 m6A发生在具有独特序列的高保守的区域内

接下来我们研究m6A位点是否在物种间保守。我们比较了30种脊椎动物m6A峰区域的PhyloP评分与基因外显子大小相同的随机区域的评分。我们发现保守m6A峰的分数的分布明显不同于随机区域,m6A高峰值保守得分远远高于随机区域。m6A经常发生在进化保守序列中,这一事实表明,包含m6A的区域是通过选择压力维持的。如下图所示:

 

然后,作者试图识别m6A峰内富集的序列基序。为了做到这一点,我们使用了FIRE,这是一种发现RNA调控元件的敏感且无偏的工具。值得注意的是,FIRE独立识别了GAC和AAC motif、G[AG]ACU以及相关变体([AC]GAC[GU]、GGAC、[AU][CG]G[AG]AC和UGAC)在m6A峰中高度富集。如下图所示:

 

接下来作者研究了这些基序在m6A峰中的位置。近30%的m6A峰只有一个motif,表明这些峰可能只含有一个甲基化残基。在m6A峰的中心也优先发现基序,说明这些峰值来自于一个位于中心的甲基化腺苷残基。值得注意的是,其他RNA调控元件,如富AU元件、poly(A)信号或已知RNA结合蛋白的结合位点,均未被FIRE识别,这表明m6A不太可能主要通过修饰这些已知的调控元件发挥作用。如下图所示:

 

结果10 m6A在剪接接头处不富集

另外,研究发现,m6A峰与外显子-外显子连接处没有明显重合,说明m6A不太可能直接影响剪接因子的结合。

结果11 m6A与3’UTRs内MicroRNA结合位点的关系

3’UTRs中m6A峰的强烈富集促使作者研究m6A峰是否在microRNA (miRNA)结合位点附近发生。作者发现,含有m6A峰值的3 ' UTR中,67%也包含至少一个靶向预测的miRNA结合位点。此外,作者发现3’UTRs内m6A峰的整体分布与miRNA结合位点呈反相关。虽然m6A峰值在停止密码子附近最为丰富,且通常沿3 ' UTR长度频率降低,但miRNA靶位点在3 ' UTRs的3 ' 尾端附近更为丰富。如下图所示:

 

接下来,作者试图确定大脑中针对mirna的转录本是否更有可能包含m6A。为了验证这一点,我们使用TargetScan来识别大脑中25个高表达mirna和25个低表达mirna的目标转录本。有趣的是,我们发现最高表达的mirna在包含m6A的靶转录本中所占的比例要大得多。这些数据表明miRNA水平可能控制其靶转录本的甲基化。如下图所示:

 

结果12 m6A分布的显著特征在人类转录组中是保守的

为了探究其他物种中是否也观察到m6A在3 ' UTR中的富集。因此,我们在HEK293T细胞中分析了m6A,这是一个具有高水平腺苷甲基化的人类细胞系。作者使用三次MeRIP-Seq生成了一个m6A高峰的高置信度列表,并得到了两种m6A抗体的证实。我们发现,在HEK293T细胞中m6A峰的分布与小鼠大脑中m6A峰的分布非常接近,分别有31%和53%的m6A峰位于3 ' UTR和CDS中。与m6A在小鼠大脑转录组的分布模式一样,HEK293T m6A的峰值主要分布在终止密码子附近。如下图所示:

 

综上所述,这些数据表明,在人类转录本的终止密码子附近m6A峰大量富集,在小鼠和人类转录本中,许多甲基化位点是保守的。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多