分享

长链非编码RNA/LncRNA研究,读这篇文章就足够了!

 zhuqiaoxiaoxue 2017-12-14


1.认识一下长非编码RNA

定义

非编码RNA (non-coding RNA,ncRNA)指不翻译成多肽的RNA。按照长度不同,短于200nt的归为小非编码RNA (small ncRNAs,sncRNAs),长于200nt的归为长非编码RNA (long ncRNAs,lncRNAs)。

分类

根据染色体上与编码基因的相对位置将lncRNA分为反义型(antisense lncRNAs)、内含子型(intronic lncRNAs)、反向型(divergent lncRNAs)、基因间型(intergenic lncRNAs)、启动子上游型(promoter upstream lncRNAs)、启动子型(promoter-associated lncRNAs)、转录起始位点型(transc ription start site-associated lncRNAs) [1, 2] (图1)。

图1. 根据染色体上与编码基因的相对位置对ncRNA进行分类。

lncRNAs作用范围广泛,机制非常复杂,这里从基因调控的角度重点讲一讲。为了方便大家的理解,咱们来看看lncRNA的特点。简单讲,lncRNA的本质是RNA,是由核苷酸组成的长链,有以下几个优势:(1) 可以轻松的与同源DNA序列(转录lncRNA的基因以及序列相似的基因)结合;(2) 可以轻松的与同源RNA序列结合;(3) 其丝带般的特点可以折叠成复杂的二级结构,轻松与多种蛋白质结合。也就是说,lncRNA情商极高,与上层领导(DNA)关系暧昧,与同事(RNA)关系很铁,与下属(蛋白质)关系紧密。这样八面玲珑的lncRNA那肯定是相当吃得开啊。

2.lncRNA参与转录前调控

顾名思义,转录前调控就是对转录事件发生之前的准备阶段进行调控,主要指染色质开放或关闭状态的调控——想要使原来不转录的基因开启转录,就需要染色质从关闭状态转换为开放状态;想要使原来转录的基因不再转录,就需要染色质从开放状态转换为关闭状态。染色质的状态由表观修饰因子决定:富含H3K4me3、H3K36me3及组蛋白乙酰化等激活型组蛋白修饰的为开放状态;富含H3K9me3、H3K27me3、H4K20me3及DNA甲基化等抑制型组蛋白修饰的为关闭状态。表观修饰是由表观因子催化建立或擦除的,表观因子的本质是蛋白,那么问题来了,蛋白质结构是固定的,但基因组DNA序列变幻莫测,那究竟怎么实现染色质状态的精确调控呢?这时候就到八面玲珑的lncRNA出场的时候了——lncRNA以其中一部分区域与DNA结合,然后其他部分折叠成高级结构,与表观因子结合,这样就轻松地牵了线,搭了桥

2.1 lncRNA调控组蛋白修饰

>>>>Xist与顺式H3K27me3建立

X染色体失活(X chromosome inactivation,Xi)是哺乳动物雌性个体的一种剂量补偿效应[3],通过抑制型表观修饰锁住一条X染色体。Xist (X染色体失活特异转录本,X chromosome inactivation specific transc ript)是X染色体失活中心内鉴定出的第一个Xi相关基因,也是最关键的Xi调控基因。Xist能顺式(in cis)包裹X染色体,并募集异染色质修饰蛋白PRC2等建立H3K27me3,引起转录沉默,最终导致整条染色体失活[4],该过程有lncRNA RepA (Xist基因5’端的腺嘌呤重复区转录本)的协同参与(图2)[5]。

图2. Xist与RepA协同包裹X染色体并募集PRC2建立H3K27me3引起X染色体失活。

>>>>Bxd与顺式H3K4me3建立

果蝇Hox基因簇内研究的首个lncRNA是Bxd (似双胸转录本,Bithoraxoid),其基因座是位于UBx基因(超级双胸基因,Ultrabithorax)和Abd-A基因之间的调控序列——ubx-TRE (Ubx基因相关顺式三胸复合体反应元件,Ubx cis-regulatory trithorax response elements)。Sanchez-Elsner对果蝇成虫盘细胞及S2细胞的研究表明,Bxd能与ubx-TRE结合并募集TrxG成员组蛋白甲基转移酶ASH1,激活Ubx转录[6] (图3)。

图3. Bxd与ubx-TRE结合并募集ASH1激活Ubx转录。

>>>>HOTAIR与反式H3K27me3建立及H3K4me3擦除

HOTAIR是目前研究较清楚的参与人Hox基因簇调控的关键基因之一。HOTAIR位于Hoxc11和Hoxc12之间,通过与两个关键的组蛋白修饰复合体相互作用,反式(in trans)调控HoxD基因簇的表达:催化H3K27me3建立的PRC2复合体[7],及催化H3K4me2/3擦除的LSD1-CoREST-REST复合体(组蛋白特异性去甲基化酶1 - RE1结构域转录抑制因子共抑制因子1 - RE1结构域转录抑制因子复合体,lysine-specific demethylase1-RE1-Silencing Transc ription factor corepressor 1-RE1-Silencing Transc ription factor complex,LSD1-CoREST-REST)[8](图4)。

图4. HOTAIR通过与两个组蛋白修饰复合体相互作用反式调控HoxD基因簇的表达。

>>>>HOTTIP与顺式H3K4me3建立

HOTTIP (HoxA基因簇末端转录本,HoxA transc ript at the distal tip)对HoxA基因簇5’区域基因(Hoxa13至Hoxa6)的表达具有调控功能。2011年,Wang, K. C.等[9]的研究表明,HOTTIP通过WDR5 (衔接蛋白WD重复序列蛋白5,WD repeat-containing protein 5)募集MLL (混合型白血病相关蛋白复合体,Mixed lineage leukemia)至HoxA基因簇5’区域,催化建立激活型染色质修饰H3K4me3,顺式激活Hoxa11和Hoxa13等基因的表达(图5)。

图5. 人HOTTIP通过WDR5募集MLL至HoxA基因簇5’区域,催化建立H3K4me3,顺式激活基因表达。

>>>>Mira与顺式H3K4me3建立

Bertani等以视黄酸(Retinoic acid,RA)处理的小鼠胚胎干细胞系(mES)为实验材料,通过RNA-ChIP (RNA-染色体免疫沉淀,RNA-chromatin immunoprecipitation)等技术研究发现,Mira能与其基因座形成DNA/RNA杂合体,并募集TrxG复合体成员MLL1,催化建立H3K4me3,激活相邻基因Hoxa6与Hoxa7的表达,导致mES向生殖系分化[10](图6)。

图6. Mira通过募集MLL激活相邻Hoxa6与Hoxa7基因的表达。

>>>>Evf2与组蛋白去乙酰化

DLX5和DLX6间的极端保守区(ultraconserved region)含2个Dlx5/6相关增强子(Dlx5/6-Enhencer,Dlx5/6-E,Dlx5/6-EI;Dlx5/6-EII)。Evf2是Dlx5/6-E相关的转录本。利用荧光素酶报告系统,Feng等发现在体外Dlx2存在条件下,Evf2能增强含Dlx5/6-E的SV40等启动子的转录活性,并且是剂量依赖的,但DLX2本身没有这种功能,表明Evf2可能作为DLX2的共激活因子(co-activator)增强Dlx5/6增强子活性[11]。而Evf2在低浓度条件下则能通过其Dlx6反义特性顺式抑制Dlx6转录,通过募集MECP2,进而募集HDAC,使组蛋白去乙酰化,抑制Dlx5基因的转录(图7)。

图7:Evf2在高浓度条件下作为DLX2的共激活因子,增强Dlx5/6增强子活性,激活Dlx5及Dlx6转录。Evf2在低浓度条件下能通过其Dlx6反义特性顺式抑制Dlx6转录,通过募集MECP2,进而募集HDAC,抑制Dlx5。

>>>>asOct4-pg5与反式H3K27me3及H3K9me3的建立

Oct4的表达受到asOct4-pg5的调控。asOct4-pg5是Oct4假基因5 (Oct4 pseudogene 5, Oct4-pg5)的反义无poly(A)结构lncRNA。asOct4-pg5能募集EZH2及G9a等组蛋白甲基转移酶结合到Oct4及Oct4-pg5启动子区,建立H3K27me3、H3K9me3等抑制型染色质修饰,进而抑制Oct4及Oct4-pg5的转录;而当asOct4-pg5与PURA (富嘌呤元件结合蛋白A,purine rich element binding protein A)及NCL(核仁蛋白,nucleolin)结合后会失去募集EZH2及G9a的能力,抑制功能消失[12] (图8)。

图8. asOct4-pg5与Oct4表达调控。A:存在一种Oct4-pg5反义的无poly(A)结构的lncRNA——asOct4-pg5。B:asOct4-pg5能募集EZH2及G9a等组蛋白甲基转移酶结合到Oct4 (或Oct4-pg5,图中未显示)启动子区,建立H3K27me3、H3K9me3等异染色质修饰,进而抑制Oct4的转录。C:当asOct4-pg5与PURA及NCL结合后会失去募集EZH2及G9a的能力。

>>>>ANRIL (p15AS)与H3K4me3、H3K9me3及H3K27me3

Hansen等发现了INK4基因座反义非编码RNA,命名为ANRIL (antisense noncoding RNA in the INK4 locus),Yu等也发现了INK4基因座反义非编码RNA,命名为p15AS [13],为方便起见统一命名为ANRIL。RACE分析表明ANRIL并非单一转录本,有很多剪接形式存在,甚至有环状的ANRIL (circular ANRIL,cANRIL)[14]。研究表明,ANRIL能顺式(主要模式)及反式作用于INK4β基因的启动子及外显子1,导致H3K4me3水平降低,H3K9me3水平升高,促进异染色质形成,引起INK4β转录沉默[13] (图9)。

以人前列腺癌细胞系PC-3为材料,Yap等发现RNA polII转录的新生的ANRIL能与PRC1组分CBX7 (Chromo结构域蛋白同系物7,Chromobox protein homolog 7)结合,促进异染色质形成,同时形成的ANRIL-CBX7复合体能解除CBX7与H3K27me3的结合,使转录抑制处于一种动态变化状态[15] (图9)。Kotake等的研究表明,INK4β/INK4α/ARF基因簇H3K27me3等抑制型修饰的建立,是ANRIL募集PRC2实现的,其中ANRIL与亚基SUZ12结合,顺式抑制INK4β的转录[16](图9)。

图9. 新生的ANRIL能与CBX7结合,促进异染色质形成,同时形成的ANRIL-CBX7复合体能解除CBX7与H3K27me3的结合,使转录抑制处于一种动态变化状态。ANRIL募集PRC2,使INK4β/INK4α/ARF基因簇建立H3K27me3等抑制型修饰。ANRIL与SUZ12结合,顺式抑制INK4β的转录。

>>>>DBE-T与顺式H3K36me2建立

面肩胛臂肌肉萎缩(facioscapulohumeral muscular dystrophy,FSHD)是一种常染色体显性遗传疾病,是由于D4Z4重复序列拷贝数降低导致的。FSHD病人由于D4Z4重复序列拷贝数降低,导致DBE-T (D4Z4重复序列结合元件转录本,D4Z4 repeat binding element transc ript)特异性转录[17]。Cabianca等的研究表明,D4Z4重复序列的丢失,导致PcG蛋白不能与该区域结合,PRC2建立的H3K27me3及PRC1建立的抑制型修饰H2AK119ub1 (组蛋白H2A第119位赖氨酸残基单泛素化,histone H2A lysine 119 monoubiquitination)丢失[17, 18];同时,DBE-T是一种染色质定位的lncRNA,能顺式的通过募集TrxG蛋白成员Ash1L至4号染色体长臂第35区(4q35),催化建立激活型修饰H3K36me2 (组蛋白H3第36位赖氨酸残基二甲基化,histone H3 lysine 36 dimethylation),导致染色质重塑,激活4q35区域基因的转录,最终导致FSHD疾病的发生[17](图10)。

图10. DBE-T能顺式募集Ash1L至4q35区,催化建立激活型染色质修饰H3K36me2,激活4q35区基因转录,最终导致FSHD疾病的发生。

>>>>NeST与反式H3K4me3建立

NeST (nettoie Salmonella pas Theiler’s [cleanup Salmonella not Theiler’s])是发现的首个与免疫反应相关的lncRNA。在小鼠中,其基因座与γ干扰素基因(Interferon-γ,Infg)毗邻。NeST最初被认为是泰勒病毒(Theiler’s virus)易感位点。NeST定位于细胞核内,属于增强子型lncRNA。在活化的CD8+ T细胞中,NeST通过与衔接蛋白WDR5结合,募集MLL,反式激活Ifng (图11),从而提高了抗肠炎沙门菌亚属鼠伤寒病毒(Salmonella enterica Typhimurium)的能力[19]。

图11. 在活化的CD8+ T细胞中,NeST通过与衔接蛋白WDR5结合,募集MLL反式激活Infg。

>>>>ncRNA-CCND1与顺式组蛋白乙酰化

研究发现,在受到电离辐射后,CCND1启动子及5’调控区转录形成多种ncRNA-CCND1 (细胞周期蛋白D1的5’调控区相关非编码转录本,ncRNAs transcribed from the cyclin D1 5’ regulated region),这些含寡聚GGUG的lncRNA能结合并激活TLS (脂肪瘤内异位蛋白,translocated in liposarcoma),进而顺式募集TLS至CCND1启动子的CRE区(CREB调控元件,CREB regulate element),抑制CBP、EP300等的组蛋白乙酰化转移酶(histone acetylation transferase,HAT)活性。由于CCND1的转录依赖H3K9/K14ac (组蛋白H3第9位及第14位赖氨酸残基乙酰化,histone 3 lysine 9/14 acetylation),因此CBP/EP300 HAT活性的抑制直接导致CCND1沉默[20] (图12)。

图12. CCND1启动子及5’调控区转录形成多种ncRNA-CCND1,这些含寡聚GGUG的lncRNA一方面能结合并激活TLS,另一方面则顺式募集TLS至CCND1启动子的CRE区,抑制CBP、EP300等的HAT活性,导致CCND1沉默。

>>>>PTENpg1 uasRNA α及PTENpg1 asRNA α与异染色质化

PTEN (磷酸酶与张力蛋白同源蛋白,phosphatase and tensin homolog)基因是一种肿瘤抑制基因[21]。研究表明,PTEN的假基因1 (PTEN pseudogene,PTENpg1)[22]以及PTENpg1的反义RNA(PTENpg1 antisense RNA,PTENpg1 asRNA)[23]均属于lncRNA基因,参与了PTEN的表达调控。

PTENpg1 asRNA有三种:未剪切的PTENpg1 uasRNA α、剪切的PTENpg1 asRNA α及PTENpg1 asRNA β。PTENpg1 uasRNA α及PTENpg1 asRNA α能反式作用于PTEN启动子区,募集DNMT3a及EZH2导致PTEN启动子区异染色质化,从而在转录前水平抑制PTEN的表达。

PTENpg1 asRNA β则能与PTENpg1相互结合,增加PTENpg1的稳定性并促进其出核进入胞质,同时,PTENpg1可作为ceRNA,吸附针对PTEN的miRNA,从而削弱了miRNA对PTEN的负调控,增强了PTEN mRNA的稳定性,在转录后水平促进PTEN的表达[23] (图13)。

图13. PTENpg1 uasRNA α及PTENpg1 asRNA α能反式作用于PTEN启动子区,募集DNMT3a及EZH2导致PTEN启动子区异染色质化,从而在转录前水平抑制PTEN的表达;PTENpg1 asRNA β则能与PTENpg1相互结合,增加PTENpg1的稳定性并促进其出核进入胞质,同时能增强PTENpg1吸附针对PTEN的miRNA的能力,从而削弱了miRNA对PTEN的负调控,增强了PTEN mRNA的稳定性,在转录后水平促进PTEN的表达。

>>>>Kcnq1ot1与Kcnq1基因座沉默

基因印记是一种表观遗传机制,是一种二倍体细胞中父母亲本特异的基因表达模式。为什么哺乳动物放弃二倍体优势而进化出印记沉默系统是自印记现象发现以来一直困扰生物学者们的难题之一。

印记基因一般成簇存在,印记基因簇受印记调控元件(Imprinting control element,ICE)的调控[26]。印记基因簇的共同特征是都含有配子差异性DNA甲基化区域(Differentially DNA-methylated region,DMR)。目前定义了两种印记基因簇:Igf2r、Kcnq1、Gnas、Pws等印记基因簇的DMR在卵子成熟过程中获得母源甲基化印记,这种含母源DNA甲基化印记DMR的印记基因簇为I型印记基因簇;Igf2、Dlk1、Rasgrf1等印记基因簇在精子发生过程中获得父源甲基化印记,这种含父源DNA甲基化印记DMR的印记基因簇为II型印记基因簇。

印记基因簇中至少含1个lncRNA [27, 28],但这些lncRNA的调控功能还需要进一步的研究。目前认为I型印记基因簇的印记状态的稳定与lncRNA的表达有关。Pandey等证明Kcnq1ot1能募集G9a及PRC2,催化建立H3K27me3及H3K9me3等异染色质修饰,导致Kcnq1基因座沉默[29];Faizaan等发现Kcnq1ot1能与DNMT1形成复合体,催化建立DNA甲基化,导致Kcnq1基因座沉默[30](图14)。

图14. Kcnq1ot1能募集G9a及PRC2,催化建立H3K27me3及H3K9me3等异染色质修饰,还能募集DNMT1,催化建立DNA甲基化,导致Kcnq1基因座沉默。

>>>>pRNA与rDNA异染色质化

在mES中,pRNA前体IGS-rRNA (intergenic spacer rRNA)抑制TTF-1 (RNA聚合酶I转录终止因子1,RNA polymerase I transc ription termination factor 1)与TIP5 (TTF-1互作蛋白5,TTF1-interacting protein 5)的结合,保护rDNA不被异染色质化,而在mES分化后,IGS-rRNA被加工成成熟的pRNA,pRNA介导TTF-1与TIP5形成复合体,进而将其募集至rDNA启动子区域,造成DNMT家族及PARP1的富集,最终导致rDNA异染色质化[24, 25](图15)。

图15. mES分化后成熟的pRNA通过介导TTF-1与TIP5形成复合体进而促进rDNA异染色质化。

>>>>lncRNA与裂殖酵母臂间区异染色质化

在裂殖酵母,臂间区外侧重复序列的转录及其下游过程与异染色质建立相关[31]。裂殖酵母异染色质建立的机制有2种假说:(1) siRNA机制,即RNA聚合酶II (RNA polymerase II,RNA PolII)先起始转录产生lncRNA,然后RDRC (RNA指导的RNA聚合酶复合体,RNA-directed RNA polymerase complex)识别并结合正在转录的lncRNA,合成双链RNA (double strand RNA,dsRNA),同时RDRC的Cid12亚基催化dsRNA末端多聚腺苷酸化,进而被Dicer识别结合并加工成siRNA,组成RITS,其Argonaute (Ago1)亚基结合siRNA并与正在转录的重复序列lncRNA结合,其含chromo结构域的Chp1亚基则与H3K9me2/3结合,募集组蛋白甲基转移酶Clr4及异染色质结合蛋白Swi6等,实现异染色质化(图16);(2) 组蛋白修饰H3K9me2/3直接募集RITS及RDRC至正在转录的异染色质lncRNA上,不涉及siRNA。

图16. 裂殖酵母异染色质形成机制

2.2lncRNA调控DNA甲基化修饰

>>>>Tsix与DNA甲基化

Tsix (跨越Xist全长的反向非编码RNA)是最主要的Xist负调控基因。Tsix能结合于Xist基因5’端两CTCF (CCCTC结合因子,CCCTC-binding factor)结合域之间,募集抑制型表观因子(如CTCF、DNMT、EED [32]),催化DNA甲基化(主要)及H3K9me3 (次要)的建立[33]。Jpx则通过结合CTCF抑制了CTCF对Xist的转录抑制,从而起到激活Xist转录的作用[34] (图17)。

图17. Tsix通过募集CTCF等使Xist启动子区甲基化而抑制Xist转录,Jpx则通过结合CTCF抑制了CTCF对Xist的转录抑制。

>>>>Khps1a与DNA甲基化

Khps1a (鞘氨醇激酶1反义转录本a,sphingosine kinase-1 antisense type a)指导鞘氨醇激酶1(sphingosine kinase-1,Sphk1)的组织依赖型差异甲基化区(tissue-dependent differentially methylated region,T-DMR)去甲基化[35]。大鼠肾细胞系NRK的Sphk1 T-DMR区是全甲基化的,但过表达Khps1a后T-DMR区显著去甲基化,且有2个CC(A/T)GG位点发生甲基化(CmC(A/T)GG),具体机制尚不明确(图18)。

图18. Khps1a以某种未知机制参与了Sphk1的T-DMR区去甲基化.

>>>>Dum与DNA甲基化

2015年Wang等在骨骼肌成肌细胞中鉴定出lncRNA Dum (发育多能性相关基因2上游肌相关lncRNA,Developmental pluripotency-associated 2 upstream binding muscle lncRNA)。Dum能顺式募集DNMT1、DNMT3A、DNMT3B等至邻近基因Dppa2的启动子区,并造成该区域甲基化沉默,从而抑制Dppa2的表达,导致骨骼肌成肌细胞向肌细胞分化[36](图19)。

图19. Dum能顺式募集DNMT1、DNMT3A、DNMT3B等至邻近基因Dppa2的启动子区,并造成该区域甲基化沉默,从而抑制Dppa2的表达,导致骨骼肌成肌细胞向肌细胞分化。图片引自Wang et. al, 2015.

3.lincRNA参与转录调控

转录调控是指对转录过程的调控。咱们这里讨论的是RNA polII参与的II类启动子的转录。转录过程分为起始(Initiation)、延伸(Elongation)和终止(Termination) 3个过程。

转录起始过程是RNA polII在核心转录因子(TBP、TFIIB、TFIIE、TFIIF等)帮助下与核心启动子结合,DNA局部解旋,合成9nt的RNA,由于RNA polII的C末端结构域(C terminal domain,CTD)磷酸化水平很低,因此转录暂停。

转录延伸过程是结合于增强子序列的转录因子(Transc ription factors,TFs)使RNA polII的CTD高度磷酸化,转录过程迅速延伸(磷酸化水平决定延伸速度)。

转录终止过程是polyA信号位点AATAAA(或ATTAAA)被转录为AAUAAA(或AUUAAA)的RNA序列后,延伸复合体里面的转录终止因子CSTF (切割刺激因子,Cleavage stimulation factor)和CPSF (切割及多聚腺苷酸化特异因子,Cleavage and polyadenylation specificity factor)迅速与AAUAAA(或AUUAAA)结合,并在其之后11-50nt处切断RNA,然后催化末端加上一串的A (大家可以观察一下mRNA序列,一般在AATAAA(或ATTAAA)之后11-50nt后出现一连串的A)。RNA被切断后转录活性下降,再加上polyA信号位点AATAAA(或ATTAAA)之后的序列富含T或GT,很容易导致延伸复合体解散(图20)。

图20. RNA polII介导的转录过程

只要涉及蛋白质与DNA的互作,lncRNA就有机可乘,因此在转录过程的调控中,lncRNA可以:(1) 通过结合增强子控制TFs与增强子的互作从而调控增强子活性;(2) 通过转录事件抑制RNA polII复合体与启动子结合从而实现转录干扰;(3) 因其与DNA很像,可作为诱饵捕获TFs,从而控制转录因子的活性。

3.1 lncRNA的增强子活性

>>>>Xite与DXPas34以增强子活性顺式调控Tsix的表达

小卫星序列DXPas34是Tsix启动子的增强子[37]。DXPas34基因是双向转录的,在小鼠雌性ES细胞Xi发生初期,DXPas34基因双向转录产生Dxpas-f和Dxpas-r,促进Tsix表达;Xi完成后,DXPas34基因单向转录产生Dxpas-r,通过转录干扰(transc ription interference)使Tsix沉默[38] (图20)。Xite (Xi相关基因间转录元件,X-inactivation intergenic transc ription element)也是Tsix启动子的增强子(图21),敲除Xite后Tsix转录下调,Xi轻微失衡[39]。

图21. Xite与DXPas34以增强子活性顺式调控Tsix的表达

>>>>ncRNA-activiting的增强子模型

2010年De Santa等鉴定出3216个lincRNA,其中有2236个(69%)位于增强子内[40]。Orom等在人细胞系中鉴定出了一系列lincRNA,通过siRNA干扰实验证明ncRNA-a7 (ncRNA-activiting)对于Snai1的转录激活是必需的,用荧光素酶报告系统证明,ncRNA-a7作用依赖全长ncRNA-a7转录,且不受位置效应及方向性的限制,符合增强子的特征(又如ncRNA-a3与Tal1)[41, 42]。2013年Lai等通过3C技术证明了ncRNA-a基因座与靶基因间DNA环的存在,同时,通过干扰参与转录激活的因子,Lai等证明ncRNA-a的增强子活性是由转录共激活复合体Mediator介导的[43]:MED1、MED12等亚基介导了ncRNA-a与靶基因启动子区的结合,而CDK8亚基能催化激活型修饰H3S10ph (组蛋白H3第10位丝氨酸残基磷酸化,histone H3 serine 10 phosphorylation)的建立,进而促进转录激活(图22)。

图22. ncRNA-a7以增强子活性促进Snail转录,其中Mediator作为媒介是已知的

3.2lncRNA调控绝缘子功能

>>>>LINoCR抑制下游绝缘子活性

Lefevre等的研究表明,LINoCR (脂多糖诱导的非编码RNA,lipopolysaccharide inducible non-coding RNA)在脂多糖(lipopolysaccharide,LPS)诱导鸡溶菌酶(Lysozyme,LYZ)表达的过程中,起到关键作用[44]。正常情况下,LYZ上游绝缘子结合CTCF,进而募集cohesin蛋白,抑制增强子的功能,LYZ处于沉默状态;LPS诱导后,LINoCR转录,导致绝缘子不再与CTCF结合,解除了绝缘子对增强子的抑制作用,激活LYZ的表达[44] (图23)。

图23. 正常情况下,LYZ上游绝缘子结合CTCF,抑制增强子的功能,LYZ处于沉默状态;LPS诱导后,LINoCR转录,导致绝缘子不再与CTCF结合,解除了绝缘子对增强子的抑制作用,激活LYZ的表达。

3.3lncRNA的转录干扰功能

>>>>Dxpas-r干扰Tsix的转录

上文提到,DXPas34基因单向转录产生Dxpas-r,通过转录干扰使Tsix沉默[38] (图21)。

>>>>Srg1干扰Ser3的转录

Martens等的研究表明,酿酒酵母Saccharomyces cerevisiae的SER3基因[丝氨酸(Serine,Ser)生物合成相关3-磷酸甘油酸脱氢酶,3-phosphoglycerate dehydrogenase in the biosynthesis of serine]的转录受到lncRNA SRG1 (SER3调控基因1,SER3 regulatory gene 1)的调控[45, 46]。Ser丰富的情况下,Ser与Ser依赖的转录因子Cha4结合,Ser-Cha4能与SRG1启动子结合,募集SAGA (Spt-Ada-Gcn5 Acetyltransferase)及SWI/SNF (SWItch/Sucrose Non-Fer-mentable),参与酵母交配型转换(mating type switching)及调控启动蔗糖发酵过程的转化酶SUC2等转录共激活因子,激活SRG1转录,转录延伸至下游的SER3基因座[46],转录延伸复合体成分Spt2造成SRG1启动子区核小体沉积,使RNA polII不能与SER3启动子结合,造成转录干扰[47] (图24)。

图24. Ser丰富的情况下,Ser-Cha4与SRG1启动子结合,募集SAGA及SWI/SNF等转录共激活因子,激活SRG1转录,转录延伸至下游的SER3基因座,转录延伸复合体成分Spt2造成SRG1启动子区核小体沉积,使RNA polII不能与SER3启动子结合,造成转录干扰。

>>>>Pwr1干扰Icr1的转录;Icr1干扰Fol11的转录

Fol11是酵母菌(yeast)适应环境变化的关键基因之一,Bumgarner等的研究表明,lncRNA Pwr1及lncRNA Icr1参与了Fol11的转录调控[48]。位于Pwr1与 Fol11之间的调控区是Fol11的关键调控区,含有组蛋白去乙酰化酶RPD3L、转录激活因子Flo8、转录抑制因子Sfl1的结合位点。当RPD3L与调控区结合时,引起包括Sfl1结合位点在内的局部染色质固缩,结果Flo8与调控区结合,激活Pwr1,Pwr1转录导致其反义的Icr1沉默,同时Flo8激活Fol11转录;当RPD3L与调控区脱离时,Sfl1与调控区结合,抑制Pwr1,Icr1转录,转录延伸至Fol11启动子区,造成转录干扰[48] (图25)。

图25. 当RPD3L与调控区结合时,引起包括Sfl1结合位点在内的局部染色质固缩,结果Flo8与调控区结合,激活PWR1,PWR1转录导致其反义的ICR1沉默,同时Flo8激活FOL11转录;当RPD3L与调控区脱离时,Sfl1与调控区结合,抑制PWR1,ICR1转录,转录延伸至FOL11启动子区,造成转录干扰。

>>>>DHFRtinc干扰DHFR的转录

人DHFR基因(二氢叶酸还原酶,dihydrofolate reductase)启动子上游存在一个弱启动子[49],弱启动子的转录产物是一种lncRNA (笔者命名为DHFR transc ription interferencing ncRNA,DHFRtinc),延伸至DHFR的第二内含子[50]。在快速生长的细胞中,DHFRtinc不转录,DHFR活跃转录;在生长停滞的细胞中,DHFRtinc转录,DHFRtinc作为诱饵(decoy)与TFIIB结合,抑制DHFR启动子转录复合体的形成,造成转录干扰[51] (图26)。

图26. 在快速生长的细胞中,DHFRtinc不转录,DHFR活跃转录;在生长停滞的细胞中,DHFRtinc转录,DHFRtinc作为诱饵(decoy)与TFIIB结合,抑制DHFR启动子转录复合体的形成,造成转录干扰。

>>>>Airn干扰Igf2r的转录

印记基因簇中也存在lncRNA通过转录干扰抑制其他基因表达的情况。在Igf2r印记基因簇,Latos等通过不同程度截短Airn,发现Airn通过转录干扰抑制Igf2r的转录:Airn的转录本覆盖Igfr2启动子区后即可抑制Igf2r的转录,而不是Airn转录本本身的功能[52, 53] (图27)。

图27. Airn通过转录干扰抑制Igf2r的转录。图片引自Santoro et.al, 2013.

3.4 lncRNA控制转录因子

>>>>Gas5抑制激活型GR与靶基因结合

Gas5 (生长停滞特异转录本5,Growth-arrest-specific transc ript 5)是Schneider在1988年通过消减杂交筛选出的生长停滞细胞上调的lncRNA [54]。在某些环境胁迫因素(如营养匮乏)的胁迫下,Gas5作为诱饵,通过类似于糖皮质激素反应元件(glucocorticoid response elements,GRE)的高级结构域与糖皮质激素受体(glucocorticoid receptor,GR)的GRE结合结构域结合,竞争性抑制激活型GR(与糖皮质激素配体结合的GR)与靶基因结合,从而切断了GR信号通路的转导(GR的靶基因主要是凋亡抑制基因[55]),进而导致细胞生长停滞甚至凋亡,如阻止激活型GR与cIAP2 (细胞凋亡抑制因子2,cellular inhibitor of apoptosis 2)结合,促进细胞凋亡[56] (图28)。

图28. 在某些环境胁迫因素(如营养匮乏)的胁迫下,Gas5在胞质中作为诱饵,通过类似于GRE的高级结构域与GR结合,竞争性抑制激活型GR(与糖皮质激素配体结合的GR)与靶基因结合,从而切断了GR信号通路的转导,如阻止激活型GR与cIAP2结合,促进细胞凋亡。

>>>>lincRNA-p21调控hnRNP-K

p53直接调控lincRNA-p21的转录[57]。lincRNA-p21能抑制p53通路下游基因的激活,并调节凋亡。lincRNA-p21能与hnRNP-K (不均一核糖核蛋白K,heterogeneous nuclear ribonucleoprotein K)特异性结合,并通过调节hnRNP-K的定位来实现其部分基因表达调控功能(图29)。

2015年Bao等[58]的研究发现,在pre-iPS进一步重编程至iPS过程中,lincRNA-p21与hnRNP-K形成的复合体可招募H3K9甲基转移酶SETDB1及DNMT1至Nanog、Lin28、Sox2等多能基因启动子区,维持其H3K9me3及DNA甲基化,阻碍重编程。

>>>>Panda调控NF-YA

Hung等[59]的研究发现,DNA损伤能通过p53激活lncRNA PANDA [CDKN1A (p21)启动子相关转录本,p21 associated ncRNA DNA damage activated]。研究发现PANDA通过与NF-YA互作,抑制其对与凋亡基因启动子区的结合,从而起到对凋亡基因的抑制,参与细胞周期的调控(图29)。

图29. lincRNA-p21能与hnRNP-K特异性结合,Panda能与NF-YA特异性结合,调控一些凋亡及生长停滞基因的表达。

4.lncRNA参与转录后调控

转录后调控是指对转录得到的mRNA的加工和转运过程以及稳定性方面进行的调控。在此过程中,lncRNA利用其可以与RNA轻松结合的特点来进行调控。比如在mRNA的剪切过程中,如果lncRNA耍无赖结合到了剪切位点上,那么就导致该位点不能被切割了。比如在mRNA的转运过程中不小心遇到了核定位的lncRNA,然后lncRNA又耍无赖死活不让走,那这些mRNA就无效了;而如果遇到了开飞机出核的lncRNA,那么这些挤火车都不一定能挤上的mRNA (比如没有polyA尾巴的胞质定位的mRNA就相当于想回家但啥票也没买到的小可怜)则会迅速到家。再比如在RNA稳定性方面,lncRNA一方面可以与靶RNA直接结合,形成易于降解的结构域或更加稳固的结构域,来直接调控之,另一方面可以与针对靶RNA的miRNA们结合,通过牺牲自己间接保护之。

4.1lncRNA参与可变剪切调控

>>>>Malat1调控Cat1 pre-mRNA 的可变剪切

以Hala细胞为材料发现,Malat1的5’区域能与SRSF1 (富丝氨酸/精氨酸域剪切因子1,serine/argine-rich splicing factor 1)等富丝氨酸/精氨酸域(serine/argine-rich,SR)家族蛋白特异性结合,调节其核斑(nuclear speckles)定位及磷酸化,募集SR蛋白至转录活跃区,进而调控mRNA前体(pre-mRNA)的可变剪切,如Cat1 (半胱氨酸共轭化合物-α-酮戊二酸转氨酶,cysteine-conjugate alpha-ketoglutarate transaminase)的pre-mRNA的可变剪切(图30)[60, 61]。

图30. Hala细胞内,Malat1能与SR家族蛋白特异性结合,调节其核斑定位及磷酸化,募集SR蛋白至转录活跃区,进而调控mRNA前体的可变剪切。

>>>>51A ncRNA参与pre-SORL1的可变剪切

BACE1 (β-淀粉样蛋白前体裂解酶1,beta-site amyloid precursor protein cleaving enzyme 1)降解APP (淀粉样蛋白前体,amyloid precursor protein)为Aβ 1-42 (淀粉样蛋白β 1-42 ,amyloid-β 1-42)。Aβ 1-42的沉积是阿尔茨海默病(

alzheimer disease)的病理学特点之一。SORL1A (分选蛋白相关受体1的A亚型,Sortilin-related receptor 1A)是APP全蛋白的分选蛋白,与APP全蛋白结合后影响其在高尔基体囊泡的运输及酶解过程。51A ncRNA是与SORL1内含子1互补的内含子型lncRNA,参与pre-SORL1的选择性剪切,导致SORL1A蛋白水平剧烈下降,最终造成Aβ 1-42积累,引起阿尔茨海默病[62](图31)。

图31. SORL1A是APP全蛋白的分选蛋白,与APP全蛋白结合后影响了其在高尔基体囊泡的运输及酶解过程。51A ncRNA是与SORL1内含子1互补的内含子型lncRNA,参与pre-SORL1的选择性剪切,导致SORL1A蛋白水平剧烈下降,最终造成Aβ 1-42积累,引起阿尔茨海默病。

>>>>Zeb2-anti参与Zed2的可变剪切

Zed2 (E盒结合同源异型框锌指蛋白2,Zinc finger E-box-binding homeobox 2) mRNA的5’UTR区很复杂,既能形成发卡结构阻止核糖体结合,又含具有内部核糖体进入位点(internal ribosome entry sites,IRES)的调控内含子。在间质细胞中,Snail1激活Zed2反义RNA (Zed2 antisense RNA,Zeb2-anti,笔者命名),Zeb2-anti与Zeb2 5’UTR结合后覆盖了调控内含子的剪接供体(splice donor,SD),调控内含子不被切除,虽然5’UTR发卡结构不能打开,但核糖体可与IRES结合,顺利翻译。在上皮细胞中,不存在Zeb2-anti,调控内含子被切除,核糖体不能阅读Zeb2,不能产生ZEB2[63] (图32)。

图32. 在间质细胞中,Snail1激活Zeb2-anti (笔者命名),Zeb2-anti与Zeb2 5’UTR结合后覆盖了调控内含子的剪接供体,调控内含子不被切除,虽然5’UTR发卡结构不能打开,但核糖体可与IRES结合,顺利翻译。在上皮细胞中,不存在Zeb2-anti,调控内含子被切除,核糖体不能阅读Zeb2,不能产生ZEB2。

4.2lncRNA参与RNA亚细胞定位调控

>>>>PTENpg1 asRNA β促进PTENpg1出核

上文提到的PTENpg1不含polyA尾巴,因此其本身不能有效出核。PTENpg1 asRNA β能与PTENpg1相互结合,增加PTENpg1的稳定性并促进其出核进入胞质(图13)。

>>>>Neat1促进3′ UTR区具有IRAlus结构的mRNA在paraspeckles内的滞留

Neat1 (核内富集转录本1,nuclear enriched abundant transc ript 1)与细胞核亚结构paraspeckles的形成密切相关[64-68],并且参与了在3′ UTR区具有反向重复Alu元件(inverted repeated Alu,IRAlu)的mRNA在paraspeckles内的滞留[68],从而抑制了靶mRNA的出核。人类基因组富含Alu序列,因此Neat1在人类中功能可能更显著,Neat1可能与某些不孕症相关。

4.3 lncRNA参与RNA稳定性调控

>>>>BACE1-AS增加BACE1的稳定性

BACE1-AS是与BACE1部分互补的lncRNA [69],阿尔茨海默病患者的BACE1-AS水平高于正常人。BACE1-AS能与BACE1形成RNA双螺旋结构,从而增加了BACE1的稳定性,促使APP降解为Aβ 1-42,Aβ 1-42则通过正反馈机制促进BACE1-AS转录,从而最终导致Aβ 1-42沉积,引起阿尔茨海默病(图33)。

图33. BACE1-AS能与BACE1形成RNA双螺旋结构,从而增加BACE1的稳定性,促使APP降解为Aβ 1-42,Aβ 1-42则通过正反馈机制促进BACE1-AS转录,从而最终导致Aβ 1-42沉积,引起阿尔茨海默病。

>>>>PTENpg1 asRNA β增加PTENpg1的稳定性

上文已经讲过(图13)。

>>>>αHIF促进HIF-1α降解

低氧诱导因子1α反义转录本(Hypoxia-inducible factor 1 antisense transc ript,αHIF)与低氧诱导因子1 (Hypoxia-inducible factor 1,HIF-1α) mRNA的3’UTR结合后,使其AU-rich区暴露,更容易降解[70, 71]。

4.4lncRNA的ceRNA功能

>>>>PTENpg1作为ceRNA稳定PTEN

上文已经讲过(图13)。

>>>>linc-ROR作为ceRNA稳定Oct4等

在人胚胎干细胞(hES)的自我更新过程中Linc-ROR[72]能作为ceRNA吸附部分miRNA,如miR-45,从而增强核心多能因子Oct4、Sox2、Nanog等mRNA的稳定性,促进hES多能性状态的维持(图34)。

图34. Linc-ROR作为ceRNA保护Oct4等基因的mRNA。图片引自Wang et. al, 2013.

>>>>MDRL作为ceRNA促进pri-miR484成熟

线粒体动态相关lncRNA (mitochondrial dynamic related lncRNA,MDRL)参与核内pri-miR484的加工过程,从而参与了线粒体调节[73]。在心肌细胞及肾上腺皮质癌细胞中,miR484能通过抑制线粒体分裂蛋白FIS1的翻译,抑制线粒体的分裂及凋亡[74]。miR361主要定位于细胞核内,能直接与pri-miR484结合,抑制其被Drasha加工成pre-miR484的过程,而MDRL则可作为ceRNA吸附miR361,起到促进pri-miR484成熟的作用[73]。

参考文献若干,因字数超过微信限制,故不再罗列。

来源:醉心科学

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多