分享

国人高分综述 | Molecular Cancer:中南大学:lncRNA和circRNA编码的肿瘤相关功能肽的出现

 转录组 2021-04-20


编译:冬日暖阳,编辑:十九、江舜尧。

原创微文,欢迎转发转载。


哺乳动物基因组在转录过程中产生数以万计的非编码转录本人类转录组中大约98%的RNA是非编码的。非编码RNAncRNA)从基因组转录而未翻译成蛋白质,它在生理和发育过程中控制各种水平的基因表达,包括表观遗传修饰,转录,RNA剪接,支架组装等。NcRNA具有组织特异性表达模式,并且是潜在的生物标记。因此,它们可以作为临床诊断和预后指标。此外,以前被认为是非编码的ncRNA实际上可能能够编码小的生物活性肽功能性肽通常由ncRNA中的短开放阅读框(sORF)编码。NcRNA可以具有一个或多个sORF,这些sORF可以翻译成长度小于100个氨基酸的小肽。以前,传统的基因注释过程默认会过滤掉<100个氨基酸的蛋白质,并将其视为噪音或假阳性。因此,它们总是被忽略。但是,随着蛋白质组学和翻译技术的普及以及精确度和准确性的提高,人们发现许多ncRNA都是可翻译的。目前,已经认识到长链ncRNAlncRNA)和环状RNAcircRNA)包含可翻译为功能性小肽的sORF

LncRNA通常被定义为不编码蛋白质的长RNA转录物(>200个核苷酸),lncRNA的数量可能超过蛋白质编码转录本的数量,LncRNA参与基因表达的表观遗传调控。几种lncRNA类似于mRNA,可以通过RNA聚合酶II样蛋白编码途径转录,剪接,加帽和聚腺苷酸化,这些lncRNA具有与mRNA相似的组织修饰特征,剪接信号和外显子/内含子长度。在大多数情况下,lncRNAmRNA在生化上没有区别,只是它们缺乏编码蛋白质的阅读框。但是,质谱以及RNA测序和其他先进的分子技术表明,某些lncRNA具有非随机的长sORF,它们的外显子比蛋白编码基因中的外显子更为保守,它们可以与核糖体相互作用,并且可以编码蛋白质。成熟的microRNAmiRNA)是通过一系列核酸酶切割初级转录本(pri-miRNA)产生的。Pri-miRNAlncRNA的一种特殊类型,有数百或数千个核苷酸,并被RNA聚合酶II样蛋白编码基因转录。因此,pri-miRNA也可能能够编码蛋白质或肽。

CircRNA最近被发现为具有共价闭合结构的ncRNA。它们调节疾病的发展和发生,CircRNA由无5'-3'极性或聚腺嘌呤尾巴的RNA聚合酶II转录。它具有与线性RNA相同的转录效率,CircRNA长数百至数千个碱基,主要由外显子组成。研究表明,哺乳动物circRNA是内源的,丰富的,保守的和稳定的。CircRNA是控制基因转录的miRNA海绵,此外,circRNA中高度保守的ORF在体内和体外均以独立于5'帽结构的方式编码功能肽,例如内部核糖体进入位点(IRES)诱导,从而促进腺苷甲基化(N6-甲基腺苷;m6A)。由于circRNA具有独特的共价封闭结构,因此其中的ORF跨剪接位点甚至超过其长度循环。因此,它还可以生产长度>100个氨基酸的蛋白质。

本综述讨论了lncRNAcircRNA编码蛋白的当前研究进展。它集中于以下事实:某些与癌症相关的lncRNAcircRNA编码功能性小肽,这些小肽调节生物过程并影响肿瘤发生,侵袭,转移等。该评论还预测并鉴定了可以编码功能性小肽的潜在ncRNA

论文ID

原名:Emerging role of tumor-related functional peptides encoded by lncRNA and circRNA

译名:lncRNA和circRNA编码的肿瘤相关功能肽的出现

期刊:Molecular Cancer

发表时间:2020.2.4

影响因子:10.679

通讯作者:熊炜

通讯作者单位:中南大学肿瘤研究所

DOI号:10.1186/s12943-020-1147-3

综述内容

ncRNA编码潜力的预测和小肽的鉴定

鉴于对ncRNA编码多肽的兴趣日益增加,已经开发了许多预测和实验鉴定方法来确定ncRNA的编码能力包括阅读框预测,翻译起始成分预测,保守性分析以及翻译组学和蛋白质组学等。

开放阅读框预测:开放阅读框(ORF)是从ATG(或RNA中的AUG)开始并以三碱基组连续到终止密码子的核酸序列sORF的长度通常小于300nt。核糖体计算分析揭示了成千上万的未注释ORF,而较长的ORF最有可能被编码。在circRNA中,ORF和环化位点之间的位置关系很重要通常,跨越剪接位点的ORFcircRNA编码肽的独特特征。表1列出了用于预测ORF的网站和软件。

表1 ORFs预测方法分类

核糖体进入位点序列的预测:IRES是一种RNA调控元件,可募集核糖体,实现核糖体组装和阅读框蛋白质翻译,并启动独立于5'帽结构和直接翻译的蛋白质翻译。一项较早的研究发现,用IRES募集的核糖体体外构建了一个circRNA,并进行了翻译。在广泛的病毒RNA中发现了IRES某些真核mRNA中观察到IRES。大约10%的mRNA使用5'-UTR中的IRES募集核糖体。此外,circ-ZNF609UTR可以作为IRES,以剪切依赖性方式促进circ-ZNF609的翻译。由于这些生物具有高度复杂的基因组和细胞调控网络,因此在高等真核生物中可能难以检测到IRESIRES主要出现在它们控制的ORF上游的5'-UTR中。但是,也有例外ORF之间可以看到某些IRES,而其他IRES则位于其中。细胞中的IRES序列通常不如病毒中的活跃和有效。尽管如此,前者具有良好的特性并且可靠。具有IRES的内源性ncRNA可以翻译连续ORF上的长多肽链IRES介导的翻译的选择性调节参与生理和病理过程,例如细胞生长,增殖,分化,应激反应和凋亡。表2中列出了当前用于预测IRES的网站。

表2 IRES预测方法

m6A修饰的预测 在高等生物的mRNAncRNA中,m6A修饰非常普遍。m6A修饰可调节哺乳动物基因的表达,以及转录后水平的RNA稳定性,定位,剪切和翻译。最近发现,m6A对翻译有多种作用。其调节机制异常与肿瘤发生有关。使用核糖体谱分析,计算预测和质谱分析,发现m6A驱动的内源ncRNA翻译非常普遍。许多可翻译的内源环状RNA可能包含m6A位点。为了检查m6A驱动circRNA翻译的能力,在体外构建了m6A饰的circRNAm6A阅读蛋白YTHDF3与翻译起始因子eIF4G2紧密结合。后者促进了细胞中circRNA的翻译。表3列出了用于筛选m6A基序的常用工具。

表3 M6A预测方法

转录组学分析

目前对ncRNA编码的肽的大多数研究都是基于核糖体展示技术进行的数据分析。高通量测序的发展为翻译组学分析提供了四种检测方法包括多核糖体分析,核糖体免疫沉淀/核糖体亲和纯化,核糖体分析(也称为核糖序列)和核糖体新生链复合物(RNC)序列。因为核糖体具有高沉降系数多聚体分析则是通过蔗糖密度梯度离心分离多核糖体。因此,可以通过离心在溶液中分离与不同数目的核糖体结合的mRNA然后分析分离成分中的mRNA及其活性翻译ORF,。但是,这种方法翻译的RNA回收率较低,可能不足以满足全谱分析所需的样品量。核糖体谱分析是一种全面的定量方法,可对核糖体中的mRNA片段进行测序它使用低浓度RNase消化RNC,降解无核糖体覆盖的mRNA片段,并测序和分析长约22-30bpRNA片段这些被称为核糖体足迹。在翻译过程中,核糖体结合并沿着mRNA链移动,并根据mRNA模板中的密码子三联体信息逐渐合成蛋白质多肽链在此过程中形成了RNC。核糖体和串联mRNA沉淀物可通过蔗糖密度梯度离心分离,并进一步纯化和分离mRNA以进行高通量测序,称为RNC-seq使用这种方法,也可以分析与核糖体结合的ncRNAncRNA可以翻译为RNC中的蛋白质。

蛋白质组学分析

蛋白质组学可用于发现并直接检测ncRNA编码的微肽,这反过来提供了最直观的证据,表明ncRNA可以编码小肽。其中,生物质谱法是这些微量肽的常见鉴定和分析方法。免疫沉淀与液相色谱串联质谱(LC-MS/MS)结合使用来鉴定由circ-FBXW7circ-SHPRHcircPINT编码的独特氨基酸序列质谱结果中鉴定出的独特肽段也与ORF预测结果相符。可用于蛋白质序列比对和质谱数据肽段搜索的常用软件或数据库包括UniProtMascotdaemon

实验方法鉴定

随着对ncRNA编码蛋白的更多关注,出现了几种实验识别方法来检测这些蛋白。为了验证预测的阅读框表达,将体外构建的FLAG标记的表达载体导入细胞。蛋白质印迹法在预期的分子量处识别出不同的条带,表明带有FLAG标签的人工构建的ncRNA已被翻译。CRISPR也已被用于将FLAG标签敲入内源性ncRNA编码区域并检测内源性蛋白质表达。过表达和突变实验证明了每个调控序列和位点的功能使用带有翻译元件操纵的载体,例如预测的IRESm6A修饰位点或ATG起始密码子的突变形式,可以确认翻译是否正常进行且表型是否一致。内源性翻译产物可以通过蛋白质印迹法鉴定,也可以通过特异性抗体来鉴定,例如为围绕circRNA剪接位点的独特氨基酸序列设计的抗体或由lncRNAcircRNA衍生的转录本编码的常见氨基酸序列。以此方式,可以验证内源性circRNA的翻译功能,并且可以模拟翻译产物的过表达和敲低。分离样品中的蛋白质和多肽,并通过LC-MS/MS测定。

肿瘤相关功能肽

近年来,对编码ncRNA的蛋白质的研究一直在增加。多种ncRNA编码小肽并调节各种恶性肿瘤表型,例如细胞增殖,侵袭和转移。以下是已知由circRNAlncRNA编码的某些肿瘤相关功能肽。

SHPRH-146aa Circ-SHPRHSHPRH-146aa在正常人脑组织中高表达,在胶质母细胞瘤中下调circ-SHPRH中的环化导致串联终止密码子UGAUGA。通过用重叠的遗传密码开始和停止翻译,整个circ-SHPRH被翻译成146-aa蛋白质。针对跨越剪接位点的ORF产生的独特氨基酸序列的抗体,以及通过LC-MS/MS鉴定SHPRH-146aa氨基酸序列的抗体证实,circ-SHPRH被翻译为SHPRH-146aa。后者通过调节蛋白质泛素化途径参与中枢神经系统癌症的发展。SHPRH-146aaU251U373胶质母细胞瘤细胞中的过度表达可降低其体内外的恶性和致瘤性。SHPRH-146aa保护全长SHPRH免受泛素蛋白酶降解。它还通过泛素化增殖细胞核抗原来稳定SHPRH作为E3连接酶。通过这种方式,它可以抑制细胞增殖和致瘤性(图1a)。

1  circRNAlncRNA编码的小肽调节肿瘤的增殖

AKT3-174aa Circ-AKT3是由AKT33至第7外显子环化形成的它长524-nt,主要定位于细胞质。AKT3-174aaAKT3的残基62–232具有相同的氨基酸序列。与正常脑组织相比,胶质母细胞瘤组织中AKT3-174aa被下调。AKT3-174aa起着抑癌作用(但不是circ-AKT3)AKT3-174aa过表达抑制胶质母细胞瘤细胞增殖,辐射抗性和致瘤性。PI3K/Akt途径在各种胶质母细胞瘤发展和进展的致癌信号途径中起着重要作用。PI3K激活后,Akt通过PH域募集到膜上,并在Thr308Ser473依次磷酸化后被完全激活。PDK1直接使Thr308处的Akt磷酸化第一步是Akt激活中最关键的步骤AKT3-174aa的氨基酸序列与AKT3的氨基酸序列部分相同。因此,AKT3-174aa与活化的PDK1竞争性相互作用,抑制Thr308处的Akt磷酸化,并负调控PI3K/Akt信号通路(图1b)。

PINT87aa 通过对正常人星形胶质细胞和U251胶质母细胞瘤细胞进行circRNA转录组和RNC-RNA测序以及生物信息学整合分析,鉴定了某些circRNAlncRNALINC-PINT的第2个外显子通过自环化形成了环状分子circPINT,后者包含一个sORF和一个天然IRES,其编码从内源性circPINT外显子2而非线性LINC-PINT(称为PINT87aa)翻译的87-aa多肽。它主要位于细胞核,与PAF1直接相互作用,调节PAF1/POLII复合物,抑制下游癌基因cpeb1sox-2c-MyccyclinD1等的转录伸长,并抑制增殖和肿瘤发生胶质母细胞瘤和其他癌细胞类型(图2a

2 circRNAlncRNA编码的小肽调节肿瘤的侵袭,转移和增殖

HOXB-AS3 lncRNAHOXB-AS3是一种肿瘤抑制因子,在高度转移性和原发性结直肠癌(CRC)组织中显著下调。HOXB-AS3结合核糖体并编码称为HOXB-AS3的高度保守的53-aa肽。它是内源的,天然存在的,并且在各种肿瘤组织中广泛表达。HOXB-AS3抑制癌细胞的增殖,侵袭和转移并抑制肿瘤的生长。HOXB-AS3水平低的结肠癌患者一般预后较差。HOXB-AS3hnRNPA1RGG基序中竞争性结合精氨酸。以这种方式,它阻止hnRNPA1与丙酮酸激酶MPKMEI9序列结合,拮抗hnRNPA1介导的PKM剪接调控,并抑制PKM2亚型的形成和miR-18a的产生。HOXB-AS3下调PKM2,但上调PKM1PKM2是有氧糖酵解的关键调节剂,可增加乳酸的产生。因此,HOXB-AS3抑制CRC细胞中的有氧糖酵解。HOXB-AS3的丢失是CRC代谢重编程中的关键致癌事件(图2b)。

CircLgr4 CircLgr4在晚期CRC中高度表达,并与不良预后相关。LGR4在大肠肿瘤中也高表达,并通过泛素化和FZD受体稳定作用激活Wnt/β-catenin信号传导。因此,它驱动大肠干细胞的自我更新和侵袭。CircLgr4编码circLgr4-肽,该肽与LGR4相互作用以激活LGR4-Wnt信号通路。CircLgr4以依赖LGR4的方式驱动大肠干细胞的自我更新和侵袭。circLgr4--Lgr4轴可用于靶向CRC治疗(图2c)。

β-catenin-370aa  Circβ-catenin衍生自CTTNB1,编码β-cateninCircβ-catenin在肝癌组织中上调,主要定位于细胞质。它具有ORF和编码370-aaβ-catenin异构体β-catenin-370aa的活性IRESCircβ-catenin的抑制在体外和体内抑制肝癌细胞的生长和迁移,阻碍肿瘤发生和转移,并抑制Wnt/β-catenin途径。具有起始密码子突变的circβ-catenin表达载体的构建表明,其功能可以归因于其蛋白编码能力而不是其非编码特性。Circβ-catenin基因敲低对CTTNB1mRNA水平无影响,但可显著降低β-catenin蛋白水平。β-catenin的稳定性与其磷酸化状态紧密相关。β-cateninGSK3β磷酸化后,被泛素连接酶β-TrCP泛素化,并被蛋白酶体降解。由circβ-catenin编码的β-catenin-370aaGSK3β相互作用并起诱饵作用,以阻止其与全长β-catenin蛋白结合。以这种方式,它抑制了GSK3β诱导的β-catenin降解。在肝癌中,β-catenin-370aa通过减少泛素化,激活Wnt/β-catenin途径并促进肿瘤生长来稳定β-catenin(图2d)。LINC01420是在鼻咽癌中高表达的lncRNALINC01420表达升高的鼻咽癌患者的总生存率较低。LINC01420敲低显著抑制鼻咽癌细胞的侵袭LINC01420/LOC550643sORF编码一种高度序列保守的微蛋白,名为nobody。它与mRNA封端蛋白相互作用,直接结合EDC4,从mRNA去除5'帽,促进5'3'的衰变,并调节正常和异常转录本的降解。没有人主要局限于P体。它的水平随着P体数目的增加而降低。后者干扰内源性细胞无义介导的衰变基质的稳态。然而,该过程对肿瘤生长,发育和代谢的影响尚不清楚(图2e)。

其他功能性肽 LINC00961在人非小细胞肺癌(NSCLC)中显著下调。低水平的LINC00961水平与NSCLC患者的临床分期,淋巴结转移和较短的生存时间有关。LINC00961还可能抑制口腔鳞状和肾细胞癌,神经胶质瘤和其他癌症的肿瘤进展。LINC00961是可翻译的其编码的小肽SPAR位于溶酶体晚期,并与溶酶体V-ATPase相互作用。SPARRagsRagulator复合体的上游以及在v-ATPase水平起作用。它诱导v-ATPase-Ragulator-Rags超复合物的相互作用。SPAR阻止溶酶体mTORC1再摄取,通过氨基酸刺激抑制mTORC1活化,并影响肌肉再生。Circ-ZNF609ZNF609第二个外显子的环化形成。它在鼻咽癌,肾癌和乳腺癌以及其他癌症中被上调。Circ-ZNF609的抑制可显著抑制癌细胞的增殖,侵袭和转移。据报道,circ-ZNF609在肌肉细胞中强烈表达,在进化上高度保守,并含有753ntORF。它的UTR具有IRES样活性,并以剪接依赖性方式编码蛋白质。该肽调节成肌细胞增殖由初级miRNAmiR-200amiR-200b)编码的MiPEP-200amiPEP-200b来抑制前列腺癌细胞的迁移。CircRNAlncRNA和它们编码的小肽可能调节肿瘤发生。此外,各种物种中的某些ncRNA编码调节体内各种生物学和疾病过程的蛋白质。

评论

非编码RNA不编码蛋白质,但是调节各种肿瘤过程它们也是重要的潜在癌症诊断和预后生物标志物。生物信息学和翻译组学已经开始阐明ncRNA编码的功能肽的作用和作用方式。本文综述了长非编码RNAlncRNA)和环状RNAcircRNA)编码的小肽的最新进展介绍了用于预测编码肿瘤功能寡肽的预期ncRNA的计算和分析方法还介绍了许多特定的lncRNAcircRNA编码的蛋白,以及它们促进癌症或抑制癌症的分子机制。编码ncRNA的功能肽的作用在癌症研究中具有广阔的应用前景和潜在挑战。这篇综述的目的是促进发现由ncRNA编码的更多功能性肽研究提供理论基础和相关参考,并进一步开发新的抗癌治疗靶标以及诊断和预后癌症标志物。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多