分享

干货!如何预测lncRNA的结合蛋白?

 医学院的石头 2018-09-22
 长链非编码RNA(long non-coding RNA,LncRNA)是一类长度大于200nt但无蛋白质编码潜能性的调控型RNA。很多客户做完高通量lncRNA筛选之后,要针对某一特定的lncRNA进行研究,这时就需要对该lncRNA的调控模式有一定的预估,可以通过FISH、免疫荧光等技术确定lncRNA的细胞位置,如位于胞浆,该lncRNA可能以”稳定RNA”、“调节mRNA翻译“、“ceRNA”、“充当miRNA前体“或“介导蛋白”等方式发挥调控作用;若位于胞核,该lncRNA则以“顺式作用”或“反式作用”两种方式发挥调控作用。



最近小编也分享了很多lncRNA文章,涉及肿瘤、免疫、药物等多个研究方向, 其中包括Cell stem Cell、Nature子刊等高分杂志。 这几篇文章的lncRNA都属于胞核lncRNA,以顺式和反式来发挥调控作用的,而且都以“募集相关蛋白“来调控靶标基因的表达。

 

案例一:典型顺式

研究对象:lncTCF7        

靶标基因:TCF7      

募集蛋白:SWI/SNF蛋白复合物

 

案例二:典型反式

研究对象:lncKdm2b   

靶标基因:Zfb292    

募集蛋白:Stab1+NURF complex 



由此引发两个问题:
 

1. 如何寻找lncRNA的靶标基因?

针对这个问题,方法可以有两种:①实验方法;②生物信息学预测。

①实验方法包括敲除或过表达,筛选差异mRNA来确定靶标;或通过RNA-pull down结合测序/质谱等技术确定靶标;

②生物信息学预测包括通过位置关系和共表达分析来预测靶标,预测结果需实验方法的进一步验证。


 

2. 如何寻找lncRNA的结合蛋白?

针对这个问题,同样有两种方法:①实验方法;②生物信息学预测。

①实验方法可通过RNA-pull down结合质谱等技术确定靶标;

②生物信息学预测目前公司还没有成熟的分析产品备注:转录因子蛋白结合lncRNA的相互关系是可以分析滴,但可以给大家分享一个在线分析算法——catRAPID,在一些lncRNA文章中有使用该算法,它可以预测lncRNA与蛋白的结合关系

 

由于网站使用存在权限,但可以提供给大学研究所等非营利性机构用于科学研究,但需和网站联系获取使用权 ,有兴趣的老师可以与相关机构沟通。

接下来简单介绍一下catRAPID这个在线网站……………




    catRAPID算法用于计算蛋白质与ncRNAs相互作用的能力(网址:http://service./page/catrapid_group)。该网站结合二级结构、氢键、范德华力原理,以高精度预测蛋白质—RNA的结合关系。目前catRAPID分为多个模块,各自的用途特点如下表:



   其中,catRAPID omics用于预测某一lncRNA(或蛋白)的结合蛋白(或lncRNA),可预测出大量候选,这一模块对科研工作者很实用,其它模块用于进一步分析和评估某一特定lncRNA与某一特定蛋白的相互结合关系。

   catRAPID omics可用于预测某个lncRNA能和哪些蛋白结合,或者预测某个蛋白能和哪些lncRNA结合。使用者可以从RNA出发,也可以蛋白出发,只需知道lncRNA的核酸序列或蛋白质的氨基酸序列即可:



1. 从lncRNA入手,以The long noncoding Xist repeat A region(简称RepA)为例,进入RNA序列模块,把RepA的序列信息输入即可:



   输入邮箱地址后开始分析,分析完成后到邮件查看结果链接:



结果中最后一栏Ranking,通过星级将相互作用分为三等:高结合(3-2),中等结合(2-1),低结合(1-0)的蛋白都会非常详细的展示出来,研究者就可以找到与RepA结合的蛋白。使用表格链接,用户可以下载“所有交互的完整列表”。

2. 从蛋白入手,以TAR DNA-binding protein 43 (TDP-43) 为例,进入蛋白序列模块,把TDP-43的序列信息输入,分析,获取结果如下:包括图和表两种形式。


图中黑线表示输入分子,彩线表示识别并用于分析区域。表格根据其星级评分分为三个不同的类别:高(3-2),中等(2-1),低(1-0)。
 

其它模块可用于进一步分析lncRNA与蛋白具体的结合信息,包括结合位点、相互作用倾向等等。

如catRAPID graphic模块 :

显示为热图。x轴和y轴分别表示RNA和蛋白质序列的指标。 热图的颜色表示单个氨基酸和核苷酸对的相互作用评分(范围从-3到+3)。
 

如catRAPID fragments模块:

1. 相互作用谱,表示沿着RNA序列(x轴)的蛋白质的相互作用得分(y轴),提供关于最有可能被蛋白质结合区域的信息。


2. 相互作用矩阵,其显示了相互作用的蛋白质(y轴)和RNA(x轴)区域的热图。热图中红色的阴影表示单个氨基酸和核苷酸对的相互作用评分。

3. 表总结了前20个相互作用关系,结果展示了蛋白质和RNA片段的坐标、它们之间相互作用倾向以及每个相互作用的辨别力。

 

如catRAPID strength模块:

下图从左至右,分别是预测输出标识符、输入标识符,强度类型,例数,得分Z值和蛋白质的CDF(累积分布函数)。 CDF值表示交互倾向的意义。

 交互倾向的意义是针对三种不同的集合进行评估:

-—相互作用→100个RNAs与100个蛋白质的分布(104个相互作用)

—RNA→输入蛋白与100个RNA的分布(102个相互作用)

—蛋白质→输入RNA与100种蛋白质的分布(102种相互作用)


CDF分布图形表示可点击下载链接获取:

 

下面我们来看几个文章案例:

1. 一篇名为 《Long noncoding RNA MRAK009713 is a novel  regulator of neuropathic pain in rats》的文章利用高通量数据分析筛选出lncRNA—MRAK009713,发现它参与调控神经性疼痛,通过CatRAPID算法发现MRAK009713与P2X3受体相互作用。然后经一系列实验验证发现: MRAK009713与P2X3蛋白直接相互作用,增强P2X3受体功能,是大鼠神经性疼痛的新型正向调节剂。



2. 一篇名为《Identification of novel long non-coding RNAs in clear cell renal cell carcinoma》的文章通过lncRNA芯片(透明细胞肾细胞癌 vs 癌旁)和PCR验证筛选出11个差异倍数较高的lncRNA, 然后通过生物信息学预测lncRNA-蛋白(catRAPID omics)相互作用,并对预测出的蛋白进行功能通路分析,发现这些lncRNA与剪接,结合,转运,定位和处理有关。




3. 一篇名为《LncRNA NONRATT021972 siRNA normalized the dysfunction of hepatic glucokinase through AKT signaling in T2DM rats》,研究探讨了lncRNA NONRATT021972小干扰RNA(siRNA)对肝GK功能障碍的影响,并采用生物信息学技术(CatRAPID)鉴定NONRATT021972 RNA的靶标, 发现NONRATT021972与p-AKT之间存在相互作用。后期经一系列实验确定NONRATT021972 siRNA增强了磷酸化AKT(pAKT)水平,GK表达和肝糖原合成,有效降低血糖水平。


4. 值得一提的是, catRAPID也可以用于预测circRNA与蛋白的相互关系,一篇名为 《Circular non-coding RNA ANRIL modulates ribosomal RNA maturation and atherosclerosis in humans》的文章采用catRAPID算法预测Circ-ANRIL与PES1的相互结合关系



以上几篇文章都有采用catRAPID算法,给大家简单展示了如何寻找lncRNA结合蛋白以及lncRNA与蛋白结合信息。当然,该工具有使用权限,大家感兴趣可以自己摸索摸索,自行与相关机构沟通获取使用权,里面还有好多宝贝等着大家去挖掘。
 

PS:

中康博可以提供: lncRNA与mRNA位置关系分析;lncRNA与mRNA共表达分析以及TF与lncRNA关系预测。
 

参考文献:

1. Guilin Li et al. Long noncoding RNA MRAK009713 is a novel regulator of neuropathic pain in rats. PAIN. 2017.

2. Lesca M. Holdt et al. Circular non-coding RNA ANRIL modulates ribosomal RNA maturation and atherosclerosis in humans. Nature communications. 2016.

3. Shuangmei Liu et al. LncRNA NONRATT021972 siRNA regulates neuropathic pain behaviors in type 2 diabetic rats through the P2X7 receptor in dorsal root ganglia. .Molecular Brain .2016.

3. Jasmine JC Blondeau et al.  Identification of novel long non-coding RNAs in clear cell renal cell carcinoma. Clinical Epigenetics . 2015.

4. Davide Cirillo et al. Discovery of protein–RNA networks. Molecular BioSystems. 2014.

5. Davide Cirillo et al. Constitutive patterns of gene expression regulated by RNA-binding proteins. Genome Biology. 2014.

6. Davide Cirillo et al. Neurodegenerative diseases: Quantitative predictions of protein− RNA interactions. RNA. 2013.

7. Federico Agostini et al. X-inactivation: quantitative predictions of protein interactions in the Xist network. Nucleic Acids Research. 2013.

8. Davide Cirillo et al. Predictions of protein–RNA interactions. WIREs Comput Mol Sci. 2012.

9. Sylvain Maenner et al. 2-D Structure of the A Region of Xist RNA and Its Implication for PRC2 Association. PLoS Biology. 2010. 

 


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多