信使RNA(mRNA)作为遗传信息的传递者,在蛋白质翻译过程中起着十分重要的作用,但是从人类基因组计划开展以来,随着高通量测序技术的不断发展,能够编码蛋白的mRNA地位已经不再独占转录组鳌头,许多不同类型的非编码调控RNA也进入了人们的视线,这些不编码蛋白的序列也陆续被证明具有重要的生物学意义。 其中一类长度大于200个碱基的Long non-coding RNA(LncRNA)就是被大家热烈追捧的明星非蛋白编码RNA(ncRNA)。越来越多的研究者对LncRNA在生长发育、代谢调控等方面展开研究,其中,LncRNA靶基因的预测更是大家关注的核心问题,那么,究竟如何预测LncRNA靶基因(靶蛋白)呢?这要先从LncRNA说起。
1、如何定义LncRNA?它与mRNA有何异同? LncRNA即长链非编码RNA,是一类不编码蛋白,转录本长度超过200nt(nucleotide,核苷酸)的RNA分子。大部分lncRNA是RNA聚合酶II转录的副产物[1],其中也有一些是RNA聚合酶Ⅲ转录的,以RNA的形式在多种层面上(表观遗传调控、转录调控以及转录后调控等)调控基因的表达水平。LncRNA的表达受到发育调控,具有组织和细胞特异性。相当一部分LncRNA只位于细胞核内。它们包含许多类型的转录本,在结构上类似mRNA,有时也转录成编码基因的反义转录本,下表对LncRNA与mRNA进行了比较。
2、LncRNA的作用机制 LncRNA可通过与DNA/RNA结合或与蛋白结合而行使其功能。一些lncRNA实际上是某些调控RNA(如microRNA或piwi RNA)的前体。与miRNA不同的是,lncRNA没有一种普遍的作用模式,它以许多不同的方式来调控基因表达和蛋白合成。研究发现,一些lncRNA参与了基因调控的基本过程,包括染色质修饰和结构以及直接的转录调控。 lncRNA的转录后功能包括:编码蛋白的基因上游启动子区转录,干扰下游基因的表达;抑制RNA聚合酶II或者介导染色质重构以及组蛋白修饰,影响下游基因的表达;与编码蛋白基因的转录本形成互补双链,干扰mRNA的剪切,形成不同的剪切形式;与编码蛋白基因的转录本形成互补双链,在酶的作用下产生内源性siRNA;与特定蛋白质结合,调节相应蛋白的活性;作为结构组分与蛋白质形成核酸蛋白质复合体;结合到特定蛋白质上,改变该蛋白质的细胞定位;作为小分子RNA(如miRNA、piRNA)的前体分子。 在众多的作用机制中,最重要的功能,主要包括以下四种类型: Signal archetype(信号分子):LncRNA的转录有组织、时间特异性,所以它可以作为转录活性的分子信号或指示剂进一步调控其他基因的表达。
Decoy archetype(诱饵分子):LncRNA能与其它调控RNA或蛋白结合并将其隔离,从而对靶基因进行调控。
Guide archetype(指导分子):LncRNA可以指导蛋白复合物定位到特定调控位点,以此对靶基因进行调节。
Scaffold archetype(骨架分子):LncRNA可以作为多种分子元件(蛋白和/或RNA)组装的平台,招募形成各种复合物,从而对靶基因进行调控。[2] 3、如何预测LncRNA的靶基因? 正因为LncRNA有这么多重要的功能,所以寻找LncRNA靶基因挖掘它对基因表达、蛋白合成各方面的调控作用就成了LncRNA研究的关键。 LncRNA靶基因的预测,可大致分三种情况: 3.1 已知gene symbol的LncRNA 对已知gene symbol 的LncRNA,可以直接通过软件数据库例如starBase,ChIPBase,NONCODE等,利用gene symbol搜索其相关信息。这里我们以starBase(http://starbase./index.php)为例做演示。 打开starBase首页,点击进入Protein-RNA,选择protein-lincRNA interactions点击进入。
进入下图界面,在搜索框输入想了解的LncRNA symbol,例如“HOTARI”点击搜索。
然后就可以看到下图的结果,得到“HOTAIR”可能的靶向蛋白。
3.2 新发现的LncRNA 目前现有数据库物种信息十分有限、数据信息也较少,所以对于转录本预测出的没有symbol号的新LncRNA,由于LncRNA对靶基因没有固定的作用模式,基因调控可能以顺式(cis)或反式(trans)作用发生。所以,我们可根据不同作用方式分别进行预测。 3.2.1 cis作用靶基因预测
图1.Cis调控作用 RNA聚合酶(绿)转录得到一个与调控蛋白(紫)相关的LncRNA(红)从而影响附近区域的编码基因。 cis作用靶基因预测,认为LncRNA的功能与其坐标临近的蛋白编码基因相关,位于编码蛋白上下游的LncRNA可能与启动子或者共表达基因的其他顺式作用元件有交集,从而在转录或者转录后水平对基因的表达进行调控。判断一个LncRNA具有Cis调控作用通常要同时满足以下几个条件:
对于满足以上条件的LncRNA,首先找出位于其上游或者下游附近(10K)的编码蛋白基因,通过对编码蛋白的功能富集分析,从而预测LncRNA的主要功能,为后续Cis作用分析打下基础。
图2.LncRNA上下游分析示例 3.2.2 Trans作用靶基因预测
图3.Trans调控作用 LncRNA(红)与DNA结合蛋白(蓝)相关联,并调控相关靶基因的表达。 Trans作用靶基因预测基本原理认为LncRNA的功能跟编码基因的位置关系没有关系,而与其共表达的蛋白编码基因相关。也就是说,当LncRNA与一些距离较远的基因在表达量上存在正相关或负相关的情况时,就可以通过样本间lncRNA与蛋白编码基因的表达量相关性分析或WGCNA共表达分析来预测其靶基因。 需要注意的是,lncRNA的Trans作用靶基因预测只适合于样本量大的情况,如果样本量太少(如6个以下),分析将不可靠。
图4.lncRNA-mRNA共表达网络图分析示意图 3.3 LncRNAantisense分析 除了Cis作用和Trans作用调控,LncRNA参与调控许多转录后进程时,与miRNA和snoRNA等小RNA类似的,这些调控往往与碱基的互补配对有关。一部分反义LncRNA可能因为与正义链的mRNA结合而调控基因沉默、转录及mRNA的稳定性。所以,LncRNA的antisense分析,可以利用软件(如RNAplex)预测反义LncRNA与mRNA之间的互补配对关系,根据热力学结构计算最小自由能来预测最佳碱基配对关系。
图5.LncRNA antisense分析示例图 图5展示了最佳LncRNA-mRNA结合位点以及反义LncRNA与其共表达基因间的最小自由能。通过最小自由能的比较,预测LncRNA的靶基因。 4、后续功能验证 根据以上分析结果,选取目标LncRNA,进行后续实验验证(多点QPCR验证LncRNA与mRNA的相关性、基因known down等技术)。 包括:
参考文献: 【1】GuttmanM, Amit et al. Chromatin signature reveals over a thousand highly conservedlarge non-coding RNAs in mammals. Nature, 2009, 458(7235):223–227 【2】Lan F et al. Long noncoding RNA as modular scaffold ofhistone modification complexes. Science, 2010, 329(5992):689–693. 来源:基迪奥生物 医学科研干货免费下载,请点击这里关注“肽度时界”公众号,关注后回复“指定数字”获取: 1.医学科研实验常用protocol--回复“001”领取 2.质粒图谱大全--回复“002”领取 3. 医生晋升方法/执业医生题库/晋升程序与制度/考试口诀等--回复“003”领取 4.中国互联网预约挂号服务市场专题研究报告2016--回复“004”领取 5. 科研必备软件(12大分类50款)免费下载 --回复“005”领取 6. 2016年全球二代基因测序行业投研报告 --回复“006”领取 7. lncRNA超级干货(68篇文献免费阅读) --回复“007“领取 8. SCI论文超级干货合集(SCI论文写作技巧+配图软件+施一公大咖经验+文献检索+SCI经验书籍) --回复“008” 领取 9. 中国移动医疗市场年度研究报告2016 --回复“009”领取 10.信号通路与信号转导系列文件+Cell网站细胞信号通路图(超多干货)--回复“010”领取 |
|