miRNA虽只有短短22个核苷酸,却通过调控大量的靶基因,在基因表达中扮演了重要角色。研究发现,每个哺乳动物miRNA可能调控了约200个靶基因。到目前为止,仍有许多miRNA的功能并不清楚,原因在于已经确定的miRNA靶基因数量很少,而靶基因的预测和鉴定的难度又颇大。于是,科学家们也在利用各种生物信息学方法和实验方法来寻找miRNA的靶基因。 生物信息学方法 鉴定miRNA靶基因的最常用方法是依赖计算机算法,如TargetScan、MiRanda和PicTar。它们预测miRNA种子区的结合。种子区(seed region)指的是miRNA上进化最为保守的片段,从第2个到第8个核苷酸,通常与mRNA 3’-UTR上的靶位点完全互补。 每种算法都有自己独特的一套规则,但主要遵循以下几个基本原则:
当然,具体允许有多少个错配,哪里有错配,这就因算法而异了。 然而,这种搜索还是颇具挑战性,因为动物miRNA-mRNA双链往往含有错配、缺口或凸出,而且目前明确的miRNA靶基因并不多,在算法编写过程中没有足够的样本可以参考,因此,搜索并不时时奏效。不过,对于分值最高的匹配,后续实验的成功率还是挺高的。 以下便是人们常用的miRNA靶点预测工具。 TargetScan TargetScan(targetscan.org)由麻省理工学院的Benjamin Lewis等人在2003年开发,它通过搜索与每个miRNA的种子区匹配的保守位点而预测miRNA的靶基因。作为一个选项,非保守位点也可预测。与其他的目标预测工具不同,TargetScan提供每个miRNA预测靶点的准确排名。这些排名是基于进化上保守的靶定概率(PCT得分)或抑制的预测效果(背景+得分)。 TargetScan目前包括TargetScanHuman、TargetScanMouse、TargetScanFish、TargetScanFly和TargetScanWorm,分别围绕人、小鼠、斑马鱼、果蝇和线虫的基因提供预测。目前最新的版本是TargetScan 6.2。 miRanda miRanda(www./)是一个利用生物信息学对 miRNA 靶基因进行预测的软件,由Sloan-Kettering纪念癌症中心的Anton Enright等人在2003年设计开发,以C语言编写。miRanda 对 3’-UTR 的筛选依据主要是从序列匹配、miRNA与mRNA双链的热稳定性以及靶位点的保守性三个方面进行分析。 PicTar PicTar(pictar.mdc-berlin.de)则由纽约大学的Azra Krek等人在2005年开发。与大部分算法一样,PicTar同样强调种子区在靶位点识别及在转录后调控中的关键作用。不同的是,PicTar把种子序列分为“完全匹配种子序列”和“不完全匹配种子序列”,前者要求种子序列和靶基因完全互补配对,后者在满足 miRNA 与靶基因结合自由能不增加的前提下允许种子序列出现错配, 但不允许G:U配对。 有些研究人员会选择用多个工具来预测miRNA的靶基因,并找出所预测的交集,但是每个软件预测出来的靶基因都为数众多,有些甚至有几千个,怎么办?笨办法就是建个excel,输入多个结果,查询各个结果之间的重叠情况。这个方法很有效,但相当费时,这里推荐个工具miRWalk数据库(www.umm./apps/zmf/mirwalk/)。它也能帮助你找出预测结果的交集。 实验方法 预测miRNA靶基因的算法虽然在不断升级,但计算机模拟仍有一定的局限性,研究人员也希望通过实验方法来更直观地寻找miRNA靶基因。这些年,人们开发出不少方法,或从mRNA或蛋白表达的变化入手来寻找靶基因,或者更直接,确定miRNA与mRNA之间的相互作用。而新技术(如NGS)的崛起,也为这一领域增添了新的活力。 |
|