miRNA靶基因预测是研究miRNA功能机制必经的一个环节,现有的相关软件和数据库非常多,然而不同软件的算法各有优劣,在不同数据库之间的交叉检索费时费力,所以需要一个整合多个数据库和软件资源的集成型数据库,mirDIP就是在这样的驱动下产生,集成了30个来源数据库中human相关的靶基因信息,网址如下
在 可以看到,去除冗余之后,共包含27667个基因,2586个miRNA, 约152万条miRNA-target gene信息。 mirDIP不仅仅是做了一个简单的数据整理和去冗余工作,对于来自多个数据库中的靶基因信息,首先对其进行了归一化。将所有靶基因按照可信度从高到底排列,将其归一化到0到1这个区间,0代表可信度最高,1代表可信度最差, 然后利用各个数据库中归一化之后的数值,给出一个总的打分值,公式如下 就是用1减去各个数据库中归一化之后的数值的乘积,根据靶基因对应的score值,划分成了4个范围,示意如下 按照score从大到小排序,前1%称之为 官网提供了以下3种检索方式,可以灵活选择 1. Undirectional search这种方式直接检索mirDIP中整理好的非冗余数据集,可以根据miRNA ID或者gene symbol进行检索,检索结果示意如下 2. Bidirectional search这种方式可以根据特定来源数据库对结果进行筛选,示意如下 3. miRNA-gene matrix这种方式采用matrix的形式展示多个miRNA或者gene的靶基因结果,示意如下 在最后一列会给出共有的miRNA个数,可以用于分析多个miRNA共有的靶基因。 检索结果可以下载,在检索框下方的工具条可以选择下载的格式,支持 该数据库可以免费下载,而且提供了API服务,可以方便的获取数据。 该数据库为miRNA靶基因数据的整合提供了一个良好的参照,可以采用相同的思路来整理小鼠,大鼠等常见物种的靶基因数据库。 ·end· |
|