分享

mirDIP:最全面的人类miRNA靶基因数据库

 生信修炼手册 2019-12-24

miRNA靶基因预测是研究miRNA功能机制必经的一个环节,现有的相关软件和数据库非常多,然而不同软件的算法各有优劣,在不同数据库之间的交叉检索费时费力,所以需要一个整合多个数据库和软件资源的集成型数据库,mirDIP就是在这样的驱动下产生,集成了30个来源数据库中human相关的靶基因信息,网址如下

http://ophid./mirDIP/index.jsp

Statistics页面,可以看到详细的来源数据库和对应的数据量信息,示意如下

可以看到,去除冗余之后,共包含27667个基因,2586个miRNA, 约152万条miRNA-target gene信息。

mirDIP不仅仅是做了一个简单的数据整理和去冗余工作,对于来自多个数据库中的靶基因信息,首先对其进行了归一化。将所有靶基因按照可信度从高到底排列,将其归一化到0到1这个区间,0代表可信度最高,1代表可信度最差, 然后利用各个数据库中归一化之后的数值,给出一个总的打分值,公式如下

就是用1减去各个数据库中归一化之后的数值的乘积,根据靶基因对应的score值,划分成了4个范围,示意如下

按照score从大到小排序,前1%称之为Very High, 接下来依次为High, Medium, Low

官网提供了以下3种检索方式,可以灵活选择

1. Undirectional search

这种方式直接检索mirDIP中整理好的非冗余数据集,可以根据miRNA ID或者gene symbol进行检索,检索结果示意如下

2. Bidirectional search

这种方式可以根据特定来源数据库对结果进行筛选,示意如下

3. miRNA-gene matrix

这种方式采用matrix的形式展示多个miRNA或者gene的靶基因结果,示意如下

在最后一列会给出共有的miRNA个数,可以用于分析多个miRNA共有的靶基因。

检索结果可以下载,在检索框下方的工具条可以选择下载的格式,支持CSVTAB两种格式,示意如下

该数据库可以免费下载,而且提供了API服务,可以方便的获取数据。

该数据库为miRNA靶基因数据的整合提供了一个良好的参照,可以采用相同的思路来整理小鼠,大鼠等常见物种的靶基因数据库。

·end·

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多