分享

提速831倍!miRNA靶基因预测利器qTar

 生物_医药_科研 2018-12-20
预测软件多,选择困难;

预测环节耗时,影响数据挖掘效率;

预测后结果多,筛选繁琐,且不确保精准。


那么是否有一款较好的工具可以同时解决这些问题呢?


答案是肯定的,华大科技自主开发了一款名为qTar的软件,集运行快、结果准、适用广等特点于一身,可帮助广大喜爱研究small RNA的科研伙伴们解决各种难题。下面,科技君就带大家来详细了解一下qTar。


软件大揭秘


qTar通过对靶基因序列集构建特定长度的种子库,实现快速定位miRNA可能的靶基因;再基于Smith-Waterman比对,计算miRNA与靶基因之间的比对得分和相应的结合能量值,筛选出潜在的靶基因。


qTar基于种子库的检索模式,极大地提升了靶基因预测的运行速度。

常用动物靶基因预测软件:qTar比RNAhybrid[1]提升831倍,比miRanda[2]提升78倍;

常用植物靶基因预测软件:qTar比TargetFinder[3]提升10倍,比psRobot[4]提升7倍。


图1  miRNA靶基因预测软件速度比较


广

qTar通过调整不同的种子长度、比对得分、结合能阈值,可以适用多物种,满足动物、植物以及细菌、真菌等微生物的靶基因预测。为一些不明确采用何种靶基因预测软件的物种,提供了新的可行性预测方法。


qTar的内存消耗只依赖于target序列的大小,target序列集越大,对应的存储消耗越多。但对于绝大部分物种,其内存峰值在2G以内。


动物(人)

基于CLASH数据[5],分别用qTar、miRanda[2]、TargetScan[6]、RNAhybrid[1]进行人的miRNA靶基因预测。


评价标准1:以CLASH中提供的miRNA靶基因关系对为标准(已发表文章验证)[5],统计每个软件的准确性。RNAhybrid的准确靶基因对检出率最高为62%,但其真阳性率仅为0.1%。而qTar的准确靶基因对检出率为51%,真阳性率高达0.75%。


表1 不同软件预测人miRNA靶基因准确性比较(评价标准1)


评价标准2:更严格些,以miRNA预测的靶基因位置与CLASH中提供的靶基因上的靶位置有重叠关系才认定为准确,则miRanda和TargetScan的准确靶基因对检出率约为1%,而qTar和RNAhybrid在20%左右。qTar的真阳性率依然最高。


表2 不同软件预测人miRNA靶基因准确性比较(评价标准2)


综上,qTar的准确靶基因对检出率较高,产生假阳性数据较少,是较为均衡的一款靶基因预测软件。


植物(拟南芥)

用miRBase 21中拟南芥的全部成熟体序列[7],TAIR数据库中的mRNA序列,分别用qTar、psRobot[4]、TargetFinder[3]进行靶基因预测。以psRNATarget[8]的预测结果为准,比较不同软件,结果psRobot的准确靶基因对检出率最高,qTar为86%。


表3 不同软件预测拟南芥miRNA靶基因准确性比较


整体来看,qTar在动物预测软件中表现突出,在植物预测软件中与其他结果相当。


干货分享

这样一款快、准、适用广的软件,我们已免费公开发布到GitHub(https://github.com/zhuqianhua/qTar.git),复制网址至浏览器(或点击文末阅读原文)打开直接下载安装即可。并且,还贴心地给出靶基因预测的建议参数,动物:-n 16 -a 7 -f -13 -N 4 -P 3;植物:-a 28 -f -14 -l 5 -N 5 -n 16。

 

除qTar外,华大研发团队还发布了各种好用的生物信息软件,包括基础数据分析工具、群体遗传学分析工具等,可支持动植物、微生物及人类疾病等领域的个体及群体多组学研究。有需要的小伙伴快快用起来吧。


序号软件名称软件描述服务入口
1RePS(repeat-maskedPhrapwithscaffolding)从鸟枪数据明确列出具体kmer重复序列,并在组装前删除它们的WGS序列组装方法。所建立的软件Phrap用于为每个base计算有意义的错误概率。克隆端配对信息用于构建scaffolds的秩序和重叠。更新版的RePS结合了一些用Phusion介绍聚类的想法。

ftp://ftp./

pub/ricedb/Tools/

RePS/RePS-IBM-AIX.tar.gz
2WEGO(WebGeneOntology Annotation Plot)用于图形显示GOTree注释的Web工具,尤其是在比较基因组分析中。http://wego./cgi-bin/wego/index.pl
3HIBAIS基于HapMap信息的血统推断分析软件。http://soap./
4Solar处理比对结果的软件,尤其适用于含有intron的比对。http://cloud./
5‍Kaks_Calculator用于计算非同义替换率和统一替换率的软件程序包,它采用模型选择和模型平均策略,同时也集成了现有的其他几个用于计算Ka和Ks的算法。‍‍http://evolution./software.htm‍
6FGF(FishingGene Family)用于在特定基因组里查询蛋白质家族并构建该家族分子进化树的软件系统,可以用来分析基因结构、拷贝数和进化关系等。http://fgf./

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多