预测环节耗时,影响数据挖掘效率; 预测后结果多,筛选繁琐,且不确保精准。 那么是否有一款较好的工具可以同时解决这些问题呢? 答案是肯定的,华大科技自主开发了一款名为qTar的软件,集运行快、结果准、适用广等特点于一身,可帮助广大喜爱研究small RNA的科研伙伴们解决各种难题。下面,科技君就带大家来详细了解一下qTar。 软件大揭秘 qTar通过对靶基因序列集构建特定长度的种子库,实现快速定位miRNA可能的靶基因;再基于Smith-Waterman比对,计算miRNA与靶基因之间的比对得分和相应的结合能量值,筛选出潜在的靶基因。 快 qTar基于种子库的检索模式,极大地提升了靶基因预测的运行速度。 常用动物靶基因预测软件:qTar比RNAhybrid[1]提升831倍,比miRanda[2]提升78倍; 常用植物靶基因预测软件:qTar比TargetFinder[3]提升10倍,比psRobot[4]提升7倍。 图1 miRNA靶基因预测软件速度比较 广 qTar通过调整不同的种子长度、比对得分、结合能阈值,可以适用多物种,满足动物、植物以及细菌、真菌等微生物的靶基因预测。为一些不明确采用何种靶基因预测软件的物种,提供了新的可行性预测方法。 qTar的内存消耗只依赖于target序列的大小,target序列集越大,对应的存储消耗越多。但对于绝大部分物种,其内存峰值在2G以内。 准 动物(人) 基于CLASH数据[5],分别用qTar、miRanda[2]、TargetScan[6]、RNAhybrid[1]进行人的miRNA靶基因预测。 评价标准1:以CLASH中提供的miRNA靶基因关系对为标准(已发表文章验证)[5],统计每个软件的准确性。RNAhybrid的准确靶基因对检出率最高为62%,但其真阳性率仅为0.1%。而qTar的准确靶基因对检出率为51%,真阳性率高达0.75%。 表1 不同软件预测人miRNA靶基因准确性比较(评价标准1) 评价标准2:更严格些,以miRNA预测的靶基因位置与CLASH中提供的靶基因上的靶位置有重叠关系才认定为准确,则miRanda和TargetScan的准确靶基因对检出率约为1%,而qTar和RNAhybrid在20%左右。qTar的真阳性率依然最高。 表2 不同软件预测人miRNA靶基因准确性比较(评价标准2) 综上,qTar的准确靶基因对检出率较高,产生假阳性数据较少,是较为均衡的一款靶基因预测软件。 植物(拟南芥) 用miRBase 21中拟南芥的全部成熟体序列[7],TAIR数据库中的mRNA序列,分别用qTar、psRobot[4]、TargetFinder[3]进行靶基因预测。以psRNATarget[8]的预测结果为准,比较不同软件,结果psRobot的准确靶基因对检出率最高,qTar为86%。 表3 不同软件预测拟南芥miRNA靶基因准确性比较 整体来看,qTar在动物预测软件中表现突出,在植物预测软件中与其他结果相当。 干货分享 这样一款快、准、适用广的软件,我们已免费公开发布到GitHub(https://github.com/zhuqianhua/qTar.git),复制网址至浏览器(或点击文末阅读原文)打开直接下载安装即可。并且,还贴心地给出靶基因预测的建议参数,动物:-n 16 -a 7 -f -13 -N 4 -P 3;植物:-a 28 -f -14 -l 5 -N 5 -n 16。
除qTar外,华大研发团队还发布了各种好用的生物信息软件,包括基础数据分析工具、群体遗传学分析工具等,可支持动植物、微生物及人类疾病等领域的个体及群体多组学研究。有需要的小伙伴快快用起来吧。
|
|