分享

华南农业大学夏瑞课题组发布植物小RNA注释数据库

 祥强6csdm0n3vs 2019-09-24

近日,华南农业大学夏瑞课题组发布了植物小RNA注释数据库 – sRNAanno sRNA annotation

网址为:www.plantsRNAs.org

sRNAanno数据库可以提供什么?

1138种植物sRNA位点注释信息下载(.gff3),应该是目前植物中最全最完整的数据。

2)植物miRNA位点(家族名字或序列)和PHAS位点(序列)的检索。

3)专门用于查看小RNA高通量数据的工具 -- IGV-sRNA在整合数据库期间,我们也改造IGVIntegrativeGenomics Viewer)并得到IGV-sRNA,使得其能够特异地用小RNA

4sRNAanno还提供免费小RNA注释服务。对于有合理小RNA注释需求的朋友,同样可以登录网页并提交数据信息,我们将提供注释服务!

关于sRNAannoIGV-sRNA的文章已经在BioRxiv上发布,欢迎参阅

https://www./content/10.1101/771121v1

植物sRNA位点注释值得更多的关注!

植物小分子RNAsRNA)是一类长度为20~24ntRNA。越来越多的实验已经证明,sRNA广泛参与到植物各类生物学过程,包括种子萌发,幼苗生长,逆境响应,抗虫抗病,跨界调控,生长发育,开花结果等。

(Chen et al., 2018, Horticulture Research)

伴随高通量测序技术的普及,越来越多的植物基因组得到测序(约400种,201909月)。这些基因组往往也有较好的蛋白编码基因的基因结构注释,极大地加速了蛋白编码基因的研究。但与此同时,sRNA位点的注释,却往往被忽略。这既造成数据的闲置,也从某个角度来说,阻碍了一些研究的开展。比如,当群体数据分析结果事实上定位到一个sRNA产生位点,而分析人员并没有sRNA位点的注释,那么或者是直接错过该位点的发现,或者是需要花更多的精力做数据分析

植物sRNA位点注释明显缺失

植物sRNA主要包括三大类:

  • microRNA (miRNA)
  • phased small     interferencing RNA (phasiRNA,相位siRNA)
  • heterochromatic siRNAs (hc-siRNA,异染色质siRNA)
 
其中miRNA受到的关注较多,存在系列软件可以分析,如Dr. Michael J.Axtell等小RNA大牛的ShortStacks。但总的来说,相比于RNAseq数据分析,miRNA的分析并没有相对主流的分析流程。大多数课题组使用的仍然是自编流程。主流软件或流程的缺失,使得不同研究结果存在出入。而更为致命的是,几乎每篇miRNA预测相关的文章,最终的结果往往只附加在文章的附件。没有统一的管理,使得原本应该成为生物信息的研究成果,变成了占据硬盘的无用数据。作为目前最主流的miRNA收录数据库,miRBase上也只收录了80来个植物的miRNA位点,而且这些位点也不齐全。

miRNA,当然值得关注的,而phasiRNAs的重要性同样不言而喻,如华中农张启发老师课题组与华南农刘耀光老师课题组分别证实了水稻的光敏雄性不育直接受一个产生phasiRNA的位点的调控。目前没有广泛使用的phasiRNAs产生位点(即PHAS locus)的预测(注释)流程,同时也没有phasiRNAs收录数据库。这点相比于miRNA更为严重。

此外,作为植物三大类小RNA之一,hc-siRNA与基因表达调控存在直接相关,同样值得做位点注释与信息收录。

数据,只有整理并可用于解读,才会成为生物信息。
 
共享植物小RNA注释数据库

始于2016年,夏瑞课题组一直在优化和完善植物miRNAphasiRNAshc-siRNAs的注释流程与信息整理。通过这些时间的努力,我们使用统一的流程参与XIALAB暑期培训的同学应是已经知晓)对目前已有基因组公开序列以及至少一套sRNA测序数据的物种进行三类位点(miRNA, phasiRNA, hc-siRNA)的注释。我们得到了数目明显超过miRBasemiRNA位点注释信息。
同时,注释的完整度也明显超过miRBase


我们也针对所有物种进行了PHAS位点的注释,包括21-nt PHAS24-nt PHAS,如下

PS: 这个图是用该课题组开发的工具TBtools做的,效果不错吧!
 
目前所有位点的注释信息已经全部上传到sRNAanno,访问www.plantsRNAs.org即可查看。
 
sRNAanno网站信息简介

打开网站,可以看到

 
整个网站的功能简单:
  1. Browse(查看)用于浏览与物种sRNA注释位点的下载
  2. Search(搜索),用于sRNA位点的查询,如使用名字或序列Blast
  3. Resources(资源),提供sRNA注释服务IGV-sRNA软件下载
 
Browse
Browse界面中,通过在左侧进化树中选择所需分支(或单个物种),可获得对应注释文件的下载链接。


什么?gff3文件不会用?告诉你,可以用我们的TBtools提取相应需要的信息!
 
Search
Search界面中,可以输入miRNA家族信息,直接查看该家族的成员信息,

当然,你可以通过点击左侧的物种,从而限制搜索范围,

通过名字的搜索,当然是一个选择。有时候,我们拿到一段序列,想看看这段序列是否是miRNA位点和phasiRNA位点,那么这时候你可以使用Blast功能。

当结果已经输出,你会发现,结果中miRNA位点都是可以点击的。


于是,你会获得该位点的具体信息,

事实上,该课题组也充分考虑到用户的快速分析的需求,所以Search的操作,其实可以直接在主页上完成。

序列直接Blast也是支持的。

 
Resource
统一的分析流程,使得我们获得更具可比性的分析结果。但是对于很多wet-lab的科研人员,很多工具不一定会使,会使也不一定有好的计算资源可以用,所以急人所急,该课题组决定尝试在sRNAanno上提供免费注释sRNA的服务。用户朋友需要提供的只有两类文件的下载信息,就可以在一定的时间内得到对应的sRNA位点注释文件(.gff3)。

在提交之前,点击感叹号,阅读提交说明。我们在其中说明了所接受的文件格式。

IGV-sRNA
早前,已有数篇推文,大体讲述了IGV-sRNA的新特性。我们在sRNAanno上可以公开下载。
 

IGV-sRNA中,用户可以更好地完成sRNA位点的人工校对与可视化。具体IGV-sRNA的具体功能可以参看我们的预印本文章,也可以查看sRNAanno网站上的User Guide。或者我们以后会推送更为系统的IGV-sRNA使用说明
 

sRNAanno将作为一个植物小RNA信息的整合中心

滴水石穿,绳锯木断。植物的小RNA数据应该得到更好的利用,小RNA注释位点应该得到更好的整合。正如TBtools的开发一样,至今我们用了四年多的时间,一步一步不断地接收用户的意见和建议,不断地完成更新,走到目前这一状态(2019.01-2019.09Google Scholar 检索“TBtools” Citation: 130+)。sRNAanno是目前第一步,我们也期待对其进行进一步的开发与完善。欢迎有使用问题与改善意见或建议的朋友,请联系sRNAanno@gmail.com

如果在你们的工作中有用到sRNAanno的相关资源或IGV-sRNA,请引用我们的BioRxiv预印本文章。

Chengjie Chen, Junting Feng, Bo Liu, Jiawei Li, Lei Feng, Xiaoling Yu, Jixian Zhai,  Blake C. Meyers, Rui Xia. sRNAanno --- a database repository of uniformly-annotated small RNAs in plants. BioRxiv. doi: https:///10.1101/771121


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多