分享

最全长链非编码RNA数据库介绍(全)

 尹东觉 2017-05-12


生命科学研究中非编码调控RNA可谓是研究最火的领域之一,大量lncRNA数据不断积累和各种资源数据库被开发出来,使我们更加方便地查询和研究。


数据团队整理相关文献总结出了24个数据库和工具。接下来我们会对每个数据库和工具进行一个简短的总结,并提供相关的链接和文献。


我们以前介绍过12个lncRNA数据库和工具,这期将进行全部整合。

1. Noncode

NONCODE v4是一个全面的综合注释数据库,数据由二代高通量测序技术产生,涵盖所有类型ncRNAs,(除了rRNAs and tRNAs)。


NONCODE的优势之处在于其ncRNA注释,提供编码能力评估,位置信息,表达信息和潜在功能以及共表达等信息。另外它还对先前的基因芯片数据重注释,以获得更多的lncRNA表达信息。
http://www.


2. LncRBase

LncRBase是一个基于特征序列(如CGIs和重复序列)来分析IncRNA功能的注释数据库。


2015年11月,LncRBase收录了83201个鼠的和133361个人类的ncRNA转录本,分析内容包含“lncRNA-ncRNA互作”或“Alu repeat elements”结果。
http://bicresources./zhumur/lncrbase/

3. lncRNome

lncRNome是专门收集人类lncRNAs信息的知识数据库,包括疾病、表达、生物功能和表观遗传等相关信息。
http://genome.igib./lncRNome/

4. NRED

NERD是一个发育和分化相关的基因芯片数据库,包含各种组织特异表达的lncRNA。


用户可以在特定的器官,部位和细胞中查询lncRNA的表达情况。
http://nred./cgi-bin/ncrnadb.pl

5. C-It-Loci

C-It-Loci收录了来自人类、鼠和斑马鱼的组织特异性IncRNA数据库。它考虑了lncRNAs序列的保守性,能使用物种间保守性区域或位点来识别相关
lncRNAs。
http://c-itloci.

6. Co-LncRNA

Co-LncRNA提供了lncRNAs共表达、GO注释和KEGG通路的富集分析结果。数据主要来自细胞系和人类样本的RNA-Seq实验数据。
http://www./Co-LncRNA/

7. LNCipedia

LNCipedia是一个人类lncRNA转录序列和结构的注释数据库,使用二级结构信息建立了一个标准统一的分类和命名体系。


lncRNA信息包含编码能力评估,预测开放阅读框和二级结构等信息。
http://www.

8. LncRNA2Function

LncRNA2Function是一个lncRNA功能注释的数据库。LncRNA2Function注释了来自GENCODE数据库的lncRNAs,结果包含通路注释和GO注释。
http://mlg./lncrna2function/


9. lncRNABase (starBase) v 2.0

Starbase是一个lncRNA与其他分子相互作用的数据库。主要使用CLIP-seq和CLASH等实验数据来支持mRNAs,miRNAs,RNAs,蛋白质和其他各种类型
的ncRNAs之间的相互作用。
http://starbase./mirLncRNA.php

10. lncRNAdb

LncRNAdb是一个真核生物的lncRNA综合数据库。数据库包括特异的序列结构信息,如转录本、基因组位置、表达、亚细胞定位和保守位点以及相关的功能和疾病。
http://www.


11. fRNAdb

fRNAdb结合了SRE和CGI信息以及表观遗传学数据(甲基化、组蛋白修饰),以提高lncRNA的准确性。
http:///database

12. Linc2Go

Linc2Go是一个lncRNA的功能注释数据库,它基于ceRNA假说,即假设lncRNAs与microRNAs相互作用来抑制mRNA的转录,从而预测lncRNA功能。
http://www.bioinfo./liuke/Linc2GO/

13. ChIPBase

在哺乳动物中存在大量高度保守的lncRNA,这些lncRNAs可能具有调控细胞功能的作用。coding/non-coding gene co-expression(CNC)预测是一种基于网络拓扑和特征来预测lncRNAs可能的功能。


ChIPBase使用染色质免疫沉淀结合深度测序(ChIP-seq)数据来连接lncRNAs与表观遗传因子,并且整合了转录因子(TF)-lncRNA、TF-miRNA TF-miRNA-miRNA和TF –ncRNA等调控关系。


ChIPBase结合转录因子结(TFBS)的组织特异表达谱来预测TF与lncRNAs作用关系,来阐释其在转录调控,染色质重塑和组蛋白修饰中的关键作用。
http://deepbase./chipbase/

14. lncRNASNP

lncRNASNP是一个SNPs对lncRNA以及结合miRNA能力的影响的信息数据库。LncRNASNP提供结合位点,自由能能和互作的结合分值。


此外,LncRNASNP提供了单个SNPs对lncRNA的二级结构影响的可视化示意图。
http://bioinfo.life./lncRNASNP/

15. LncRNADisease

LncRNADiseas是收集各种实验验证的与lncRNA相互作用的信息数据库(蛋白质、RNA, microRNA,DNA…),通过对疾病的聚类和序列的保守性(SNP的
分布密度)来预测lncrna与疾病的相关性。
http://www./lncrnadisease

16.  Lnc2Cancer

Lnc2Cancer是人工收集1500多篇已发表的论文,提取了531个lncRNAs与86种癌症相关的1057个作用关系。数据库包含lncRNA在癌症中的表达水平(上升或下调)。
http://www./lnc2cancer/home.jsp


lncRNA相互作用分析


17. ncFANs v2

ncFANs是一个用于注释基因芯片中包含lncRNAs的分析平台,它通过蛋白与lncRNAs共表达(CNC)网络来注释lncRNAs的功能。
http://www./ncfans/

18. lncRNAtor

lncRNAtor是一个包含表达谱,ncRNA-蛋白结合和进化分值和编码能力注释的LncRNA序列的数据信息平台。LncRNA-蛋白结合是lncRNAtor一个特有功能。


此外,lncRNAtor提供了一个器官、癌症、药物、组织和发育阶段等RNA-Seq数据的整合分组。
http://www./NPInter/lncPro.htm


19. lncPro

lncPro工具是一个为数不多的专门用于预测lncRNAs和蛋白质相互作用的工具。


与lncRNAtor通过使用差异表达数据来确定结合作用不同,lncPro是使用机器学习的模型,通过对lncRNA二级结构、氢键倾向和范德瓦尔斯力进行计算,从而对lncRNA-protein配对关系进行预测。


20. DIANA-LncBase

DIANA-LncBase是一个用于分析lncRNAs在人类和鼠中的生理和病理的影响。通过ORF方法来识别lncRNAs,并且显示lncRNA-miRNA互相作用。最后,使用序列保守性、人类lncRNA和蛋白质转录本对其进行功能注释。
http://diana.imis./DianaTools/index.php?r=lncBase/index


21. lncRNAMap

lncRNAMap的是一个人类lncRNAs全面整合的数据库。lncRNAMap提供lncRNA沉默干扰后的信息。


从公开的siRNA文库或siRNA-target的深度测序数据来预测miRNAs和siRNA的靶lncRNAs。
http://lncrnamap.mbc./php/


22. TF2LncRNA

TF2LncRNA工具月用于评估TFs与lncRNAs之间的相关性。使用超几何检验对ENCODE数据库中的ChIP-seq数据进行基因本体(GO)或通路富集的统计评估。


对于lncRNA-TFs查询,使用Benjamini-Hochberg法对于p值的统计校正。
http://mlg./tf2lncrna/index.jsp

23. TANRIC

lncRNAs作为癌症关键分子的作用不断认识,TANRIC包含大量RNA-Seq数据集,允许通过生物学意义和药物敏感对lncRNAs临床研究进行探索。


使用20种癌症的表达谱包含TCGA和和其他独立的数据集(共计8000多个样本),TANRIC包含lncRNA的生物分子及临床信息之间的关联分析并且支持可视化,例如,热图和聚类。
http://ibl./tanric/_design/basic/index.html

24. LongTarget

LongTarget是一个来预测lncRNA-DNA结合motifs和结合位点的工具。按照6个Hoogsteen和18个反向Hoogsteen规律来分析lncRNA和DNA序结结合并预测TFO和TSS。
http://lncrna.



lncRNA分析流程



FS数据挖掘主编

赵忻艺,将大数据应用于医学科研,主要包括临床医学数据的挖掘、收集、整理和利用(标准化和科学化的数据库),医学分子大数据的整理、利用及研究(基因、蛋白及代谢)。特别针对肿瘤个体化的基因测序和数据快速处理,寻找个体化的分子标志物、药物靶标和治疗方案。目前,已建立浙大大数据挖掘团队,旨在降低研究者学习大数据的门槛,推动大数据共享与研究协作,发表更高质量的研究成果,为科研决策提供精准的预测和实验证据。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多