背景分类分析流程生物学功能lncRNA数据库大全lncRNA研究 背景非编码RNA,根据其长度的不同可分为长链非编码RNA和短链非编码RNA。转录本序列长度在200 bp 以上的非编码RNA 通常被称为长链非编码RNA(long non-coding RNA,lncRNA)。 目前,lncRNA的发现主要是通过以下三种途径:
lncRNA与细胞周期和分化、发育、生殖、性别调控、衰老以及多种人类疾病密切相关。lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。文献研究表明,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程,这些调控作用也开始引起人们广泛的关注。 分类许多lncRNA都具有保守的二级结构,剪切形式以及亚细胞定位,这种保守性和特 异性表明它们是具有功能的。但lncRNA的功能相对于microRNA和蛋白质的功能来说更加难以确定,因为目前并不能仅根据序列或者结构来推测它们的 功能。根据它们在基因组上相对于蛋白编码基因的位置, lncRNA可以分为五类: (1)Antisense lncRNA (反义lncRNA), (2)Enhancer lncRNA (增强子lncRNA), (3)Large intergenic noncoding RNA (lincRNA), (4)Bidirectional lncRNA (双向lncRNA), (5)Intronic transcript lncRNA (内含子lncRNA)。 分析流程生物学功能lncRNA可通过与DNA/RNA结合或与蛋白结合而行使其功能。一些lncRNA实际上是某些调控RNA(如microRNA或piwi RNA)的前体。与miRNA不同的是,lncRNA没有一种普遍的作用模式,它以许多不同的方式来调控基因表达和蛋白合成。研究发现,一些lncRNA参与了基因调控的基本过程,包括染色质修饰和结构以及直接的转录调控。基因调控可能以顺式(cis)或反式(trans)发生。lncRNA的转录后功能包括调控RNA加工事件,如剪接、编辑、定位、翻译和降解。 对于lncRNA在胚胎发育中的作用,Broad研究院的Mitchell Guttman曾这样描述,维持全能性的蛋白和促进分化的蛋白就像战士。它们各司其职,但需要一些东西来协调他们的行动。lincRNA则被认为是队长,带领不同蛋白,协同作战。 随着研究的深入,参与发育过程的lncRNA也不断被发现。据《Cell》杂志报道,麻省理工学院等机构的研究人员发现了一种新型的长链非编码RNA,称为勇敢的心(Braveheart,简称Bvht),它在哺乳动物发育过程,心血管发育谱系维持方面发挥了重要作用。而Whitehead研究所的科学家也发现了10个在脂肪细胞发育中扮演重要角色的lncRNA。 lncRNA数据库大全lncRNA数据库对于lncRNA的研究很关键,因为它有可能揭示一个全新的由RNA介导的遗传信息表达调控网络,从不同于蛋白质编码基因的角度来注释和阐明基因组的结构与功能,并为人类的疾病研究和治疗提供新的思路和方法。同时,新一代测序技术的发展也为鉴定lncRNA的计算机方法提供了强大的支持。(ps:后期我们将选择其中一些数据库进行详细的介绍,请保持关注。) 1. Noncode NONCODE v4是一个全面的综合注释数据库,数据由二代高通量测序技术产生,涵盖所有类型ncRNAs,(除了rRNAs and tRNAs)。NONCODE的优势之处在于其ncRNA注释,提供编码能力评估,位置信息,表达信息和潜在功能以及共表达等信息。另外它还对先前的基因芯片数据重注释,以获得更多的lncRNA表达信息。 http://www. 2. LncRBase LncRBase是一个基于特征序列(如CGIs和重复序列)来分析IncRNA功能的注释数据库。2015年11月,LncRBase收录了83201个鼠的和133361个人类的ncRNA转录本,分析内容包含“lncRNA-ncRNA互作”或“Alu repeat elements”结果。 http://bicresources./zhumur/lncrbase/ 3. lncRNome lncRNome是专门收集人类lncRNAs信息的知识数据库,包括疾病、表达、生物功能和表观遗传等相关信息。 http://genome.igib./lncRNome/ 4. NRED NERD是一个发育和分化相关的基因芯片数据库,包含各种组织特异表达的lncRNA。用户可以在特定的器官,部位和细胞中查询lncRNA的表达情况。 http://nred./cgi-bin/ncrnadb.pl 5. C-It-Loci C-It-Loci收录了来自人类、鼠和斑马鱼的组织特异性IncRNA数据库。它考虑了lncRNAs序列的保守性,能使用物种间保守性区域或位点来识别相关lncRNAs。 http://c-itloci. 6. Co-LncRNA Co-LncRNA提供了lncRNAs共表达、GO注释和KEGG通路的富集分析结果。数据主要来自细胞系和人类样本的RNA-Seq实验数据。 http://www./Co-LncRNA/ 7. LNCipedia LNCipedia是一个人类lncRNA转录序列和结构的注释数据库,使用二级结构信息建立了一个标准统一的分类和命名体系。lncRNA信息包含编码能力评估,预测开放阅读框和二级结构等信息。 http://www. 8. LncRNA2Function LncRNA2Function是一个lncRNA功能注释的数据库。LncRNA2Function注释了来自GENCODE数据库的lncRNAs,结果包含通路注释和GO注释。 http://mlg./lncrna2function/ 9. lncRNABase (starBase) v 2.0 Starbase是一个lncRNA与其他分子相互作用的数据库。主要使用CLIP-seq和CLASH等实验数据来支持mRNAs,miRNAs,RNAs,蛋白质和其他各种类型的ncRNAs之间的相互作用。 http://starbase./mirLncRNA.php 10. lncRNAdb LncRNAdb是一个真核生物的lncRNA综合数据库。数据库包括特异的序列结构信息,如转录本、基因组位置、表达、亚细胞定位和保守位点以及相关的功能和疾病。 http://www. 11. fRNAdb fRNAdb结合了SRE和CGI信息以及表观遗传学数据(甲基化、组蛋白修饰),以提高lncRNA的准确性。 http:///database 12. Linc2Go Linc2Go是一个lncRNA的功能注释数据库,它基于ceRNA假说,即假设lncRNAs与microRNAs相互作用来抑制mRNA的转录,从而预测lncRNA功能。 http://www.bioinfo./liuke/Linc2GO/ 13. ChIPBase 在哺乳动物中存在大量高度保守的lncRNA,这些lncRNAs可能具有调控细胞功能的作用。coding/non-coding gene co-expression(CNC)预测是一种基于网络拓扑和特征来预测lncRNAs可能的功能。 ChIPBase使用染色质免疫沉淀结合深度测序(ChIP-seq)数据来连接lncRNAs与表观遗传因子,并且整合了转录因子(TF)-lncRNA、TF-miRNA TF-miRNA-miRNA和TF –ncRNA等调控关系。 ChIPBase结合转录因子结(TFBS)的组织特异表达谱来预测TF与lncRNAs作用关系,来阐释其在转录调控,染色质重塑和组蛋白修饰中的关键作用。 http://deepbase./chipbase/ 14. lncRNASNP lncRNASNP是一个SNPs对lncRNA以及结合miRNA能力的影响的信息数据库。LncRNASNP提供结合位点,自由能能和互作的结合分值。此外,LncRNASNP提供了单个SNPs对lncRNA的二级结构影响的可视化示意图。 http://bioinfo.life./lncRNASNP/ 15. LncRNADisease LncRNADiseas是收集各种实验验证的与lncRNA相互作用的信息数据库(蛋白质、RNA, microRNA,DNA…),通过对疾病的聚类和序列的保守性(SNP的分布密度)来预测lncrna与疾病的相关性。 http://www./lncrnadisease 16. Lnc2Cancer Lnc2Cancer是人工收集1500多篇已发表的论文,提取了531个lncRNAs与86种癌症相关的1057个作用关系。数据库包含lncRNA在癌症中的表达水平(上升或下调)。 http://www./lnc2cancer/home.jsp lncRNA相互作用分析 17. ncFANs v2 ncFANs是一个用于注释基因芯片中包含lncRNAs的分析平台,它通过蛋白与lncRNAs共表达(CNC)网络来注释lncRNAs的功能。 http://www./ncfans/ 18. lncRNAtor lncRNAtor是一个包含表达谱,ncRNA-蛋白结合和进化分值和编码能力注释的LncRNA序列的数据信息平台。LncRNA-蛋白结合是lncRNAtor一个特有功能。此外,lncRNAtor提供了一个器官、癌症、药物、组织和发育阶段等RNA-Seq数据的整合分组。 http://lncrnator./index.htm 19. lncPro lncPro工具是一个为数不多的专门用于预测lncRNAs和蛋白质相互作用的工具。与lncRNAtor通过使用差异表达数据来确定结合作用不同,lncPro是使用机器学习的模型,通过对lncRNA二级结构、氢键倾向和范德瓦尔斯力进行计算,从而对lncRNA-protein配对关系进行预测。 http://www./NPInter/lncPro.htm 20. DIANA-LncBase DIANA-LncBase是一个用于分析lncRNAs在人类和鼠中的生理和病理的影响。通过ORF方法来识别lncRNAs,并且显示lncRNA-miRNA互相作用。最后,使用序列保守性、人类lncRNA和蛋白质转录本对其进行功能注释。 http://diana.imis./DianaTools/index.php?r=lncBase/index 21. lncRNAMap lncRNAMap的是一个人类lncRNAs全面整合的数据库。lncRNAMap提供lncRNA沉默干扰后的信息。从公开的siRNA文库或siRNA-target的深度测序数据来预测miRNAs和siRNA的靶lncRNAs。 http://lncrnamap.mbc./php/ 22. TF2LncRNA TF2LncRNA工具月用于评估TFs与lncRNAs之间的相关性。使用超几何检验对ENCODE数据库中的ChIP-seq数据进行基因本体(GO)或通路富集的统计评估。对于lncRNA-TFs查询,使用Benjamini-Hochberg法对于p值的统计校正。 http://mlg./tf2lncrna/index.jsp 23. TANRIC lncRNAs作为癌症关键分子的作用不断认识,TANRIC包含大量RNA-Seq数据集,允许通过生物学意义和药物敏感对lncRNAs临床研究进行探索。使用20种癌症的表达谱包含TCGA和和其他独立的数据集(共计8000多个样本),TANRIC包含lncRNA的生物分子及临床信息之间的关联分析并且支持可视化,例如,热图和聚类。 http://ibl./tanric/_design/basic/index.html 24. LongTarget LongTarget是一个来预测lncRNA-DNA结合motifs和结合位点的工具。按照6个Hoogsteen和18个反向Hoogsteen规律来分析lncRNA和DNA序结结合并预测TFO和TSS。 http://lncrna. lncRNA研究1.最新研究(1)Enhancer-associated long non-coding RNA LEENE regulates endothelial nitric oxide synthase and endothelial function https://www./articles/s41467-017-02113-y eNOS expression is dynamically regulated both transcriptionally and post-transcriptionally by various stimuli. Here the authors identify an enhancer-associated lncRNA (LEENE) that is co-regulated with, and enhances eNOS expression. Yifei Miao, Nassim E. Ajami […] Zhen Chen 18 January 2018 Nature Communications 9, 292 (2)TPGLDA: Novel prediction of associations between lncRNAs and diseases via lncRNA-disease-gene tripartite graph https://www./articles/s41598-018-19357-3 Liang Ding, Minghui Wang […] Ao Li 18 January 2018 Scientific Reports 8, 1065 (3)The lncRNA GATA6-AS epigenetically regulates endothelial gene expression via interaction with LOXL2 https://www./articles/s41467-017-02431-1 LncRNAs influence endothelial cell function via a number of mechanisms. Here the authors show that the lncRNA GATA6-AS regulates endothelial gene expression through interaction with the nuclear deaminase LOXL2, with functional consequences on endothelial-mesenchymal transition and angiogenesis. Philipp Neumann, Nicolas Jaé […] Stefanie Dimmeler 16 January 2018 Nature Communications 9, 237 (4)Allele-specific repression of Sox2 through the long non-coding RNA Sox2ot https://www./articles/s41598-017-18649-4 Tobias C. Messemaker, Selina M. van Leeuwen […] Harald M. M. Mikkers 10 January 2018 Scientific Reports 8, 386 (5)Silencing of the lncRNA Zeb2-NAT facilitates reprogramming of aged fibroblasts and safeguards stem cell pluripotency https://www./articles/s41467-017-01921-6 The efficiency of somatic cell reprogramming is lowered by ageing. Here the authors show that the transcription factor Zeb2 and its long non-coding RNA Zeb2-NAT are expressed at high levels in older fibroblasts and their inhibition increases reprogramming efficiency. Bruno Bernardes de Jesus, Sérgio Pires Marinho […] Maria Carmo-Fonseca 08 January 2018 Nature Communications 9, 94 (6)RNA-DamID reveals cell-type-specific binding of roX RNAs at chromatin-entry sites https://www./articles/s41594-017-0006-4 RNA-DamID, a novel approach to detect lncRNA–genome interactions in vivo with high sensitivity and accuracy, demonstrates that the initial targeting of lncRNAs in the Drosophila dosage-compensation complex is cell-type specific. Seth W. Cheetham & Andrea H. Brand 18 December 2017 Nature Structural & Molecular Biology 25, 109–114 2.疾病相关(1)与癌症相关
(2)与神经系统疾病相关
(3)其他类型疾病
参考内容 1.誉衡基因, 生命中的lncRNA 2.MedSci, 带你全面认识长链非编码RNA 3.弗雷赛斯, 最全长链非编码RNA数据库介绍(全) 4.Johnny T. Y. Kung, David Colognori and Jeannie T. Lee. Long Noncoding RNAs: Past, Present, and Future. GENETICS 2013, 193(3):651-669. 5.https://www./subjects/long-non-coding-rnas 6.Exiqon-What are lncRNAs? |
|