分享

NAR 表观遗传Database专辑荟萃(三)

 九斗酒 2017-09-21

引言:前面两期小编介绍了DNA甲基化、组蛋白修饰以及超级增强子相关的表观遗传学数据库,今天带给大家的是几款关于非编码RNA的表观遗传学领域常用数据库,包括circRNA、miRNA、lncRNA等。通过本次专题系列的介绍,期望能够给伙伴们日常的表观遗传学研究带来助力,也让大家对NAR数据库专刊在表观遗传学领域的整体概况有个了解。


1、CircNet

从转录组测序数据得到的cirRNA数据库


CircNet(http://circnet.mbc./),是由台湾国立交通大学的研究人员对464个样本的RNA-seq数据系统地整理挖掘后建立的数据库,包括以下资源:

i)新的circRNA

ii)整合circRNA-miRNA-mRNA的互作网络

iiicircRNA同种型的表达谱

ivcircRNA亚型的基因组注释

vcircRNA亚型的序列。

 CircNet数据库是第一个提供组织特异性circRNA表达谱和circRNA-miRNA基因调控网络的公共数据库。它不仅扩展了最新的circRNA目录,而且提供了先前报道的和新型的circRNAs的表达分析。此外,它产生一个整合的调控网络,说明了circRNAmiRNA和基因之间的调控。


如下图所示,在左边输入框中输入基因的名称,如ZEB1,左侧展示了circRNA-miRNA-mRNA的互作网络,右手边还能看到circRNA在不同组织细胞中的表达水平还有基因组位置信息,在屏幕的右下角还方便地设有JBrowse基因组浏览器,展示了circRNA对应来源基因的位置关系。



在右侧输入框“search miRNA”中输入let-7a-3p,可视化miRNA相关的circRNA,基因互作关系。边与节点的不同颜色代表不同的互作关系。从图中可知与let-7a-3p互作的circRNA,mRNA共244个。



2、starBase v2.0
从大规模CLIP-Seq数据解码miRNA-ceRNA,miRNA-ncRNA和蛋白质-RNA互作网络的表观遗传数据库


starBase v2.0:一个高通量实验数据CLIP-Seq(或称为HITS-CLIP,PAR-CLIP,iCLIP)和mRNA降解组测序数据支持的microRNA靶标数据库,包含了miRNA-mRNA,miRNA-lncRNA,miRNA-circRNA,miRNA-ceRNA 和RNA-protein等的调控关系。整合和构建多个流行的靶标预测软件的交集和调控关系。构建了最全面的包含了14种癌症类型(超过6000个样本)pan-cancer(泛癌)表达图谱和互作网络。starBase v2.0已经更新,以提供迄今为止最全面的CLIP-Seq实验支持的miRNA-mRNA和miRNA-lncRNA相互作用网络。数据库从CLIP支持的miRNA靶位点鉴定了约10000个ceRNA对。通过结合13个功能基因组注释,开发了miRFunction和ceRNAFunction web服务器来预测miRNA和其他ncRNA的功能。

starBase v2.0核心框架的系统概



3、miRTarBase 
实验验证的miRNA - 靶相互作用的表观遗传数据库


miRTarBasehttp://miRTarBase.mbc./)整合实验证实的microRNA靶标的数据库。数据库的最新更新通过21个独立研究产生的138个交联和免疫沉淀测序(CLIP-seq)数据集系统地鉴定Argonaute蛋白-miRNA-RNA相互作用。数据库包含4966篇文章,7439篇验证的MTI和CLIP-seq中获取的348 007个MTI。自2014年miRTarBase更新以来,miRTarBase中的MTI数量已经增加了约7倍。数据库整合了癌症基因组图谱(TCGA)的miRNA和基因表达谱。

更新的数据库添加了3个新的特征:

1.The word cloud of miRNA-disease information

2.miRNA-Target site viewer in CLIP-seq data

3.Clinical microRNA and gene expression profiles from TCGA


(A)(B)新的miRTarBase主页和三个新的主要界面,包括miRNA disease word cloud,基于CLIP-seq数据(C)的miRNA靶位点查看器和使用TCGA数据集(D)获得的miRNA和基因表达谱。




4、dbDEMC 2.0
人类癌症中差异表达的miRNA相关数据库


dbDEMC(http://www./dbDEMC)是一种综合数据库,旨在通过高通量方法检测人类癌症中存在和显示差异表达的miRNA。在这个更新版本的dbDEMC中,从GEO和TCGA收集了209个新发布的数据集。 R包limma被用于筛选来自不同类型实验的差异表达的miRNA,其中包括癌症与正常对照,癌症亚型比较,癌症等级比较,血样比较等。目前的版本包含36种癌症类型中2224种差异表达的miRNA,49 202个miRNA-癌症关联。界面易于使用,以方便查询并浏览数据库中的结果。此外,还提供了一个增强的miRNA页面来演示基本的miRNA描述,每个分析类型中的多个表达谱,相关分析实验和低通量验证测定的结果。对于一组miRNA和多种癌症类型,差异表达谱可以在热图中显现,以探索癌症之间的差异和相似性。

数据库提供了几种允许数据库查询的方法。首先,用户可以通过使用“搜索”页面中的miRNA名称在dbDEMC 2.0中执行快速搜索(图A)。搜索结果页面简要列出了病例和对照样本之间相关的GEO ID,癌症类型,亚型,实验设计和fold change变化(图B)。其次,数据库提供了BLAST序列相似性搜索工具,允许用户通过使用miRNA序列来确定未知miRNA是否与现有miRNA重叠。此外,用户还可以选择特定的癌症类型或亚型,并从“浏览”页面浏览所有相关实验(图C)。并列出实验ID,实验设计,病例样本,对照样品和上调和下调miRNA的数量(图D)。获得实验列表后,用户可以选择特定实验,然后单击“查看miRNA”按钮导航差异表达的miRNA列表。 通过点击特定miRNA ID的超链接,用户可以查看特定miRNA的详细表达信息(图E)。



题图来源:nucleic acids research (nar)数据库专刊及已发表数据库网址

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多