分享

CIRCpedia v2:circRNA注释及表达数据库

 智汇基因 2021-02-18

导语


环状RNA(circular RNAs, circRNA)是一类由 mRNA 前体经反向可变剪切而来的共价闭合且保守的单链转录本,长度跨度从几十bp到几千bp,在表观遗传及各种细胞过程中发挥重要作用。CIRCpedia v2是一个更新的综合数据库,数据来源于Gene Expression Omnibus (GEO), Encyclopedia of DNA Elements (ENCODE) project, 及EMBL-European Bioinformatics Institute (EMBL-EBI)三大RNA-seq数据库其中包含来自六个不同物种(人、大小鼠、果蝇、斑马鱼)的180多个RNA-seq数据集的circRNA注释,识别到了262782个环状RNA。

各个物种环状RNA的数据量汇总

还可以通过物种,细胞系,基因名称或者基因组位置,circpedia中的环状RNA ID进行检索,数据库会给出环状RNA ID来源基因,对应的线性转录本,表达量,外显子的起始和终止位置,细胞系,保守性等信息,并可以用热图或者散点图的形式展现环状RNA在不同组织或者细胞系中的表达量。总而言之,这个数据库提供 circRNA 搜索,可视化,下载和在线可视化工具都是不在话下。

CIRCpedia v2

http://www./rnomics/circpedia

CIRCpedia v2首页

可看到CIRCpedia v2的四大功能:检索、浏览、下载和表达差异分析工具;还有来自六个物种的185 RNA-seq数据集的分析情况,大部分数据集中在人、小鼠和果蝇上。

01

Search

这里可以通过设置好需要研究的物种(species),组织和细胞类型(cell Line),研究的基因名称或者位置或者circID,就可以进行检索:

检索结果(以CAMSAP1为例)如下,可根据需要选择显示不同数据注释方式(circRNA、A5BS、A3BS);点击“gene”下的基因名称,就会链接到genecard网站,以便更全面地了解该基因的信息(该功能目前局限于人源基因,而不适用于其他物种);“ExonStart–ExonEnd”显示同一基因在不同细胞中不同的剪接方式包含的外显子;“cell line”显示该基因在这种细胞中特异反向剪接方式(但是检索结果中无法直接下载circRNAs的具体序列,只能下载circRNAs的检索汇总信息);也给出了环状RNA ID,来源基因,对应的线性转录本,表达量,外显子的起始和终止位置,细胞系,保守性等信息。

人类circRNA的注释同时使用CIRCexplorer2及MapSplice 两种程序,并通过LiftOver 分析整合人类及小鼠间circRNA保守性信息。根据每百万map片段上反向剪切接头的map片段数量 (FPM) 来计算circRNA的表达,并同时支持单端及双端测序数据。

 输出文件格式包括JSON, XML, CSV, or TXT。下载时可以选择数据来源,同时对人类circRNA搜索结果提供可视化工具(下一步)及GeneCards网站上来源基因的鉴定信息。

02

 Browse

Browse面板的左边提供在染色体该位置上所有的能够鉴定的A3BS、A5BS、circRNA等信息,并通过面板右边可视化体现,包括基因注释、RNA-seq数据集、circRNA注释和备选反向拼接事件,点击具体的图形能够获得详细序列。上方的工具栏中可以切换其他基因组。另外,单击Browse中给定circRNA的track,将对其表达值(FPM)以进行可视化。通过JBowse基因组浏览器查看相关数据,示意如下:

03

Download

Download可修改注释方式表格和物种,轻松下载相应的数据,Table其中A5BS和A3BS数据等待时间需要久点;Species有多个物种可以选择选择某种cell line下载的话,下载可能会出错,建议选择all,后续再对下载文件进行筛选。

04

 Tool

“Tool”功能可直接对不同circRNAs在不同组织和细胞中表达差异进行分析,主要是用热图或者散点图的形式展现环状RNA在不同组织或者细胞系中的表达量,这有是CIRCpedia v2的一大亮点。一般规定了基因组位置的circRNA,则规定了相应的物种;研究者可选择在不同的组织和细胞中比较表达差异,再以两种图显示出来。操作步骤是第一步输入环状RNA ID, 第二步选择物种,第三步选择细胞系,可以多选,第四步选择图表类型,然后点击Draw按钮,在右边的面板会显示对应的结果。

通过该数据库的在线工具,可以方便的探究不同物种的环状RNA和不同细胞系中环状RNA的表达量。

PS:介于很小比例的人类的circRNA (10%-20%) 同样出现在小鼠样本中,网站整合了LiftOver对两者间circRNA保守性分析的结果,结合Browse可视化工具,可对潜在环化位点附近的内含子序列特征进一步分析。

以上就是本期对CIRCpedia v2数据库的介绍。随着鉴定工具多样化及RNA反向互补序列计算工具的引入,将进一步减少转录组数据预测的假阳性及丰富circRNA的下游分析,因此CIRCpedia v2将来还是很实用的。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多