导语 各个物种环状RNA的数据量汇总 还可以通过物种,细胞系,基因名称或者基因组位置,circpedia中的环状RNA ID进行检索,数据库会给出环状RNA ID来源基因,对应的线性转录本,表达量,外显子的起始和终止位置,细胞系,保守性等信息,并可以用热图或者散点图的形式展现环状RNA在不同组织或者细胞系中的表达量。总而言之,这个数据库提供 circRNA 搜索,可视化,下载和在线可视化工具都是不在话下。 CIRCpedia v2 http://www./rnomics/circpedia CIRCpedia v2首页 可看到CIRCpedia v2的四大功能:检索、浏览、下载和表达差异分析工具;还有来自六个物种的185 RNA-seq数据集的分析情况,大部分数据集中在人、小鼠和果蝇上。 01 Search 这里可以通过设置好需要研究的物种(species),组织和细胞类型(cell Line),研究的基因名称或者位置或者circID,就可以进行检索: 检索结果(以CAMSAP1为例)如下,可根据需要选择显示不同数据注释方式(circRNA、A5BS、A3BS);点击“gene”下的基因名称,就会链接到genecard网站,以便更全面地了解该基因的信息(该功能目前局限于人源基因,而不适用于其他物种);“ExonStart–ExonEnd”显示同一基因在不同细胞中不同的剪接方式包含的外显子;“cell line”显示该基因在这种细胞中特异反向剪接方式(但是检索结果中无法直接下载circRNAs的具体序列,只能下载circRNAs的检索汇总信息);也给出了环状RNA ID,来源基因,对应的线性转录本,表达量,外显子的起始和终止位置,细胞系,保守性等信息。 人类circRNA的注释同时使用CIRCexplorer2及MapSplice 两种程序,并通过LiftOver 分析整合人类及小鼠间circRNA保守性信息。根据每百万map片段上反向剪切接头的map片段数量 (FPM) 来计算circRNA的表达,并同时支持单端及双端测序数据。 输出文件格式包括JSON, XML, CSV, or TXT。下载时可以选择数据来源,同时对人类circRNA搜索结果提供可视化工具(下一步)及GeneCards网站上来源基因的鉴定信息。 02 Browse Browse面板的左边提供在染色体该位置上所有的能够鉴定的A3BS、A5BS、circRNA等信息,并通过面板右边可视化体现,包括基因注释、RNA-seq数据集、circRNA注释和备选反向拼接事件,点击具体的图形能够获得详细序列。上方的工具栏中可以切换其他基因组。另外,单击Browse中给定circRNA的track,将对其表达值(FPM)以进行可视化。通过JBowse基因组浏览器查看相关数据,示意如下: 03 Download Download可修改注释方式表格和物种,轻松下载相应的数据,Table其中A5BS和A3BS数据等待时间需要久点;Species有多个物种可以选择,选择某种cell line下载的话,下载可能会出错,建议选择all,后续再对下载文件进行筛选。 04 Tool “Tool”功能可直接对不同circRNAs在不同组织和细胞中表达差异进行分析,主要是用热图或者散点图的形式展现环状RNA在不同组织或者细胞系中的表达量,这有是CIRCpedia v2的一大亮点。一般规定了基因组位置的circRNA,则规定了相应的物种;研究者可选择在不同的组织和细胞中比较表达差异,再以两种图显示出来。操作步骤是第一步输入环状RNA ID, 第二步选择物种,第三步选择细胞系,可以多选,第四步选择图表类型,然后点击Draw按钮,在右边的面板会显示对应的结果。 通过该数据库的在线工具,可以方便的探究不同物种的环状RNA和不同细胞系中环状RNA的表达量。 PS:介于很小比例的人类的circRNA (10%-20%) 同样出现在小鼠样本中,网站整合了LiftOver对两者间circRNA保守性分析的结果,结合Browse可视化工具,可对潜在环化位点附近的内含子序列特征进一步分析。 以上就是本期对CIRCpedia v2数据库的介绍。随着鉴定工具多样化及RNA反向互补序列计算工具的引入,将进一步减少转录组数据预测的假阳性及丰富circRNA的下游分析,因此CIRCpedia v2将来还是很实用的。 |
|