分享

DNA Rchitect:一种基于R的染色质相互作用数据网络分析可视化工具

 生物_医药_科研 2019-08-11
摘要

多个基因组数据的可视化通常需要使用公共或商业托管的浏览器,染色质相互作用数据作为基因组特征和网络组件的灵活可视化为基因表达提供了重要信息。因此一个可视化HiC和染色质构象数据的开源应用程序是很有价值的。哈佛医学院免疫学研究人员Ramirez等人利用RSushiShiny开发了DNA Rchitect工具,该工具使用户可以在web浏览器中交互式地可视化基因组数据,且在高(Kb)和低(Mb)基因组分辨率下均能可视化HiC和染色质构象接触。这一重大成果近日以《DNA Rchitect: An R based visualizer for network analysis of chromatin interaction data》为题发表在Bioinformatics杂志上。

用户可以在DNA Rchitect web应用程序上上传预先过滤的bedpe格式的HiC实验数据,能够可视化样本的不同交互关系,执行简单的网络分析,同时还提供其他基因组数据类型的可视化功能。然后,用户可以下载分析结果,以获得基于网络程序(Cytoscape)提供的附加网络功能。获得和执行DNA Rchitect工具都是免费的,一个途径是作为主要用R编写的web应用程序(http://shiny./DNARchitect/)使用,另一个途径是作为在MIT许可下发布的开放源码(https://github.com/alosdiallo/DNA_Rchitect)

DOI: 10.1093/bioinformatics/btz608.

示例

Fig1. DNA Rchitect提供了染色质相互作用数据的基因组学视图和网络分析

(A) 展示人细胞K562NHEKGM12878HiC数据在RUNXI基因座中位置信息;(B) (A)HiC接触点的基因组网络,其中每个边都根据HiC样本类型着色;(C) MYC位点的弧线图显示了三种细胞类型间复杂的染色质结构,它们可以被解析为群落;(D) 从网络分析中检测到的群体被着色为群体组,而插图显示的是基因组网络;(E) 启动子捕获HiC接触和(F)人类Jurkat细胞株的基因组网络显示了与BACH2启动子的高分辨率(10-20kb)顺式调控相互作用。

为了演示DNA Rchitect程序的某些生态位应用,文章使用人类HiC和启动子捕获HiC实验数据,展示了使用DNA Rchitect可以可视化K562NHEKGM12878这三种细胞类型的HiC环结构。作者证明了在造血调节因子RUNX1位点处DNA Rchitect易于鉴定细胞特异性HiC联系的能力(Figure 1A-B)。此处展示了针对髓系白血病细胞系K562的多个最大强度HiC弧线,它跨越RUNX1位点,是维持恶性和白血病细胞类型生存的一个完整的调节器。该观察可以遵循所提出的用于通过TAD绝缘的结构控制基因表达的模型或维持K562细胞中RUNX1的受控表达所需的顺式相互作用。此外,之前使用基于网络分析的方法处理ChIA-PET数据(基于IP的3C技术)的工作成功地阐明了lncRNA网络中心和类似增强器功能的进化保守性。

为了进一步研究致癌基因MYC(这三种细胞系中均有表达)HiC触点,作者观察到在这一位点HiC触点比RUNX1位点展示出更为复杂的染色质结构(Figure 1C)。该位点的DNA Rchitect网络分析可以将染色质相互作用解析为基于HiC的检测群体(Figure 1D)。此外,作者观察到MYC下游K562 HiC与一组miRNA基因的接触强度增加,而在GM12878NHEK细胞类型中上游HiC接点中占主导地位(Figure 1C)。而且,研究结果还补充了之前的实验观察,以确定不同癌细胞类型间MYC位点的染色质相互作用的复杂组织。除了实验,DNA Rchitect可以作为一种交互导航和识别染色质相互作用的方法,用于其他难以可视化的典型位点。

在另一个例子中,作者使用DNA Rchitect提供的人类Jurkat T细胞系启动子捕获HiC数据来观察放大的高分辨率染色质结构。聚焦于转录调控因子BACH2,可以观察到从BACH2启动子到邻近顺式调控元件的几个接触点(Figure 1E-F)。如图所示,DNA Rchitect使用户能够可视化高分辨率染色质相互作用((Figure 1E),几个高强度接触发生在距启动子不到20 kb的位置。文章选择的例子是提供3d技术数据的插图来说明三种生物学观察细胞特异性、染色质接触复杂度和以启动子为中心的染色质相互作用。(Figure 1B-D) 为来自3种不同细胞类型的染色质接触细节:B (GM12878)、髓系白血病(K562)和角质形成细胞(NHEK)Figure 1B显示了一个基因的细胞特异性染色质结构,该基因在K562细胞中表达最高,并由正交数据类型(HiC)支持。1D提供了染色质结构的复杂性,即使对于基因位点来说也是如此。最后,1F提供了一个以启动子为中心的观点,即单个基因启动子可能存在顺式调控结构,支持了基因调控控制通常很复杂的观点。

总结

DNA Rchitect作为少数具有可视化染色质相互关系功能的工具,比UCSC基因组浏览器、WashU表观基因组和综合基因组浏览器(IGV)这些公共浏览器在探究基因表达和表观遗传模式方面更具优势。DNA Rchitect工具为用户提供了一种工具,可以通过网络分析组件交互式地探索基于3c的技术,这些组件还为ATAC-seqChIP-seq等数据提供了额外的可视化功能。

DNA Rchitect有一个交互式绘图界面,允许用户通过基因名称或特定的基因组坐标浏览和可视化他们的数据DNA Rchitect的网络版以样本数据为例。对于HiC数据集,用户必须在上传的文件中为每个样本指定数量、样本标识和颜色的选择,以便呈现弧形图(bezier曲线)DNA Rchitect的网络分析组件包括交互式查看整个基因组网络以及网络中心图、度分布图、社区检测图和节点度图的能力。用“Genomic Network”选项卡可选择或移动节点和边。DNA Rchitect不能预知HiC的特征,包括距离衰减或分隔。作者建议用户根据可能会影响网络分析的特征来过滤或调整HiC接触模式。所有通过web应用程序生成的图表都可以从web浏览器下载PDFSVGPNGHTMLXGMML文件。此外,XGMML下载还可以作为桥梁,实现当前基于网络的程序(Cytoscape)中支持的其他网络功能。为了简化用户与DNA Rchitect的交互,除了“Interactive tutorial”提供了使用DNA Rchitect的逐步指导外,“Help”选项卡还可以作为上传数据之前的有用参考。

DNA Rchitect工具的优势:

  1.  免费,web应用程序,也可下载APP

  2.  人性化设计,可浏览prefiltered bedbedgraphbedpe数据集;

  3. 接受逗号、分号、tab分隔符、csvbg文件格式;

  4.  对于高置信度接触的可视化方面(预过滤或重复之间的可复制性)和几个染色质构象捕获为基础的检测方法之间的更小范围的相互作用(10-20kb分辨率)最有用;

  5.  生成的图表可下载PDFSVGPNGHTMLXGMML文件,其中XGMML文件还可以作为桥梁,实现当前基于网络的程序(Cytoscape)中支持的其他网络功能。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多