分享

干货| DNA元件注释学起来|ChromHMM

 生物_医药_科研 2019-04-02

各位小主,中秋节快乐~~

什么是假期正确的打开方式?

是这样↓ ?

不不不! 是这样↓

学习充电才是——

假期的正经用法

我们在读文献的时候,经常会看到很高大上的图,比如基于模型来系统地注释一种或多种细胞类型基因组的图,大家是不是很想学习怎么画这种图,来为自己的文章锦上添花呢?

今天,小编就给大家介绍一个超牛的软件-ChromHMM

ChromHMM介绍

ChromHMM是用于学习和表征染色质状态的软件,其可以整合多个染色质数据集,例如各种组蛋白修饰的ChIP-seq数据。 ChromHMM基于多变量隐马尔可夫模型,明确地模拟每个染色质marker的存在或不存在,然后用所得到的模型系统地注释一种或多种细胞的基因组。 ChromHMM还可以生成注释染色质状态的全基因组图谱文件,可以在基因组浏览器中直接显示。

1
安装ChromHMM

Windows系统

下载压缩包:http://compbio./ChromHMM/ChromHMM.zip

解压;

进入DOS;

进入ChromHMM文件夹目录即可使用;

linux系统

wget http://compbio./ChromHMM/ChromHMM.zip

unzip ./ChromHMM.zip

cd ./ChromHMM

2
所需数据

下载需要的数据(bam或bed格式)

可以从ENCODE或者Roadmap上下载,DNA甲基化、CHIP-seq数据都可以。

数据转化

(bam/bed data转化为binarized data)

代码:

Java -mx1600M -jar ChromHMM.jar Binarizebed CHROMSIZES\hg18.txt INPUTBEDFILES cellmarkfile.txt SAMPLEDATA_HG18

java -mx1600M -jar ChromHMM.

解读:

jar:固定,所以命令必须以这个开头

Binarizebed:ChromHMM command将bed data转化为binarized data,若是bam data则应使用Binarizebam

CHROMSIZES\hg18.txt:./ChromHMM/CHROMSIZES下存放了hg18.txt,hg19.txt,hg38.txt,这些txt里存放的是assmble的染色体长度

INPUTBEDFILES :directory of bed files

cellmarkfile.txt:手动创建的一个文件

每行包括以下信息: cell type (for example K562), the name of the mark(for example H3k4me1), the filename of the .bed file for that mark and the optional input or control .bed.

It should look similar to this:

cell1 mark1 cell1_mark1.bed cell1_control.bed

cell1 mark2 cell1_mark2.bed cell1_control.bed

cell2 mark1 cell2_mark1.bed cell2_control.bed

cell2 mark2 cell2_mark2.bed cell2_control.bed

SAMPLEDATA_HG18:转换后的二进制数据所在的文件夹

3
执行命令
java -mx1600M -jar ChromHMM.jar LearnModel SAMPLEDATA_HG18 OUTPUTDATA 10 hg18

参数解读

LearnModel

takes a set of binarized data files, learns chromatin state models, and by default produces a segmentation,generates browser output with default settings, and calls OverlapEnrichment and NeighborhoodEnrichments with default settings for the specified genome assembly. A webpage is a created with links to all the files and images created.

OUTPUTDATA

存放输出结果的文件夹

10

10个chromatin state

hg18

genome assembly

4
可视化

Drag and drop the following .bed file created by the ChromHMM in the IGV main window

参考信息

说明文档见 http://compbio./ChromHMM/ChromHMM_manual.pdf,内有对command的详细解释,以及每个command的可选参数及意义,大家感兴趣的话可以研究研究。希望这篇干货能对大家有所帮助!

作者:我想想

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多