浅谈Deeptools—生信之深海利器https://www./figure/Examples-of-images-created-with-deepTools-A-Overview-of-the-deepTools-workflow-that_fig2_262076117 2. 历年高分文章中的Deeptools美图: Embryonic transcription is controlled by maternally defined chromatin state Two independent modes of chromatin organization revealed by cohesin removal The pioneer factor OCT4 requires the chromatin remodeller BRG1 to support gene regulatory element function in mouse embryonic stem cells computeGCBias 用Benjamini’s 的方法计算GC-bias 并进行可视化展示,如下图所示: 知道了DeepTools的满腹才华,如何才能发挥DeepTools的作用呢?在此,小编想要细致的介绍两个模块的使用,以来给大家举个”栗子”: · Correlation between BAM files (计算bam文件相关性) · multiBamSummary · 原理: · 将基因组划bin,通过bam文件计算每个bin reads的覆盖度(Coverage) · 用法: · multiBamSummary bins --bamfiles H3K9me3.sort.bam H3k27me3.sort.bam H3K4me3.sort.bam H3K4me1.sort.bam input.sort.bam --minMappingQuality 30 --region 1 --labels H3K9me3 H3k27me3 H3K4me3 H3K4me1 input -out readCounts.npz --outRawCounts readCounts.tab · 参数讲解: · bins 代表按照bin 划分基因组,默认10k为一个窗口 · --bamfiles 一系列已经sort过的bam文件 · --minMappingQuality 比对质量阈值 · --region 基因组的区域默认none 可以写成 1,chr1,chr1:456700:891000的形式 · --labels 标签 · -out 输出bin的readscount 矩阵,(npz 为numpy 存储的文件) · --outRawCounts 同上,为tab分割的文本文件 · plotCorrelation · 原理: · 针对multiBamSummary 产生的矩阵,利用pearson 或者spearman 计算样本间的相关性 · 用法: · plotCorrelation -in readCounts.npz –corMethod spearman --skipZeros --plotTitle 'Spearman Correlation of Read Counts' --whatToPlot heatmap --colorMap PuRd –plotNumbers -o heatmap_SpearmanCorr_readCounts.png --outFileCorMatrix SpearmanCorr_readCounts.tab · 参数讲解: · -in 输入 ,文件为 multiBamSummary 产生的矩阵 · --corMethod 相关性分析的方法:pearson 或者spearman · --colorMap 选取色系 · -o 图像输出路径: · 结果展示 此图非常直观的展示了各个组蛋白之间的相关性 · 计算TSS 区域内的富集程度 · computeMatrix · 对基因区域以及上下游划bin,计算每个bin内Chip的信号强度 · 用法: · computeMatrix scale-regions -S G_K4me3_1.bw G_K27ac_1.bw G_K4ME1_1.bw G_K27me3 D_K4me3_1.bw D_K27ac_1.bw D_K4ME1_1.bw D_K27me3 -R up.Gene.bed down.Gene.bed –beforeRegionStartLength 5000 --regionBodyLength 5000 –afterRegionStartLength 5000 --skipZeros -o matrix.mat.gz · 参数讲解: · -S score file bigwig文件 · -R 参考基因组 bed文件,如果有多个bed的文件 以空格分开 · --beforeRegionStartLength 基因上游长度 · --regionBodyLength 基因body · --afterRegionStartLength 基因下游长度 · plotHeatmap · 基因的ChIP的信号强度按照基因上下游所有bin的信号强度的均值进行排序并通过热图进行展示 · 用法: · plotHeatmap -m matrix.mat.gz -out compare_heatmap.png · 参数讲解: · -m computeMatrix 步骤所产生的矩阵 · -o 输出文件 · 结果展示: |
|