小丫要开ATAC-seq分析的培训班了?pipeline都有人写好了,还要什么培训班! 两个月前发表于Bioinformatics,esATAC,是个R包。 Wei Z, Zhang W, Fang H, Li Y, Wang X (2018). “esATAC: an easy-to-use systematic pipeline for ATAC-seq data analysis.” Bioinformatics. doi: 10.1093/bioinformatics/bty141. 出自清华汪小我Lab。哦!对了!DEseq的两个通讯,他是其中之一,另一位是张学工。 你需要做哪些准备?
并非只能分析人和小鼠,其他物种自己稍微设置一下就好了Customized Pipeline。 接下来就都交给esATAC了。 用这个pipeline能跑出哪些结果呢? 1. QC质控 《什么样的ATAC-seq是成功的?第一期:ENCODE的ATAC-seq质量把关标准》一文中提到的非冗余非线粒体能够回帖的fragment、回帖率、NRF、PBC1、PBC2、peak数、无核小体区NFR、TSS富集、FRiP等质控指标这里都有。没找IDR peak,也就没计算IDR重复的一致性。 另外,它还计算了跟DHS重叠的比例(CistromeDB也把它作为重要指标),最基本的FastQC、adaptor去除情况它也做了。 2. 基本分析 对比了case和control的peak分布,饼图实在是不好看,可参考这种《CS6: ChIPseeker的可视化方法》 peak重叠情况 peak附近基因的GO富集分析,借用了clusterProfiler《最靠谱的富集分析,超炫的展示方式》,为啥选它,看这篇《富集分析,俩人做的结果差5岁 | 你用的注释文件有多老?》 3. motif分析 |
|