分享

想学ATAC-seq分析,错过本篇就错过了一个亿

 微笑如酒 2018-05-12

小丫要开ATAC-seq分析的培训班了?pipeline都有人写好了,还要什么培训班!


两个月前发表于Bioinformatics,esATAC,是个R包。

Wei Z, Zhang W, Fang H, Li Y, Wang X (2018). “esATAC: an easy-to-use systematic pipeline for ATAC-seq data analysis.” Bioinformatics. doi: 10.1093/bioinformatics/bty141.


出自清华汪小我Lab。哦!对了!DEseq的两个通讯,他是其中之一,另一位是张学工。



你需要做哪些准备?

  1. 安装R,安装这个esATAC包,可能还要买台好电脑或云端服务器。

  2. 准备ATAC-seq的原始fastq文件

  3. 告诉它你做的是哪个物种,用哪个基因组版本

并非只能分析人和小鼠,其他物种自己稍微设置一下就好了Customized Pipeline。


接下来就都交给esATAC了。


用这个pipeline能跑出哪些结果呢?

1. QC质控

什么样的ATAC-seq是成功的?第一期:ENCODE的ATAC-seq质量把关标准》一文中提到的非冗余非线粒体能够回帖的fragment、回帖率、NRF、PBC1、PBC2、peak数、无核小体区NFR、TSS富集、FRiP等质控指标这里都有。没找IDR peak,也就没计算IDR重复的一致性。

另外,它还计算了跟DHS重叠的比例(CistromeDB也把它作为重要指标),最基本的FastQC、adaptor去除情况它也做了。


2. 基本分析

对比了case和control的peak分布,饼图实在是不好看,可参考这种《CS6: ChIPseeker的可视化方法


peak重叠情况


peak附近基因的GO富集分析,借用了clusterProfiler《最靠谱的富集分析,超炫的展示方式》,为啥选它,看这篇《富集分析,俩人做的结果差5岁 | 你用的注释文件有多老?


3. motif分析

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多