系列目录本次分享的文献发表了一个网页数据库,把其它数据库(GEO, ArrayExpress, DDBJ, ENCODE等等)的表观数据(主要是ChIP-seq and DNase-seq)整合,主要是6个模式生物的数据,包括(human, mouse, rat, fruit fly, nematode, and budding yeast), 最后形成了:ChIP-Atlas (http://) 数据量可以看到,人类和小鼠的研究是最多的,也符合常识,主要是公共数据库整合,包括:
整合公共数据库的流程可以看到,作者把全部的数据fastq下载到了本地,然后走了自己的流程(Bowtie2+MACS2)进行比对和找peaks,所以保存了全部的bam文件和bw文件供IGV可视化,同时使用的peaks坐标文件进行整合导入数据库。 这样使用他们网页工具的用户有4种策略对他们整合好的数据进行探索:
和其它类似数据库比较ChIP-Atlas (http://) 的确不是全网第一个做ChIP-seq and DNase-seq数据整合的网页工具,虽然是2018年11月才正式发表,但是也陆陆续续开发了好几年,这些年不少同类型数据库网页工具被其它课题组发表,其中比较出名能被拿出来比较的有下面4个: 简单来说,提供bam或者bw文件可视化的只有Cistrome DB和自己的ChIP-Atlas(因为他们两家是自己走ChIP-seq流程,从fastq数据开始处理),其它优缺点功能对比见表格: 4大功能之浏览peaks网页工具选项蛮多,主要是物种,IP的种类,细胞系类型需要用户选择,如下: 这样就可以下载作者处理好的7万多个的ChIP-seq and DNase-seq数据任意符合条件的peaks的bed文件,或者直接调用本地IGV进行可视化。接着输入我们要查询的基因或者坐标,搜索即可。 下面是作者文章里面的截图,由于网速原因,我并没有重复出来。 4大功能之查询指定基因的靶点这一个查询步骤会比较耗时,http://dbarchive./kyushu-u/hg19/target/TP53.1.html 对比较出名的基因来说,ChIP-seq and DNase-seq数据非常多,个人觉得本功能用处不大。 4大功能之共定位同样是输入一个基因,这个时候并不会输出全部可能的靶点,而是检索其可能的共定位基因,如下: http://dbarchive./kyushu-u/hg19/colo/AGO1.Breast.html 4大功能之富集分析这个时候并不是选择物种,IP的种类,细胞系类型来下载BED的peaks文件,也不是输入基因,而是输入peaks信息:
后记到最后也没有看到我想要的功能,其实我想看的是我感兴趣的基因是否在某些转录因子或者组蛋白的ChIP-seq and DNase-seq数据表现为被结合的靶点。
|
|