该研究开发了一个全面的人类染色质可开放性数据库(ATACdb),对深入理解表观基因组机制、在可开放染色质区域发现更多的生物功能提供极大的帮助。该数据库可访问地址:http://www./ATACdb/ 当前版本的ATACdb从1400多个染色质可访问性ATAC-seq样本中总共记录了52,078,883个区域。这些样本是从与NCBI GEO/SRA数据库的ATAC-seq数据相关的2200多个染色质可访问性样本中手动策划的。ATACdb提供了一个质量保证流程,包括四个质量控制(QC)指标。此外,ATACdb在染色质可及性区域提供其他详细的(epi)遗传注释信息,包括超级增强剂、典型增强剂、TF、常见SNP、风险SNP、eQTL、LD SNP、DNA甲基化位点、3D染色质相互作用和TAD。ATACdb提供了对染色质可访问区域内TF足迹的准确推断。 据介绍,ATACdb是一个强大的平台,提供最全面的可访问的染色质数据、QC、转录因子足迹和各种其他注释。当前版本的ATACdb具有来自NCBI GEO/SRA数据库的1400多个ATAC-seq样本的52,078,883个区域。 Data-Browse在Data-Browse(数据浏览)模块,可以根据样品的类型(组织、干细胞、细胞系、诱导多能干细胞系、原代细胞等)、组织类型(脂肪、动脉、血液、骨等)、肿瘤类型和生物样品名称(细胞/组织/细胞系名称、治疗条件、处理时间)对数据进行筛选,并对筛选的结果进行保存。 点击感兴趣的样本,可以看到样本的基本信息,比如样本的组织类型、可及性区域数目等,还有可及性片段在染色体上的分布图和质控结果。以及样本可及性区域上的包含信息概况。 点击区域的Region ID可以看到具体的信息。 ATACdb对TF footprints的数据进行了汇总和统计 对鉴定到的peak进行了注释:A是注释到的基因组特征,B是peak结合到转录起始位点(TSS)区域的情况 Search在Search模块里,可以根据转录因子、目标基因、基因组位置、组织分类4种检索模式来进行检索。 以转录因子SP1为例进行搜索🔍:可以看到SP1在不同组织中的分布情况、不同样本中的结合情况、结合到的染色质区域、相关的疾病以及不同数据库的表达情况。 Analysis①分析两个不同组织来源的细胞测序结果比对寻找两者的差异或者重叠的区域。 ②寻找两个转录因子结合的重叠区域。 Genome-Browser选择样本 染色体区域,进一步查看染色质可及性数据(参考基因组是hg19) Download |
|
来自: 昵称32772025 > 《待分类》