简介 Genome Aggregation Database(简称gnomeAD)是由各国研究人员共同协作建立的一个基因组突变频率数据库,该数据库的目的是汇集和协调不同级别的大规模测序项目,包括全外显子与全基因组数据,为广泛的科学研究community汇总数据。 目前该数据库包括123136个全外显子数据与15496个全基因组数据,这些数据来源于各自不同的疾病研究项目与大型人口种群测序项目。该数据库包括之前常用的千人基因组数据、ESP数据库及绝大部分的ExAC数据库,数据库的网址为http://gnomad./,从网址上可以看出该项目获得了大名鼎鼎的Broad研究所的支持。 数据库 第一版的数据库发布在2016年10月份,2017年2月27日刚发布了第二版,可以在线查询。 对于生信的小伙伴们肯定还是希望下载至本地,整合进pipeline。虽然早在几周前,游侠就在朋友圈看到了数据库公开的消息,但是看看文件大小,心里就有点怂了,几天也不一定能下载完。 今天查看了annovar网站,王凯大神在2017年3月11日已经更新了该数据库,真是太贴心了!就是不知道是不是最新的第二版。搞生信的朋友们可以下手下载了。游侠暂时还不知道文件大小。 最后 根据该网站描述gnomeAD去除了携带有严重儿童疾病的患者及其父母的基因组数据,所以对于单基因遗传病来说,这是很好的人群突变频率查询数据库,而这对于评估罕见位点的致病性非常关键,如果某位点在该数据库中未见报导,则致病可能性增大,如果某位点在该数据库中存在纯合状态,则该位点很可能是benign位点。 |
|