dbSNP是NCBI中专门用于存储物种SNP位点信息的数据库,网址如下
dbsnp有很多的版本,目前最新版本为151。在该数据库中,需要理解以下两种ID
对于每一个提交到dbSNP数据库的SNP位点, 首先会赋予一个唯一的ss ID。 由于不同研究结构提交的SNP会存在冗余,提取SNP位点上下游区域的序列,比对参考基因组,如果多个ss ID 比对上相同的位置,说明这几个SNP位点是冗余的,会赋予一个新的reference SNP ID, 以 对于每个
首先会给出一个综合信息, 剩余的信息分成了多个模块,每个模块对应不同的内容。看几个主要的模块的信息 1. Map这部分给出了SNP位点在不同版本的基因组上的位置信息,可以看到,对于hg19和hg38两个不同版本,位置差别还是挺大的。 2. fasta这部分给出SNP位点的序列 3. ss ID这部分可以看到 4. GeneView这部分会给出SNP对应的染色体和基因信息,还有对转录本和蛋白质的影响。 们经常会使用dbsnp数据库中的VCF文件,以human 为例,下载地址为
提供了common和All 两种,All包含所有的SNP位点,common只包含了MAF大于0.01的生殖细胞变异位点,通常下载 |
|