GI?number及Accession.Version就像是序列的身份证号码一样。通过这个号码,我们能在NCBI/DDBJ/EMBL等数据库查到该序列的数据。
问题: 回答: 两种类型的序列标识符(GI number、Accession.Version),有着不同的格式,并且开始使用的时间也不同。 1,GI?number(有时用小写字母"gi"),由一系列的数字组成,是NCBI在处理序列时连续分配的。跟序列的Accession number是没有关联。
2,Version区,通常我们都可以看到是Accession.Version,如NM_008261.1
GI?number作为序列的唯一标识符已经在GenBank使用多年,其它相关的数据库仍然保留这个号码。1999,随着国际核酸序列数据库同盟(NCBI/DDBJ/EMBL,International Nucleotide Sequence Database Collaboration)的成立,Version系统也开始启用。 这两种不同系统的标识符是平行运行的,即当序列的数据改变或升级时,将会分配一个新的GI?number,Accession number后的版本也会随着增加。如NM_008261.1-->NM_008261.2(GI?number:6680238-->46575915)。 大概的历史是这样子的,一开始在GenBank及相关的数据库中使用的是GI?number,GI是"GenInfo Identifier" 的缩写。后来国际核酸序列数据库同盟成立后,考虑到GI?number不适合作为国际性的通用序列标识符,所以就弄了一个新的词叫NID,代表核酸序列,PID代表氨基酸序列。但到了1999年12月,这个叫法就中断了,全部统一改为用"GI"表示。 |
|
来自: zhuqiaoxiaoxue > 《生物信息学》