奶茶是谁,刘若英!(恭喜你答对了,再来一个),糯米是谁,杨幂家小千金!(恭喜又答对了),仔仔是谁?周渝民!(真棒),小四尼?郭敬明!黑人尼?黑人,次噢不对,陈建德!……人类这是有多么爱给人取外号,这种癖好也影响了SNP命名,就是明明是同一个东西,但是经常穿着不同的马甲到处晃荡,让人忍不住呕吐。 我第一次看见下面这些时也是一头雾水,这TM都是什么东西。
更苦逼的是,我刚刚认识他们后,有会在文献里看见诸如这样的: RS1800947,于是我又认识了RS开头的表示方法,我有点开始讨厌科研了。然后这还没有结束,我又看见这货了:NG_000004.3,我的头发开始冒烟了。但是,还没有结束,我又看见CYP3A5*3……能不能放一把大火把他们都烧掉! SNP的命名是很混乱的,大家做好心理准备。不同的组织机构命名不一样,并且各自为政,坚持自己的命名方法。 1、GenBank官方的refSNP ID单核苷酸多态性命名法 GenBank官方的refSNP ID单核苷酸多态性命名法是相对比较完善的命名体系,命名方法是rs+7位阿拉伯数字。如果已知一个SNP的refSNP ID,那么就可以在GenBank的SNP数据库中搜索到相关的信息和在基因组中的位置了。譬如我搜索rs776746,你会发现CYP3A5和RS776746是一个东西。 2、突变信息之间加上位置信息: 又分为三种方式: 突变信息之间+cDNA的位置,如C188T; 突变信息之间加上DNA的位置,如A2546G; 突变氨基酸信息之间加上氨基酸位置,如Glu145Lys. 3、惯用名或频率顺序拟定的惯用名称: 在文献中出现的等位基因常见的标注方式,大家最熟悉的如CYP2D6*10、CYP2C9*3等,还有一些前面加个m,表示突变,如CYP2C19m2等,还有一些也可以在文献中看到,如CYP2E1的C1>C2突变等等,总之形式百花齐放,百家争鸣,让人头晕。其实这就是一种非常不正规的用HGVS Names标注SNP位置的方法,很明显,由于缺少引用核酸序列的接受号,因此读者无法从这样的表示在GenBank中查到对应的信息。这是个历史遗留问题,责任也不能全怪原文的作者标注不明。 4、HGVS命名法: HGVS是Human Genome VariationSociety(人类基因组变异协会)的简称,是一个非政府的民间学术组织,其官方网站的网址:http://www./。HGVS命名SNP法的规则是标出引用的核酸序列号(Reference Sequence,RefSeq)和SNP在该核酸序列中的位置,例如:NG_000004.3:g.247167G>A,其中红色的部分是核酸序列接受号,绿色的部分是该单核苷酸多态性位点在该核酸序列中的位置,G>A表示原始碱基是G,突变碱基是A。这样的命名方法有利于找出所在基因序列中的位置。 那么问题来了,很多临床狗只是想把临床样本拿去测一下是不是有突变,先设计引物哇,然后拿去测序喽,临床狗表示幸福来得太突然,还是完全不知道要从哪里下嘴,肿么办?俺肿么才能把这段测出来,这时候问公司喽(你要合成引物当然要找公司,你又会问了,我不要自己设计引物么?但是我基本知道临床狗是不太懂如何设计引物的,所以还是让公司设计吧),把SNP的名字给他们,有RS命名和HGVS命名法的最好,没有的话就不管他是啥名,给他们时候记得给几篇文献。辣么问题又来了,你为什么不早说,要我们看这么一大段的屁话,好吧,我错了!我只是想说这些SNP经常穿着马甲到处跑,譬如GJB2c.269T>C 和 L90P是一个东西。 |
|