分享

SNP你到底叫啥名?

 丽丽661 2020-11-15

我叫林平之,是莫愁师姐的师弟。我最近遇到的问题是……CYP2D6*10这个是什么鬼。虽然我知道是一个SNP位点,但有的文献里讲CYP2D6*10这个位点是100C>T,也有的说是C188T,还有g.4300C>T,还有说是P34S的,名字我都已经搞陀不清了,更别说找什么序列了。师姐救命!

莫愁:SNP的命名是这样的,大家都在叫着他们不同的名字,现在对SNP的明明方法,大概有6种左右。CYP2D6这种就属于比较复杂的版本,也比较典型,我们来看看都是啥:

首先CYP2D6*10,这是习惯性的一种命名方法,是CYP2D6的几种常见的SNP的习惯命名。

g.4300C>T,代表的是CYP2D6这个基因在NCBI中Genomic DNA的序列NG_012879.1中,的第4300位C>T的SNP位点,这个g.就是genomic的缩写。

100C>T其实和C188T是一样的cDNA中的位置,C188T代表了是在整条cDNA上从头起第188位的位置。100C>T则是去除了5’UTR,从ATG开始数起的第100位的位置,这个一般也会表示为c.100C>T。这里的c.就是指condon。一般来说都会用密码子也就是ATG起始作为SNP的命名,所以大家如果不明白的话,去数数看ATG起始的位置,说不定就也能找到SNP位点。但也有些文献里,会很草率地选用cDNA起始来表示SNP位点的位置,也很容易混用,造成大家搞不清陀。

P34S或者p.Pro34Ser,这个很好理解,就是蛋白序列上第34个氨基酸的变化。但有很多内含子的SNP或者lncRNA的SNP不会有这样的表示方法。

这些明明方法,一般都仅仅是对这个SNP在序列上的描述,真正需要知道的SNP的编号应该是rs号,也就是RefSNP号。通过rs号,才能在NCBI的dbSNP中正确找到这个SNP位点。

小林子:那师姐,我就只知道这些七七八八的杂牌命名的话,也不知道都是啥,我该怎么查SNP位点的序列呢?

莫愁:简单啊,要么去文献里查,比如你有一个杂牌命名或者习惯性命名,那就去PubMed里搜这个“杂牌命名 rs”,看看有没有这个基因的这个SNP的rs号。


或者到SNPedia上(http://www./index.php/SNPedia),这个网页可以直接搜寻常见的SNP位点。

比如我们搜一下CYP2D6,然后就可以看到CYP2D6*10的rs号了。


点进去之后,就可以在右侧,点击进入到其他相关的SNP数据库了。

使用rs号在NCBI的dbSNP(http://www.ncbi.nlm./SNP/)上,即可查询到基因的SNP位点的具体序列信息了。

…华丽丽的分割线…

李莫愁博士:后台一直吵吵嚷嚷的,说什么我们只会抖机灵、卖萌,说的我和右叔也不知道写些什么好了。我们也快写了两年了,相信已经有一批菜鸟,跟随我们的脚步,逐渐成长成了老鸟。也希望我们能写出来不要特别死板的东西,起码让学渣、甚至学酥也都能看得懂,不管怎么样,我们也会尽自己的努力写下去。SNP的命名是非常乱的,有很多文献也都写的很随意,草率得就好像大家就应该知道这是啥一样。要学会自己查询SNP的序列的话,就必须先搜索到rs号,这样我们才能从dbSNP中找到具体的序列。好了,今天就策到这里吧先。

万事屋出售的课程及服务(点击下方飘黄部分即可查看)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多