首先是一个常问的问题:翻译SNP的时候是否是野生型和突变。 经常得到的答案是不能用翻译为突变,许多人的建议是改变或者是变异 一般的共识是:序列变异(sequence variation)包括突变和多态(mutation+polymorphism) 突变muation: 常常用来指导致疾病的改变(disease-causing change) 多态polymorphism:经常用来指代变异频率大于1%,且常常被认为是非致病的改变(non-disease-causing change)
命名: 1:不同序列类型不同的前缀:命名分为基因组,cDNA,线粒体,RNA,蛋白序列上的变异,为避免混淆,添加前缀来区别: “g.” for a genomic sequence (e.g., g.76A>T) “c.” for a cDNA sequence (e.g., c.76A>T) “m.” for a mitochondrial sequence (e.g., m.76A>T) “r.” for an RNA sequence (e.g., r.76a>u) “p.” for a protein sequence (e.g., p.K76A)
2:SNP的命名(因为SNP常用的是DNA水平的,所以这里写的是DNA上序列单点变异的命名法,其他的请在需要时参考文献) 1)位置 第一位:以ATG(翻译起始密码子)的A为+1,外显子上依次类推+2,+3...(而上游5'端第一个为-1,余类推,没有0) 外显子的非编码区(UTR): 5’UTR为从ATG(起始密码子)的A往5'端走分别是-1,-2,-3... 3' UTR从翻译终止密码子开始3'端往下走分别是*1,*2,*3… 内含子区 如果在一个内含子的上游(靠近上一个外显子):以上一个外显子最后一个(3端)核酸为参照点(如为77位)则内含子上第一个核酸为77+1,第二个为77+2,余类推。如果该内含子的位置已知(例如是第一个内含子)也可以表示为IVS1+1G, IVS1+2T... 如果在一个内含子的下游(靠近下一个外显子):以下一个外显子第一个(5’端)核酸为参照点(如上面最后一个是77位,则现在第一个是78位),则外显子上游第一个核酸(即内含子最后一个)为+78-1A,+78-2G...。同理如果内含子已知则表示为(IVS1-1A,IVS1-2G)。
2)核酸改变的表示方法(如果是DNA上的话加前缀g.) SNP中常见的是单个核酸的替换(Substitutions)常用>表示 76A>G:表示第76位A变为G 88+1G>T(或者是IVS2+1G>T):表示第88位后的内含子区第一个核苷酸由G变成T(括号里表示88位后为内含子2,其第一位由G变成T,换句话说内含子2在88和89位间) 89-2A>C(或IVS2-2A):内含子2倒数第二位A变成C 加前缀g.76A>G
其他的还有缺失、插入、重复的表达方法,请参考文献。
3)做SNP时还常常需要表达蛋白水平的改变,简单描述: 基本上和DNA的表达类似,只是翻译的第一个氨基酸表示为+1,X表示为终止密码子。 代替(substitutions): 1:错义(missense):W26C 表示26位的色氨酸(Tryptophan,W )变为半胱氨酸(Cysteine,C)。 2无义(nonsense): W26X表示26位变为终止密码子(stop condon, X) 3:起始密码子(起始蛋氨酸)的改变:因为其实密码子的改变要么导致翻译起始部位移动要么导致蛋白不产生,所以表示为 p.?(unknown,未知),如果实验证实没有蛋白,那么表示为p.0 其他还有缺失、插入、重复,请参考文献。
|