在氨基酸密码子及逆密码子表一贴中,我们以及提到密码子表中总计有64种,但实际最终对应翻译的目的氨基酸种类只有20种,这就意味着,存在某些多个密码子编码同一种氨基酸的现象,也称做密码子的简并性。正是由于该特性,每个氨基酸至少对应1种密码子,最多可以有一种氨基酸对应6种密码子。但这些编码相同氨基酸的不同密码子,在不同物种、不同生物体中使用的频率并非完全地平均分布,也即绝大多数生物倾向于只利用这些密码子中的一部分,该现象也称密码子的偏好性。其中那些被最频繁利用的密码子称为最佳密码子(optimal codons),而那些不被经常利用的密码子称为稀有或利用率低的密码子(rare or low-usage codons)。
不论是真核生物还是原核生物,每种生物都会表现出某种程度的密码子利用的差异或偏爱。这些偏好性的产生可能与两个原因有关:一是避免使用类似终止密码子的密码子;二是这些偏好能够有效地翻译密码子,因为这些密码子对应于生物体中非常丰富的tRNA。无论导致这种偏好的原因到底是什么,不同生物的密码子使用偏性的差异可以非常大。因此,我们在做蛋白表达或生产时,就需要考虑到密码子偏好性的问题。利用偏爱密码子(preferred codons),并避免利用率低的或稀有的密码子,从而实现对目的表达基因的重新设计也称为密码子最佳化。下表总结了源自http://www.kazusa./codon/的最常使用的表达系统,包括人类、小鼠、家蚕、酵母在内的真核表达宿主以及原核表达宿主大肠杆菌中的密码子应用的偏好性。此外,在附件中,我们挑选了一篇针对毕赤酵母(Pichia pastoris)进行密码子优化的科研论文。
密码子偏好性表
|
| 第二位碱基 |
|
| U | C | A | G | 人类 | 第一位碱基
| UUU (17.6) | UCU (15.2) | UAU (12.2) | UGU (10.6) | UUC (20.3) | UCC (17.7) | UAC (15.3) | UGC (12.6) | UUA (7.7) | UCA (12.2) | UAA (1.0) | UGA (1.6) | UUG (12.9) | UCG (4.4) | UAG (0.8) | UGG (13.2) |
|
|
|
|
| 第一位碱基 | CUU (13.2) | CCU (17.5) | CAU (10.9) | CGU (4.5) | CUC (19.6) | CCC (19.8) | CAC (15.1) | CGC (10.4) | CUA (7.2) | CCA (16.9) | CAA (12.3) | CGA (6.2) | CUG (39.6) | CCG (6.9) | CAG (34.2) | CGG (11.4) |
|
|
|
|
| 第一位碱基 | AUU (16.0) | ACU (13.1) | AAU (17.0) | AGU (12.1) | AUC (20.8) | ACC (18.9) | AAC (19.1) | AGC (19.5) | AUA (7.5) | ACA (15.1) | AAA (24.4) | AGA (12.2) | AUG (22.0) | ACG (6.1) | AAG (31.9) | AGG (12.0) |
|
|
|
|
| 第一位碱基 | GUU (11.0) | GCU (18.4) | GAU (21.8) | GGU (10.8) | GUC (14.5) | GCC (27.7) | GAC (25.1) | GGC (22.2) | GUA (7.1) | GCA (15.8) | GAA (29.0) | GGA (16.5) | GUG (28.1) | GCG (7.4) | GAG (39.6) | GGG (16.5) | 小鼠 | 第一位碱基
| UUU (17.2) | UCU (16.2) | UAU (12.2) | UGU (11.4) | UUC (21.8) | UCC (18.1) | UAC (16.1) | UGC (12.3) | UUA (6.7) | UCA (11.8) | UAA (1.0) | UGA (1.6) | UUG (13.4) | UCG (4.2) | UAG (0.8) | UGG (12.5) |
|
|
|
|
| 第一位碱基 | CUU (13.4) | CCU (18.4) | CAU (10.6) | CGU (4.7) | CUC (20.2) | CCC (18.2) | CAC (15.3) | CGC (9.4) | CUA (8.1) | CCA (17.3) | CAA (12.0) | CGA (6.6) | CUG (39.5) | CCG (6.2) | CAG (34.1) | CGG (10.2) |
|
|
|
|
| 第一位碱基 | AUU (15.4) | ACU (13.7) | AAU (15.6) | AGU (12.7) | AUC (22.5) | ACC (19.0) | AAC (20.3) | AGC (19.7) | AUA (7.4) | ACA (16.0) | AAA (21.9) | AGA (12.1) | AUG (22.8) | ACG (5.6) | AAG (33.6) | AGG (12.2) |
|
|
|
|
| 第一位碱基 | GUU (10.7) | GCU (20.0) | GAU (21.0) | GGU (11.4) | GUC (15.4) | GCC (26.0) | GAC (26.0) | GGC (21.2) | GUA (7.4) | GCA (15.8) | GAA (27.0) | GGA (16.8) | GUG (28.4) | GCG (6.4) | GAG (39.4) | GGG (15.2) | 家蚕 | 第一位碱基
| UUU (15.3) | UCU (12.7) | UAU (13.9) | UGU (8.7) | UUC (24.0) | UCC (12.0) | UAC (22.0) | UGC (11.3) | UUA (13.1) | UCA (13.0) | UAA (1.4) | UGA (0.6) | UUG (15.8) | UCG (11.0) | UAG (0.6) | UGG (11.7) |
|
|
|
|
| 第一位碱基 | CUU (11.5) | CCU (14.0) | CAU (10.3) | CGU (9.8) | CUC (14.6) | CCC (11.7) | CAC (13.8) | CGC (10.5) | CUA (8.8) | CCA (13.6) | CAA (18.7) | CGA (7.0) | CUG (18.4) | CCG (13.0) | CAG (17.4) | CGG (5.4) |
|
|
|
|
| 第一位碱基 | AUU (18.6) | ACU (15.6) | AAU (20.5) | AGU (10.3) | AUC (20.7) | ACC (14.2) | AAC (24.9) | AGC (12.5) | AUA (15.9) | ACA (15.9) | AAA (34.0) | AGA (14.1) | AUG (23.4) | ACG (11.9) | AAG (28.4) | AGG (8.9) |
|
|
|
|
| 第一位碱基 | GUU (16.8) | GCU (25.3) | GAU (25.6) | GGU (21.7) | GUC (16.7) | GCC (19.7) | GAC (28.8) | GGC (18.8) | GUA (12.4) | GCA (14.6) | GAA (36.0) | GGA (21.4) | GUG (19.4) | GCG (13.5) | GAG (26.2) | GGG (7.7) | 酵母 | 第一位碱基
| UUU (26.1) | UCU (23.5) | UAU (18.8) | UGU (8.1) | UUC (18.4) | UCC (14.2) | UAC (14.8) | UGC (4.8) | UUA (26.2) | UCA (18.7) | UAA (1.1) | UGA (0.7) | UUG (27.2) | UCG (8.6) | UAG (0.5) | UGG (10.4) |
|
|
|
|
| 第一位碱基 | CUU (12.3) | CCU (13.5) | CAU (13.6) | CGU (6.4) | CUC (5.4) | CCC (6.8) | CAC (7.8) | CGC (2.6) | CUA (13.4) | CCA (18.3) | CAA (27.3) | CGA (3.0) | CUG (10.5) | CCG (5.3) | CAG (12.1) | CGG (1.7) |
|
|
|
|
| 第一位碱基 | AUU (30.1) | ACU (20.3) | AAU (35.7) | AGU (14.2) | AUC (17.2) | ACC (12.7) | AAC (24.8) | AGC (9.8) | AUA (17.8) | ACA (17.8) | AAA (41.9) | AGA (21.3) | AUG (20.9) | ACG (8.0) | AAG (30.8) | AGG (9.2) |
|
|
|
|
| 第一位碱基 | GUU (22.1) | GCU (21.2) | GAU (37.6) | GGU (23.9) | GUC (11.8) | GCC (12.6) | GAC (20.2) | GGC (9.8) | GUA (11.8) | GCA (16.2) | GAA (45.6) | GGA (10.9) | GUG (10.8) | GCG (6.2) | GAG (19.2) | GGG (6.0) | 大肠杆菌 | 第一位碱基
| UUU (24.4) | UCU (13.1) | UAU (21.6) | UGU (5.9) | UUC (13.9) | UCC (9.7) | UAC (11.7) | UGC (5.5) | UUA (17.4) | UCA (13.1) | UAA (2.0) | UGA (1.1) | UUG (12.9) | UCG (8.2) | UAG (0.3) | UGG (13.4) |
|
|
|
|
| 第一位碱基 | CUU (14.5) | CCU (9.5) | CAU (12.4) | CGU (15.9) | CUC (9.5) | CCC (6.2) | CAC (7.3) | CGC (14.0) | CUA (5.6) | CCA (9.1) | CAA (14.4) | CGA (4.8) | CUG (37.4) | CCG (14.5) | CAG (26.7) | CGG (7.9) |
|
|
|
|
| 第一位碱基 | AUU (29.6) | ACU (13.1) | AAU (29.3) | AGU (13.2) | AUC (19.4) | ACC (18.9) | AAC (20.3) | AGC (14.3) | AUA (13.3) | ACA (15.1) | AAA (37.2) | AGA (7.1) | AUG (23.7) | ACG (13.6) | AAG (15.3) | AGG (4.0) |
|
|
|
|
| 第一位碱基 | GUU (21.6) | GCU (18.9) | GAU (33.7) | GGU (23.7) | GUC (13.1) | GCC (21.6) | GAC (17.9) | GGC (20.6) | GUA (13.1) | GCA (23.0) | GAA (35.1) | GGA (13.6) | GUG (19.9) | GCG (21.1) | GAG (19.4) | GGG (12.3) |
|