1953年,Watson J和Crick F揭示了遗传物质DNA的结构,被誉为20世纪最伟大的发现;1961年 Nirenberg M和Matthaei H发现了遗传密码子。之后人们对遗传密码的起源问题进行了长达半个多世纪的探索,但均无法满意回答为何三联体密码子要编码氨基酸这样的根本问题。20世纪60年代中提出了两个最著名的学说——Woese C的立体化学假说和Crick F的凝固事件假说。对此,诺贝尔奖得主Monod J在其1971年出版的《Chance and Necessity》一书中诠释道,“…如果一个密码子被'选择’去代表某个氨基酸,那是因为两者之间存在某种化学亲和力”,或者“…密码子的结构在化学上是随意的:今天我们所知道的密码子是一个随机选择的结果,之后开始丰富起来”。1981年,Crick F在《Life Itself》一书中这样感叹道:“…遗传密码在生物学领域的重要性就如同门捷列夫的元素周期表在化学领域的重要性一样,但两者有重要的差异。周期表无论在哪里都是一样的,而遗产密码却表现得相当随意,或至少部分如此…如果这种随意性的表现是经久不衰的,我们只能说,地球上的生命源自一个非常原始的种群”。 说话说,千里姻缘一线牵,有时能把两个陌生的年轻人牵到一起的不仅仅是靠缘分,还需要一个对两者都熟悉的人的牵线搭桥,就是我们经常说的“媒人”。蛋白质和核酸如何演变成了互为因果的“鸡与蛋”关系?需不需要 “媒人”?如果YES,谁会是这个神秘的“红娘”呢? 遗传密码由Nirenberg和Matthaei于1961年破译以来,恰好过去了60周年,但其起源问题被认为是最大的谜团之一。对于一个细胞来说,在生化上发明通过RNA合成蛋白质是一个伟大的创举,反之亦然,这亦所谓的蛋白质和核酸的“鸡与蛋” 悖论。找到对此的答案对生命科学至关重要。但大多数生物学家都悲观地认为,没人准确地知道遗传密码从何而来,因为准确重建密码子的起源过程是绝不可能的,或者没有任何迹象表明存在通过特定序列或序列之间的密码来控制化学反应的物理或化学机制, 许多冠以遗传密码起源之名的论文其内容仅仅是在论述其演化而已[1]。 已有理论的缺陷 现在有几个流行的假说。凝固事件假说认为在一个单一祖先中密码子分配到氨基酸完全是“机遇”,之后就保持不变[2]。立体化学假说认为,在很多情况下,在氨基酸和合适的tRNA上的相应密码子的碱基序列之间存在特殊的立体化学适合性[3]。也有人认为,遗传密码既不是偶然的,也不会完全凝固。共进化假说认为遗传密码与氨基酸的生物合成是平行进化而来的[4]。遗传密码是选择、历史和化学的产物[5]。之后几乎没有取得明显的进展,尽管文献中充满了试图解释遗传密码的变异或弹性以及氨基酸-密码子可能的分配规则。 遗憾的是,所有之前的假说都忽视了能量驱动力的重要性,没有哪个理论能从生化系统的范畴(部分和整体的关系)来解释遗传密码的起源。这些假说也忽视了能量转换和信息化(信息创造的过程)之间的关系。仅仅基于密码子自身是不可能理解密码子的起源的,或者说,即使将视角扩展到密码子与氨基酸之间的可能关系。 ATP做媒假说 为了建立一个客观、自立的模型,这里我提出一个逻辑推理,即只有“A”能做两件事(“B”、“C”),才有可能在“B”和“C”之间通过一种选择机制建立起持久(然后可传承的)联系(即准信息)。这里,“B”和“C”分别是核酸和蛋白质,而“A”却隐藏起来了。以往的研究既未关注这样的逻辑推演,也未关注这个“媒人”。仅仅聚焦于“鸡与蛋”之间的表象关系是不可能得到正确答案的。 本文提出了一个新的学说(ATP做媒假说)以解释在一个原细胞中ATP是如何通过在生物多聚物之间扮演“媒人”的角色(虽然它们的蜜月期早已逝去)而导致了遗传密码出现的(图1)。ATP 不需要额外的能量输入就能延长多核苷酸和多肽链,这使建立或固化多核苷酸中的核苷酸序列与多肽中的氨基酸序列之间的分子关系成为可能,当然这还需要通过从这两类生物大分子之间的无数随机组合中筛选出能满足个体性细胞的生存需求的特定序列并进行固化。为了顺畅地生产ATP,原细胞将各种组分和相互关系整合进了一个精致的反应系统,即随着周期性分裂的发展,原细胞建立起了一套“内禀”特性,如规律性、可复制性和反应的节律性,发明了为了生存和自我拷贝所需的各式各样的生化通路/循环,最终创造出了一个复杂的分子网络。同时,大分子也完成了功能分化,即一些核苷酸能携带氨基酸(tRNA的前身),而另一些构建合成多肽的平台(rRNA的前身),它们最终取代了通过ATP活化的氨基酸无规则和随机的多肽的形成过程。多肽有助于tRNA的氨基酸臂与其反密码子的匹配,通过立体化学相互作用(例如,氢键、范德华力和芳香族堆积)的分子识别,逐渐发展出密码子-反密码子碱基配对规则,最后,迎来了一个根据mRNA模板合成蛋白质的统一的平台——rRNA的诞生。多肽反过来不仅参与亲水分子/跨膜离子通道的构建,而且参与催化核苷酸的自缩合反应。RNA作为引物仍然参与现存生物体的DNA复制,这是从RNA到DNA进化过程中的一个惊人印记。遗传系统细分为RNA和DNA(仅通过细微的差别)似乎是为了实现在一个非常小的细胞内对成百上千同时发生的生化反应进行有序的信息管控。随着多核苷酸和多肽环化成了一个互为因果的反馈回路,三联体密码得以诞生。最后生化系统达到了这样一种状态,即mRNA的使命完成之后,马上就被销毁掉,而DNA所记录的遗传信息则是要永久保存与传递的,这是种族延续的根本。之后地球神奇地从混沌的前生物化学转变到了具有魅力的自利的生物世界,而正是自利性通过同质性个体的不断拷贝点燃了生物分子的指数增长。简言之,ATP驱动了多核苷酸和多肽信息化成可传承的具有功能的分子,虽然ATP也不是多核苷酸和多肽形成的唯一推手,但受到了原细胞选择的青睐。 图1 一个关于在原细胞中ATP如何通过能量驱动遗传密码子和生化系统起源的新的概念性逻辑模型(ATP做媒假说)。红色虚线表示原细胞时期的演化过程,而蓝色实线表示现代细胞的过程(不是所有的都显示了),箭头表示影响或作用的方向。能量、生命构件和半透性脂质囊泡(适合于细胞分裂)可能是生命及其遗传密码起源的三个不可或缺的要素。ATP是一个存在于前生命“汤”中的生命构件,但现在被光化学反应不断更新以不至于枯竭,像一个能反复充电的电池。ATP驱动了在一个包裹各种生命构建(如吡咯、A、T、G、C、U、NADPH、氨基酸、脂肪烃、泛醌、和单糖)的脂质囊泡中原始生化系统的演化,通过三联体密码子(可能主要是由操控氨基酸的立体化学特性所决定,通过如沃森-克里克碱基配对作用)在多核苷酸和多肽之间建立起了可记忆的联系,在这两类生物多聚物之间扮演了“媒人”的角色,最终介导了原细胞中从能量转化到信息化的前细胞生化创新,在那里,多核苷酸负责信息的编码、保存和传输,而多肽(称之为酶)高效催化几乎所有生化反应,两者进一步环化为互为因果的系统。 为何ATP? 我们能从现存的生化系统的组织形式得到启示,追溯遗传密码的起源。遗传密码的诞生必须有某种驱动力。虽然随机性和选择常常被认为是这种驱动力,但我倾向于认为驱动力应该是能量的,因为有机体实际上就是分子机器,在那里发生着多的不可思议的生化反应以获取、转化和利用能量。除了化能自养细菌,所有现存的自养生物(植物、藻类和一些细菌)的能量来源都是太阳光。 ATP在所有现存和可能已经灭绝的生命形式的生化系统中扮演了能量中心的角色。它通过ATP/ADP/AMP 的转化为代谢提供能量,支撑在一个组织精巧的细胞中的各种生物分子之间的相互转化。主要的代谢通路(如卡尔文循环、糖酵解和三羧酸循环)都与ATP相偶联。组成遗传密码的其它四个核苷酸都可从ATP和其它较简单的生命构件获得,因为ATP为这些转化提供了生化动力。因此,ATP应该是信息化起源的最符合逻辑的起点。 怎样ATP? 意外的封装不会形成细胞,最早的细胞生命必定源自长期的系列过程及许多中间形态。ATP的现代光化学合成需要跨膜H+梯度,这表明大分子极不可能如艾根设想的那样在体外演化的。在原始地球上脂肪酸能自动形成双层球状膜结构,允许像CO2和O2这样的小分子通过扩散进出,但阻止一些分子和离子(如H+)的通透,导致膜两侧不同的浓度。在原细胞中的这种电化学梯度能开启了通过蛋白通道对能量进行管理的演化。 遗传密码可能是通过从能量转化到信息化、从ATP到三联体密码子以及从RNA到DNA的演化过程被创造出来的。这个情景从前生命“汤”中的脂质囊泡开始,那里包裹了足够数量的各种各样的生命构建(如吡咯、A、T、C、G、U、NADPH、氨基酸、脂肪烃、泛醌、单糖等)。太阳光驱动这些生命构建的电子和H+的眼花缭乱的流动,当达到多聚化需要的浓度或能量阈值时就会引发前生物有机合成。随着大分子有机物质的积累和像CO2这样的小分子的不停输入,原始细胞可能在增大与破裂之间循环往复,导致周期性细胞分裂的产生。虽然早期地球上也会存在偶发性的多聚化和自我复制,但只有ATP的顺畅生产才能建立起前细胞的记忆化、信息化和结构化/分区化。最终ATP通过介导与连锁生化创新成为了一个高度动态系统的能量核心。只有完成了将多核苷酸和多肽环化为一个互为因果的反馈循环以及遗传信息的保存从RNA到DNA的过渡(这与中心法则相反)才见到了细胞生命或所有物种的共同祖先(LUCA)的曙光,只有这时,达尔文进化才开始登场。 何去何从? 不得不承认,解释生命或遗传密码起源的所有理论或假说都是猜测性的,因为自从生命在地球诞生以来几十亿年已经逝去。从这些假说提出可通过实验进行验证的模型确实十分困难,因为所有的假说或理论运用现有的手段既不能被证实也不能被证伪。这种普遍的猜测是迄今为止的情形,这种状态在可预见的将来可能还会持续下去。特别是,原始细胞中生化反应漫长的平行演化可能是导致这一困难局面的重要原因。 以我之见,一个关于遗传密码起源的可靠理论或假说取决于它能否对现有生化系统进行广泛的解释,由于原核世界的高度易变性,LUCA可能已经变的面目全非。与以往的假说不同,ATP做媒假说提供了一个新的逻辑框架,聚焦于能量驱动力、遗传密码与生化系统的协同演化以及从能量转化到信息化的生物创新。与已有的仅反映这个故事的分离、离散侧面的理论教条相比,ATP做媒假说提供了一个更加综合的机理性解释,同时给迄今为止人们知之甚少的细胞分裂和生化系统的可能起源带来启示。因为这些是紧密相连的过程,对一个的理解需要对另一个的认识。因此,我们需要努力去整合跨学科的证据和方法,以能量转化为核心,更详细地阐明这些生化创新是如何协同完成的,以便我们能重建遗传密码的系列的分步的层次体系演化过程。本学说通过揭示这个失踪秘的“媒人”可为现在对生命自然起源构成不可逾越障碍的“DNA-蛋白悖论”提供一个非常可能的答案。 参考文献 1. Yockey, H.P. (2005). Information Theory, Evolution, and the Origin of Life. Cambridge University Press: Cambridge, UK. 2. Crick, F.H. (1968). The origin of the genetic code. J. Mol. Biol., 38, 367-379. 3. Gamow, G. (1954). Possible relation between deoxyribonucleic acid and protein structures. Nature, 173, 318. 4. Wong, J.T.F. (1975). A co-evolution theory of the genetic code. Proc. Natl. Acad. Sci. USA, 72, 1909-1912. 5. Knight, R.D., Freeland, S.J., Landweber, L.F. (1999). Selection, history and chemistry: the three faces of the genetic code. Trends Biochem. Sci., 24, 241-247. 附表1 关于遗传密码起源的各种假说的比较
谢平附表参考文献 6. Woese, C.R., Dugre, D.H., Dugre, A.A., et al. (1966). On the fundamental nature and evolution of the genetic code. Cold Spring Harbor Symp. Quant. Biol. 31, 723-736. 7. Sonneborn, T.M. (1965). Degeneracy of the genetic code, extant, nature, and genetic implications. In: Bryson, V., Vogel, H.J. (eds.) Evolving Genes and Proteins. Academic Press, New York, pp. 377-397. 8. Woese, C.R. (1965). On the origin of the genetic code. Proc. Natn. Acad. Sci. U.S.A. 54, 1546–1552. 9. Fitch, W.M. (1966). The relation between frequencies of amino acids and ordered trinucleotides. J. Mol. Biol. 16, 1-8. 10. Fitch, W.M., Upper, K. (1987). The phylogeny of tRNA sequences provides evidence for ambiguity reduction in the origin of the genetic code. Cold Spring Harbor Symp. Quant. Biol. 52, 759–767. 11. Nagyvary, J, Fendler, J. (1974). Origin of the genetic code: a physical-chemical model of primitive codon assignments. Orig. Life 5, 357-362. 12. Novak, V., Liebl, V. (1975). On the question of the origin and evolution of the genetic system. Orig. Life 6, 269-271. 13. Shimizu, M. (1979). Carbon suboxide and the genetic code. Astroph. Space Sci. 62, 509-513. 14. Crothers, D.M. (1982). Nucleic acid aggregation geometry and the possible evolutionary origin of ribosomes and the genetic code. J. Mol. Biol. 162, 379-391. 15. Balasubramanian, R. (1982). Origin of life: A hypothesis for the origin of adaptor-mediated ordered synthesis of proteins and an explanation for the choice of terminating codons in the genetic code. Biosystems 15, 99-104. 16. Hartman, H. (1984). Speculation of the evolution of the genetic cod III: the evolution of t-RNA. Orig. Life 14, 643 648. 17. Frank, A., Froese, T. (2018). The standard genetic code can evolve from a two-letter GC code without information loss or costly reassignments. Orig. Life Evol. Biosph. 48, 259–272 18. Szathmáry, E. (1993). Coding coenzyme handles: a hypothesis for the origin of the genetic code. Proc. Natl. Acad. Sci. USA 90, 9916-9920. 19. Ikehara, K., Omori, Y., Arai, R. et al. (2002). A novel theory on the origin of the genetic code: a GNC-SNS hypothesis. J. Mol. Evol. 54, 530–538. 20. Seligmann, H, Amzallag, G.N. (2002). Chemical interactions between amino acid and RNA: multiplicity of the levels of specificity explains origin of the genetic code. Naturwissenschaften 89, 542–551. 21. Shabalkin, I.P., Shabalkin, P.I., Yagubov, A.S. (2003). Evolution of genetic alphabet and of amino acid code. J. Evol. Biochem. Physiol. 39, 608-615. 22. Lathe, R. (2004). Fast tidal cycling and the origin of life. Icarus 168:18-22. 23. Lathe, R. (2005). Tidal chain reaction and the origin of replicating biopolymers. Int. J. Astrobiol. 4, 19-31. 24. Lathe, R. (2012). Tidal cycling and the origin of the genetic code: implications for cellular Life. J. Seckbach (ed.), Genesis - In The Beginning: Precursors of Life, Chemical Models and Early Biological Evolution. Cell. Orig. Life Extr. Habit. Astrobiol. 22, 691-707. 25. Gutfraind, A., Kempf, A. (2008). Error-reducing structure of the genetic code indicates code origin in non-thermophile organisms. Orig. Life Evol. Biosph. 38, 75-85. 26. shCherbak, V. (2008). Chapter 7 The arithmetical origin of the genetic code. In: Barbieri M. (ed.), The Codes of Life: The Rules of Macroevolution. Springer. 27. Higgs, P.G. (2009). A four-column theory for the origin of the genetic code: tracing the evolutionary pathways that gave rise to an optimized code. Biol. Direct 4:16. 28. Griffith, R.W. (2009). A specific scenario for the origin of life and the genetic code based on peptide/oligonucleotide interdependence. Orig. Life Evol. Biosph. 39, 517–531. 29. Tlusty, T. (2010). A colorful origin for the genetic code: Information theory, statistical mechanics and the emergence of molecular codes. Phys. Life Rev. 7, 362-376. 30. de Vladar, H.P. (2012). Amino acid fermentation at the origin of the genetic code. Biol. Direct 7:6. 31. Skoblikow, N.E., Zimin, A.A. (2016). Hypothesis of lithocoding: origin of the genetic code as a ''Double Jigsaw Puzzle’’ of nucleobase-containing molecules and amino acids assembled by sequential filling of apatite mineral cellules. J. Mol. Evol. 82, 163–172. 32. Danchin, A. (2017). From chemical metabolism to life: the origin of the genetic coding process. Beilstein J. Org. Chem. 13, 1119-1135. 33. Hartman, H., Smith, T.F. (2019). Origin of the genetic code is found at the transition between a Thioester World of Peptides and the Phosphoester World of Polynucleotides. Life 9, 69; doi:10.3390/life9030069. 34. Cavalier-Smith, T. (2001). Obcells as proto-organisms: membrane heredity, lithophosphorylation, and the origins of the genetic code, the first cells, and photosynthesis. J. Mol. Evol. 53, 555-595. 35. Chatterjee, S., Yadav, S. (2019). The origin of prebiotic information system in the Peptide/RNA World: a aimulation model of the evolution of translation and the genetic code. Life 9, 25; doi:10.3390/life9010025. |
|