分享

生命科学描述的「热力学」范式

 Purefact 2016-01-31

生命科学研究跟热力学基本定律的奠定之间存在着基本的联系。能量守恒定律的提出者之一迈尔就是一位医生,由医生最早意识到能量守恒定律,在我们现代看起来实在是绕了个大圈子,为什么会这样呢?我在电子书《能量守恒》里提出了一些我的看法:


  • 首先,由莱布尼茨所提出的「活力」的思想后来成为了当时德国「自然哲学」的一个重要观点,而「活力」这个词建构了科学家们对现在我们称为「能量」的这一概念的最初想象,即「能量」本身就与「生命」非常相关;

  • 其次,恒温动物体温的维持让「热量」与生命又多了一层联系,这种联系有两个方面:

  1. 第一个方面是在寒冷环境下维持体温所需消耗的能量——对这一物理量的研究导致了能量守恒定律的发现;

  2. 第二个方面是在炎热环境下(例如桑拿房)保持低温的能力,生命似乎可以不受「热传递」的基本规律限制,而「逆天」地通过排汗等过程降温——这实际上暗示了生命依赖「负熵」而存在的事实,这背后隐藏着热力学第二定律的一些思考;

  • 另一个重要的因素在于,尽管「热质说」风行一时并且在分析蒸汽机相关问题方面取得了巨大的成功,但生命科学的研究者很可能还并不熟悉这样一套语言——这是他们的幸运之处,或许正因为如此,医生们的关注重点并不会被局限在测量在消化的过程中从各种食物流出的「热质」,而可以更早地开始考虑宏观的能量收支平衡。


回顾热力学理论建立起来的十八和十九世纪,这一时期不但是物理学正在迅猛发展(热学和电磁学的发展及与之伴随的两次工业革命),生命科学的许多认识也在逐渐深入(细胞、进化的观念)。举个例子说明一下这种交叉,开尔文对热力学第二定律的描述是:「靠无生命物质的作用,不可能把某一物体冷却到它周围最冷物体的温度之下,以产生机械功」。注意到他描述中的「靠无生命物质的作用」,这就告诉我们开尔文清楚地看到了生命与非生命之间的某种区别。今天我们对生命的工作原理有了更清楚的认识,我们知道生命本身也不能违背热力学第二定律。随着技术的进步(3D 打印、人工智能等),我们越来越难以再把自我复制、学习和自适应等直观的行为作为生命的独有特征。这没有什么好惭愧的,生命本来也就只做了一些微小的工作,我们大可认为我们推广了「生命」的概念,我们可以把生命看成是可以自复制的系统,可以把生命看成是耗散结构,可以把生命看成是某种涌现现象……而每个人对生命概念的理解不同,可能就会得到不同的物理学理论(非平衡统计物理、非线性科学、复杂系统等),这些理论从不同的角度尝试解释生命的问题,并且存在着某些更基本的联系,但我们总会觉得缺少了些什么。


当我们面对一个未知的体系,自从有了统计物理学,我们会很自然地去考虑这一体系的某种微观的描述,这与我们认识的深入恰好吻合了起来,例如当我们看到细胞时,我们想到的是生物分子之间复杂的相互作用(蛋白质—蛋白质相互作用、基因表达的调控和对 DNA 的修饰……);当我们讨论群体的行为时,我们想到的是人与人之间的相互影响(交易、博弈、空间运动等)。这一种思潮随着大数据分析的流行进一步发展,我们的思维模式已经发生了变化:当我们说一个磁性材料的顺磁—铁磁转变的时候,我们马上就会想到 Ising 模型,可我们却忘了它的热力学描述,我们知道磁化率、比热与某种微观的涨落有关,但我们却已经忘记了它们背后最直观的意义。我们常常面对各种问题马上就弄个小模型做起来,但是却忽略了另一种可能性——某种「热力学」理论的可能性。


在这篇文章里,我们将要讨论的「生命的『热力学』理论」并非是说我们简单地讨论生命有关的热力学问题(例如前面已经提到的体温维持、负熵等),而是希望建立生命科学描述的「热力学」范式,为「生命」建立某种新的类似于「热力学」的理论。这样的一个理论只是某种「猜想」,它能给我们提供一些看问题的有意思的新角度。不过所谓的「热力学」范式本身看起来很难以理解,我们举一个例子来说明。


例子,勒夏特列原理在热力学(物理化学)中有著名的「勒夏特列原理」:在化学平衡中,如果改变影响平衡的一个因素,则平衡就向能够减弱这种改变的方向移动,以抗衡该改变。这一原理主要是说系统有某种「懒得发生改变」的性质,它是热力学第一定律和第二定律的推论,牛顿第一定律和楞次定律也都表现出类似的性质。在生物的体系内,有许许多多的化学反应正在发生,我们自然可以对这些反应分别用勒夏特列原理进行分析,这种研究的方法就属于用热力学的方法研究生命科学问题,而我们希望更进一步,思考在各种生命现象中是否也可以有某种「懒得发生改变」的性质,并尝试对其进行定量刻画。

在生命现象中真的也存在这种「懒得发生改变」的性质吗?考虑某种最基本的进化过程。的确有,在细菌中插入一个能表达荧光蛋白的基因,这样,在紫外光照射的情况下细菌就可以放出荧光。我们希望选出那些荧光蛋白表达最多、荧光最强的细菌——这正是在进行某种「进化」,人工「选择」此时产生了一种「选择压」,不妨将其类比成某成热力学中的压强。如果在选择压的作用下不存在某种类似于勒夏特列原理的限制,那么会怎样?可以想象一下,如果不存在某种限制,只要人一直去选择,就一直可以找到荧光强度更强得多的细菌,而且这种选择的过程不会马上变得越来越困难。如果真的可以有这种好事,那大跃进时期的肥猪塞大象或者亩产万斤都应该不是放卫星了,因为只要不断选择产量最高的水稻,其后代就可以一直无限提高产量。而这显然是不可能的,这里我们已经看到了某种新的「勒夏特列原理」,随着选择压的增加,种群的内部差异性(涨落)会变得越来越小,从而继续选择的难度会加大,生物的进化正在抗衡这种人工的选择。这一结果也是可以有实验支持的。如上图所示【Kaneko and Furusawa (2006)】,从第 n 代开始,再从中选出其中荧光强度最强的固定比例的细菌, 培养得到 n 1 代……从实验的结果我们看到,随着选择的进行,统计分布的方差变得越来越小,均值的改变也在不断缩水,进化的的确确受到了某种限制。这种限制既不是简单因为违反了能量守恒,也不完全是因为违背了热力学第二定律(我们完全可以「不惜一切代价」去培养这样的细菌),而是因为其它某些限制的作用。


我们希望借用「热力学」的一些想法来讨论类似问题。在介绍与此有关的一些方法之前,我们首先不妨回顾一下(平衡态)「热力学」理论的一些「特性」。首先,热力学理论非常直观,我们无法(也无需)想象分子的热运动,但我们很容易就能感知冷和热,因此在热力学理论中,「温度」不是一个难以想象的概念;其次,热力学理论本身是一套自洽的理论,即使完全不了解微观描述,用很少的几个参量(例如温度、压强、体积等等)就可以描述一个复杂的系统;并且,热力学理论虽然本身已经是一套完整的体系,但它也可以通过微观的理论「导出」,这更加强了其理论基础。


知道了「热力学」的这些特征,我们就可以提出属于非平衡统计物理以及生物物理学的一些(有着「热力学」风格)的基本问题了。本文接下来提出的八个问题参考了日本东京大学金子邦彦教授的《生命とは何か―複雑系生命科学へ》,这本书的日文名是在向薛定谔致敬。这本书的英文版叫《Life: An Introduction to Complex Systems Biology》。这些问题参考了书中的介绍,但讨论都是我的原创,因此如果有不妥之处,还请各位朋友指正,我们一起讨论。


1、选择怎样的非平衡物理学(生命科学)体系进行研究?


热力学的「局限性」导致了它的成功。热力学理论依赖于测量,而宏观物理量的测量需要达到「平衡」。两个温度不同的物体接触,等它们达到平衡之后,就有了温度(热力学第零定律)。尽管两个物体的情况和物理性质依然不同,更不要说微观状态了,但我们说它们的温度相同,这事实上是是对大量的微观状态进行了分类,类似于群论的「等价类」「商群」。这种限制作用大大简化了刻画「微观状态」以及「微观状态之间的转移」中的困难,平衡热力学让问题得到简化。对于生命的体系,我们是否也可以划定某些「等价类」?


一个自然的想法是——我们可以尝试把非平衡的定态(steady state)看成宏观状态。但「定态」总显得有点不够生物,所谓的定态是指不随时间改变,而一个人吃饱了拉,「跟咸鱼有什么分别?」我们更希望考虑能繁殖(遗传和变异)的系统。而对增殖中的系统进行研究的话,我们希望研究稳定增长的体系,消耗能量或者信息,很稳定地不断自己复制扩增。


2、在这样的「热力学」范式下,当我们刻画生命这样的非平衡体系时,直观性和唯象理论仍然是可能保持的吗?


在建立这样的理论时,我们很容易一不小心就回到统计物理的框架下——请小心些,我们尽量跳出来。我们不讨论怎样的基因调控网络(参数选择、拓扑结构)对「稳增长」最有效,而是希望能找到某些直观的量进行描述。例如热力学中我们用温度刻画冷热程度,这就是很直观的描述。对应的,在不断复制的细胞中我们也希望找到某种直观的「活力」的定义——这里的「活力」可能是细菌发光问题中的方差,但如果再看得微观些,它其实对应于细胞基因表达模式的差异性,这种差异性与微观的生物分子相互作用中的一些局部或者整体的参数选择有关。我们在热力学范式下,希望可以暂且放过微管描述不管,只看某种直观性的唯象理论。


3、在生命这样的非平衡体系中,我们怎样定义「熵」?


生命的存在依赖于「负熵」,这是很自然的,为什么我们要在新的「热力学」中引入某种更「高级」的「熵」呢?这是因为正如我们前面提到的选择实验所展示的那样,在进化的过程中,有某些新的限制不能完全用热力学概念来描述,如果人工选择实验所对应的就是「勒夏特列原理」,那么我们可以平行地考虑引入「熵」的概念。


在平衡统计物理中,「熵」与无序有关。在非平衡体系中,仍然可以有很多不同的熵的定义。但我们回想其那个人工选择细胞的实验,我们会想到,这里的「熵」还可以意味着「涨落」,而这种涨落暗示了进化的「潜力」——这是一种「可塑性」。如果是初代的细胞,在被人工选择时,就有更大的潜力,而随着选择的进行(消耗了人类的能量),「熵」不断降低——某种「活力」不断降低,细胞的「单一性」(稳定性)在不断增加。换句话说,在这样的「热力学」中,熵对应的是选择过程中的「可塑性」,这是跟「稳定性」是相互矛盾的。在细胞中,这中可塑性可能对应于基因表达模式的差异性。


我在《临界:智能的设计原则》中提到过很多「可塑性」跟「稳定性」竞争达到「临界」的例子,「临界」是某种面对诸多选择时的最佳状态,临界的鸟群可以应对来自各个方向的捕食者,而如果长期只在某个方向上出现天敌,这就起到了某种「选择」的作用,随着外界可能性不断降低,系统会变得更「稳定」,这就不再具有可塑性了。


4、在生命这样的非平衡热力学体系中,怎样定义广延量和强度量?


简单地说,广延量是可以直接作加法的。一个房间里有三个人,另一个房间里有两个人,这两个房间一共五人,这时我们对人数进行了「加法」,因此人数在这个意义下是一个「广延量」。而假如一个房间的温度为三十摄氏度,另一个房间的温度为四十摄氏度,我们不能说,这两个房间一共有七十度的温度,这里的「温度」就是一个强度量。在非平衡的体系中,我们怎样定义广延量和强度量呢?这时我们真的能找到某些好的定义吗?例如温度,在平衡态下,它就是一个强度量,而在非平衡体系中,很可能系统就没有一个恒定的温度,怎样在这种情况下推广广延量和强度量的概念?


与理想气体不同,生命的体系常常不是可以一直「广延」下去的。例如在发育过程中,器官的大小就有一定的极限。我在《临界》一书中介绍的易速生长率就可以解释这种极限。在这样的非平衡热力学体系中,各种广延量和强度量的定义很可能是比经典热力学更复杂些的,需要用标度变换来描述的。


5、怎样推广「卡诺循环」?


在热力学中「绝热过程」可以保持熵不变,而在前面讨论的进化和发育问题中,我们都看到了某种可塑性的降低。如果要找到「绝热过程」在新的「热力学」下的对应,我们会想到某种不会导致熵(可塑性)降低的「理想的发育过程」。


接下来我们考虑卡诺循环,卡诺循环是热力学中的一个重要的模型,因存现实世界的中的热机都是以不可逆循环来工作,卡诺热机将许许多多的不可逆过程抽象为了「可逆过程」,从而使其效率达到极限。这种「卡诺循环」在进化或者发育的过程中也有对应吗?金子邦彦猜想「体细胞克隆」可能是「卡诺循环」的一个推广。所谓「克隆」,强调的是「无性繁殖」,而「体细胞克隆」强调的是动物的体细胞经无性生殖过程进而发育成的克隆动物。 体细胞因为已经经过了分化,不再具有全能性,但如果取出一个双倍体细胞核,再移入一个去核的卵细胞,随后再植入代孕母体中,就有可能可以发育成新个体。这个过程中体细胞又回复到了可以复制的状态,的确与卡诺循环有某种相似之处。怎样分析这一过程中的能量代价和可塑性的变化:这会是一个有意思的问题。


6、在这样的「热力学」下,怎样理解「稳定性」和「不可逆」等热力学中重要的概念?


这里的「稳定性」不只是说与生命中「稳态」有关的性质,这里我们指的主要是跟「勒夏特列原理」可以类比的(系统响应微扰的)性质,我们已经用细菌的选择和进化进行了解释。这种选择的过程本身也还是「不可逆」的。当然,说到不可逆性,更直接的一个例子会是干细胞:干细胞起初具有「全能性」,而随着分化的进行(如题图所展示),它的可能性在不断减少,最终特化成为各种体细胞,这也是「不可逆」性的另外一个例子。


另一个有意思的问题在于我们怎样推广「第二类永动机不可能」。在这里应该也可以有某种对应——例如,是否就应该对应于灰原哀的 APTX4869 不能制成?又或者是是否可以有某种「热力学」范式的理论,能告诉我们小保方晴子等研究者尝试的从体细胞制备干细胞的方法是否存在某种更基本的限制?而说到干细胞我们还有可能会想到其另一面,即癌症,在这种热力学意义下的「第二类永动机」是否可能暗示了某些抑制癌症出现的方法?


7、在平衡统计物理中,宏观态的描述非常简单,对于生命系统这样的非平衡体系,这样简单的描述是有可能的吗?


在热力学中,我们很容易就可以完全不仔细考虑微观态的影响。而在非平衡体系里,这很可能是很困难的。这提示我们考虑这些问题时要注意相应的时间尺度,例如在一个非平衡体系中有两个差别很大的时间尺度,在快的尺度上,我们可以假定其达到了定态,从而用更平均化的「宏观态」来描述。如果无法找到这样分离的时间尺度,我们就得更仔细地考虑相关的问题了。


8、作为某种「热力学」理论,是否仍然有与微观理论(统计物理)联系的通道?


当然,这种想法的一个直观的思路就是想办法让微观理论与宏观的「热力学」强行符合起来。但正如我们前面提到的,在生命过程中,有可能会存在某些特殊的尺度(例如器官的发育),因此有可能唯象理论的存在是与尺寸相依赖的。从微观理论出发不能简单地就得到普适性的宏观「热力学」,这种「热力学」有可能跟体系本身的尺寸就有关。这不意味着微观理论跟宏观理论之间的联系就断开了,而是这种统一需要有更仔细的、多尺度的考虑。




以上是金子邦彦对生命体系的一些想法。我们将原书中的对照表引用如下:


在这些问题的引导下,我们可以开始思考很多生命科学的基本问题,例如细菌的增殖和进化、气候变化对生态系统的影响以及分子进化中的更多例子。其中,与此有关的最重要的问题就是发育和进化问题(通常简称 Evo-Devo),它是生物学中一个深刻复杂而又富有争议的问题。最早科学家在观察胚胎发育的过程中发现胚胎的发育过程似乎是在「重演」生物进化的过程,这种思路可能存在很多细节上的反例,因此也遭到很多批评。但如果我们「不要在意那些细节」,仅从前面提到的这种「不可逆性」的角度来考虑,就可能可以找到进化过程跟发育过程中的关键联系——进化跟发育都对应于某种可塑性的减少,这一过程也是不可逆的。


热力学第二定律告诉我们熵会不断增加,而生命为了塑造自身的有序,选择了一条通往有序的道路,而一旦走上这条有序的道路,又有了通往有序的「不可逆性」,系统变得越来越稳定,可塑性不断减少。这有点像老子说的「天之道」跟「人之道」的区别。当然,这些想法其实并不重要,更重要的启发是我们怎样用类似的方法来面对其它的系统,怎样进行类比?例如对于一个计算系统,我们怎样在计算时怎样定义计算过程「可能性」?一个可能的思考是,我们把「通用计算」作为类似热力学第二定律中熵的零点那样的一个起点,考虑从「通用」到「固定功能」(例如复制)的演化,这时我们也可以验证这一定义下的勒夏特列原理和不可逆性。


还是以计算系统为例,前面的分析也暗示了我们在有监督机器学习训练中可能存在的极限。这个问题对于指导机器学习也是很重要的:对于有监督学习的问题,我们自然会希望系统能准确反映从数据中学习来的内容,但「过拟合」会是一个重要的问题。在这种热力学范式的框架下,「过拟合」意味着「通用性」的丧失到了不能被接受的程度。用热力学的角度来思考,我们在优化的过程中需要考虑的不是某种简单的「能量极小」,而是应该考虑灵活性的要求,从而应该引入某种「自由能」。除此前面讨论的这些,关于计算系统还可以有很多其它问题:计算系统中怎样进行标度变换、一个标准的计算循环又应该是怎样的、在从通用计算到具体执行某种功能计算的过程中是否也存在某些极限等等。


本文我们把重点从「计算」切换到了「物理概念」,但这不代表我们所讨论的东西就会像民科一样天马行空,更不会认为我们讨论的一些东西对对于任何体系都适用。如果读者对本文讨论的内容感兴趣,或者对本文所介绍的非平衡系统(例如本文介绍的自复制系统,或者计算系统,又或者更简单的非平衡可解问题)的相关物理概念和方法有兴趣,又或者对我此前在《临界:智能的设计原则》中所介绍的有关想法感兴趣,欢迎加入我们的微信群。



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多