分享

系统科学的方法及数理基础

 铁马冰河雄关 2020-11-16

按照钱学森对现代科学技术体系的构想,任何一门学科都可以分成基础理论、技术基础、实际应用三个层次,每个层次有自己确定的内容,并且三者之间有着紧密的联系。系统科学也不例外,在基础理论层次的内容是系统学,我们这里所给出的简单巨系统演化理论也属于系统学的内容之一;在技术基础层次的内容包括运筹学、控制论、信息论等在第二次世界大战后建立起来的一些概念、理论、方法,现在这些内容已构成对大量实际问题讨论的基础;在实际应用层次的内容是各种各样的系统工程。系统工程的内容具有既要进行一般方法讨论,又要密切结合实际系统的特点。作为对系统科学的了解,我们对这三个层次上的内容作一个宏观介绍,主要分析各部分内容的特点、相互之间的关系,以及它们在系统科学中的地位、作用。

1
系统工程

系统工程是系统科学中解决实际问题具体技术的学问。由于实际问题非常丰富,因此解决问题的方法也各有不同,一般系统工程课程讲解各种各样传统的、经典的方法,应用时往往需要把它们综合加以考虑。实际上,不结合具体系统无法讨论清楚系统工程的方法、技术等各种问题。在不同的学科领域中系统工程的内容要在具体的研究运用中分析,这里我们主要分析系统工程解决问题的实际步骤。

1)问题分析

首先要对所给出的问题进行分析,将各式各样的实际问题规范化为系统工程研究的问题。这一阶段需要具有被讨论问题所涉及到的具体学科的知识,要由系统工程专家和具体学科专家联合工作,实际上这是各方面专家相互沟通、相互了解的过程。

对于控制系统实现最优的问题,在这一阶段要明确目标函数(对事前给定目标的系统,要写出数学表达式),划清系统边界,找出控制因素。如对于物理系统,要明确所讨论对象的性质、环境条件、演化现象的特点。如对经济系统要了解控制目标是什么,控制变量是什么,然后才能具体分析。

在建立一个人造系统时,要人为给定目标体系、约束条件等。如对人造卫星、宇宙飞船的设计,要给出一系列指标要求,给出制造实现条件。

这一步主要是把实际问题的要求变成能进行分析讨论的目标函数。目标函数要用数学公式表示出来,这是进行下一步讨论的基础。特别要注意在存在多个追求的目标时,要使其互相之间协调。如讨论我国人口问题,计划生育人口政策规定一对夫妇一生最好只生一个子女的目标;农村生产承包制将生产的单位划在家庭,增加生产的目标与多子女紧密相关。实际工作时必须将这两个目标人为协调起来,否则无法建立统一的目标函数,也无法用系统工程方法讨论。

根据实际问题,建立欲实现的目标,并给定数学表示后,还需要有约束要求,例如经济控制问题,就要求在实现目标的过程中状态改变不能太剧烈,以免出现社会动荡问题。

在此阶段将问题分析得越深入、越透彻、越全面,后面解决起来则越容易。

2)建立模型

建立一个能解决实际问题的模型,这是用系统工程解决实际问题中最重要的一步,但往往理论讲解非常少。我们认为,学习系统工程后仍不能用来解决实际问题,往往是建立模型这一步没解决好。

模型是对被描写与说明研究对象实体的一种表达方式,多数情况下是对实际问题的一种抽象,这种抽象往往是对实际问题某一方面性质的抽象,对于其它不关心的问题则不在模型中反映。因此模型一般与对象之间存在着同态关系,特殊情况下也可存在同构关系。

模型可以分成形象模型(把实际物体尺寸加以改变,其它性质与原物体类似,如地球仪模型、风洞实验模型)和抽象模型(用符号、图表等描述客观事物性质、特点而建立起来的模型)两种,我们主要研究抽象模型。抽象模型又可分为三种:

(1)模拟模型。用便于控制和易于分析观测的条件和关系来表述实际事物的特征,如等高线表示的地形图;电子线路模拟力学系统;计算机模拟事物的逻辑关系等。有了大型计算机以后,复杂计算成为可能,系统工程中建立的这类模型才多起来。

(2)数学模型。用字母、数字或其它数学符号组成关系式、图表等来描写实际事物的特征所建立的模型。这是系统工程中大量采用的模型,有时用等式、不等式函数模型,有时用微分方程模型。

(3)概念模型。对事物进行理论抽象后,建立起来的一种理想系统即模型。物理学中各种研究对象几乎都是理想模型,如质点、刚体、点电荷等。

实际应用解决问题时,到底建立哪种模型要根据具体情况进行确定,没有一定的规范。模型与实际有差别,为使模型能满足我们对实际系统分析的需要,建立模型一般要满足下述要求。

(1)真实性。模型要与研究对象充分相似,有足够的精度。但对不同实际问题,有不同要求。要求不同,同样满足真实性,所建立模型的精度也不同。对于飞机,在研究其航线、航程时,可建立质点模型;在研究飞行速度与发动机功率关系时,可建立刚体模型;研究飞机寿命与飞行关系时,可建立弹性体模型;研究生产制造飞机问题时,则需建立包含众多元素的复杂系统模型。

(2)抽象性。为研究实际问题的本质必须要舍弃次要因素、突出主要因素,形成具有一定理论抽象并可以处理的模型。抽象性与真实性有密切关系,抽象性要求模型特点突出,真实性又要求模型与实际尽量一样,一个好的模型应是这两者的统一。上例飞机建模中的每一种模型都体现了模型的抽象性,同时又能与实际一致。

(3)简明性。在模型表达方式上应该尽量简单,容易分析、计算。这里仅从计算上对简明性进行说明。现代模型计算往往通过计算机,进行离散数值计算,因此表达式是否简单明确,往往不仅会造成计算时间上的不同,甚至会影响结果。如1÷300×600这一算式结果为2,而在计算机中计算,当精度为0.000001时可得答案1.999800,与结果相差0.0002,虽超出精度但仍可以采用;若精度取0.01则得答案为0,完全错误,原因在于书写形式出现了问题,若改写为1×600÷300则在任何精度上都有准确答案。因此我们所讲的简明性,主要不是指模型表面上、形式上的简明,而是指在模型分析、使用上的简明。

(4)适应性。模型应有普遍意义,往往是对一类问题建立一个模型,通过对一个模型的分析来求解一类问题。

3)数学分析

由于建立模型形式不同,在进行数学处理时采用的方法也不同。

微分方程表示的系统模型是我们最经常处理的问题,对线性问题一般采用直接求解方法,也可以采用计算机数值求解方法。对于非线性问题,可利用计算机进行数值计算,但更多情况下只讨论定态解性质,研究系统的稳定行为,或运用微分方程的定性理论,分析方程的性质。

一般用函数式表示的系统模型多是静态问题,通常为在一定约束条件下求系统的极值。如果只有两个变量可以采用作图的方法来求解,变量多时,就需要根据问题要求利用运筹学有关理论去分析了。

现在计算机的作用越来越大,很多问题都要通过计算机进行求解、分析,它已成为系统工程不可缺少的分析工具。

4)系统性质分析

得到计算结果并不是研究问题的目的,还需要把数学结果变成对实际问题的分析,通常除了根据计算结果解释一些已经看到的现象外,往往还根据计算结果得出一些新的结论,发现一些规律,进一步预见一些现象。

在利用计算结果分析系统性质的过程中会发现一些与实际不符的情况,对此往往需要修正模型,再进行计算,将所得新计算结果再与实际比较,这样不断修正模型,不断计算,不断与实际比较,反复进行,使讨论不断深入。修正模型往往采用改变变量个数的办法,开始讨论少数几个变量的模型,用以决定系统变化的总趋势,然后再增加变量个数,讨论反映系统细微性质的量,使分析逐渐完善。修正模型也可采用改变变量性质的办法,把某些量从常量改成变量,将离散量与连续量交换等,这样做可以更全面了解系统的性质和特点。修正模型还可以采用改变约束条件的办法,通常增加约束可求出保守、悲观情况下系统的性质,减少约束可求出冒进、乐观情况下系统的性质。

系统工程不是为计算题目,而是为实用,很多问题在计算完成以后,还需要进行实际操作,按照计算结果控制系统,使它按照我们的需要运行。运行过程又是一个不断将计算结果与我们最初目标进行比较的过程,是一个动态的比较,这中间还要不断进行再分析,以使系统真正达到我们的要求。

2
运筹学

运用科学的方法研究复杂的系统,以求在一些确定的约束之下,改善系统的效率和产出。在这一过程中所运用的各种分析方法的总体及解决问题的途径,称为运筹学。国外称为O. R.(Operational Research)或M.S. (Management  Science)。我国将其列为数学的一个分支,更强调对各种数学方法的运用,而将对过程的分析划入系统工程的内容。

实际上很多具体问题中数学方法和解决问题的途径是分不开的,如某家航空公司在安排航行时间表、组织人员、设备维修等问题时,既要考虑到公司本身条件如物质、人员、经费的约束,又要考虑用户的不同要求,考虑由于排队、天气等不确定因素的影响,这就是一个系统工程的实际问题,需要按照上面的步骤工作。同时我们将具体问题规范、抽象成理论问题,并又归为排队论、非线性规划等运筹学的问题,我们也可以从数学上进行分析计算。在系统科学发展初期,所面临的多是一些简单的问题,比较容易分析清楚事情的关系,并列出所讨论问题的数学模型,其主要任务是求解这些数学模型,这时与研究事物过程的系统工程方法与强调数学分析方法的运筹学没有多大差别,或者说是主要依赖运筹学来解决问题。近年来,人们面对的多是一些大的复杂系统的优化问题,这时很难用一种运筹学方法来讨论解决系统的优化问题,而且多数情况下所面临的困难在于,如何分析系统,如何根据系统的实际和对问题的要求建立求解的方法,在具体计算中又要运用各种理论,特别需要配合计算机的应用,这些就应该是属于系统工程的内容。通常运筹学中讨论的方法只是系统工程分析问题一系列工作中的一部分内容,而且系统工程中所用到的方法既然是从问题出发,因此不少方法还是未规范、未系统的,这些方法并未列入运筹学的内容。因此我们可以说,运筹学是对系统工程应用技术中的数学方法进行总结、规范后所形成的一个应用数学分支。我们在系统工程方法中讨论的内容很多也是运筹学的内容。客观实际问题不断提出,新的系统工程方法不断总结,运筹学的内容也不断增加、丰富。

运筹学的内容从本质上讲是讨论在一定约束条件下求系统目标函数的极值。最能体现运筹学这一思想的是线性规划,线性规划的标准数学形式为:

其中为所研究系统的状态变量,是目标函数要计算的式子,这里体现为状态变量的线性组合,比如一个生产系统,表示第i种产品的产量,表示该种产品相应的价格,目标函数通常是使总的产值最高,若表示生产第i种产品一个单位所消耗的费用,则目标函数便是要求总的消耗最小等等。

是约束方程,当讨论目标函数为希望总产值最大的问题时,则表示第j种单位产品消耗的i种原材料数,约束方程表示各种生产消耗的某种物质不能超过该种物质总的贮备当目标函数、约束条件方程都是变量的线性函数时,称为线性规划;只要这些函数中有一个为非线性函数,则称为非线性规划;若要求变量只能取整数,则称为整数规划。三种数学规划都是运筹学的内容,它们在数学理论上并不复杂,但是要在较短的时间内,通过规范的计算机程序计算出来也不是一件容易的事情。运筹学的其它内容也都可以看成是约束条件下的极值问题。存贮论是研究仓库中的货物如何存放(在仓库容许条件、人们对货物需求等多种约束条件下)使之最优、花费最小。排队论分析在顾客来源不确定,并对服务有一定要求条件下如何使系统最优、服务最节省。博奕论是指在一定规则下,无法确定对方采取何种动作时,如何操作可使自己获得最大利益。由于不同问题的约束条件不同,采取的数学方法不同,也就构成了运筹学的不同内容。

另一方面在解决实际问题时,采用的方法各种各样,如方程计算、画函数曲线、图上作业、运用计算机现成软件等等。运筹学的内容很多,在运用时不仅要注意内容本身,更要注意这些内容的适用条件,注意各部分内容之间的差别,注意在运算上对计算所花时间的要求等。

3
控制论

控制论是研究某一系统(或装置)如何选择机制及输入使其输出达到某种要求的学问,英文写为Cybernetics。一般地说,控制论总是伴随着某一系统模型,其中必有一个监测器(可以是人、电子的、或机械的),对系统t时刻所输出的量与我们要求(希望)系统t时刻应该输出的量进行比较,将它们的差再以某种方式通过反馈器,送到系统作为输入的一部分,以使下一时刻系统的输出更接近

控制论中重要的概念有输入、输出,这是人们控制系统、了解系统的关键。一般被控制系统本身的机制我们并不关心或我们无法关心,我们通过输入影响系统,通过输出观察系统并进行控制。控制论可以说是一门如何选择输入使系统的输出达到我们要求的学问。对系统不了解,仅依靠输入、输出来控制系统既是我们控制论的不足(如果完全了解系统,将更加有利于控制),也是我们控制论的优点,我们在研究复杂系统演化时,提出的控制论建模方法,就是认为系统是个黑箱,不考虑系统内部构造,仅依靠输入、输出关系建立模型的方法。控制是控制论中的核心概念,没有人为约束的自然系统的演化不是控制论研究的问题。

系统演化中的人为约束条件为控制。对系统的控制形式多种多样,方法也不相同。首先,控制对象有多种,对系统的各种要素可以进行控制,对系统的结构也可以进行控制,如驾驶员控制飞机翅膀的大小、形状;参数可以进行控制,输入的大小和方式仍可进行控制。

控制的方式和种类也有很多种,可以由人根据环境实际情况,对控制量的大小和形式进行控制,如汽车驾驶员根据路面和碰到的情况对汽车车速和行进方向的控制;还可以事先设计好程序,向系统顺序发出一系列指令,按一定顺序进行控制,如机床工作时的程序控制;也可以利用输出、利用系统状态对自身进行控制,如各类的自动控制机械,这种控制通常称为反馈控制。反馈控制是控制中最重要的一类控制,正是由于有了这种控制才使控制论成为解决很多具体问题的有用工具。当控制作用不随时间改变时我们称为静态控制,反之则是动态控制。

在研究控制论时要注意如下两种含义。
1)控制论(Cybernetics)。它是研究控制系统的基本规律,试图揭示机器、动物、人之间的关系,用类似人、动物的反馈机制设计机器,利用机器揭示出来的规律解释生物、人的一些现象。它是由N. Wiener等人创立的,W.R.艾什比(Ashby)将此理论用来研究神经病人并取得一定成就[Ashby,1956]。

2)控制理论(ControlTheory)。它的产生是与系统的物理机制密切联系并紧密依靠数学中的变分法和微分方程理论,直到二次大战后才独立成为一门学科。其主要内容是工程控制论,它建立了一套数学形式来研究机械控制的一些性质。Control Theory比Cybernetics具有更完整的数学形式,发展也非常迅速。控制论均指Control Theory。在其发展过程中大致分成经典控制理论、现代控制理论、大系统控制理论三个阶段。

本世纪40-50年代,在控制理论形成时期主要是经典控制理论。它利用输出、输入函数关系研究系统的性质,通过拉普拉斯变换,把随时间变化的输入、输出关系(微分关系)变成在频域中的关系。在频域里输出、输入之间关系可以用传递函数联系起来成为代数关系,使分析大大简化。这一阶段主要讨论线性系统,对于线性系统建立了非常完善的理论,解决生产中机器自动化的问题。经典控制论的核心问题是求系统输入、输出之间的传递函数,有了传递函数,就可以解决一切问题,所用数学工具主要是拉普拉斯变换等。

由于生产的发展,仅讨论输入、输出的关系已不能解决问题,在50年代又提出了现代控制理论。现代控制理论的核心是提出状态空间概念,认为输入影响系统的状态,系统的状态影响系统的输出。虽然表面上看仅是提出一个概念,但却对控制论问题的认识大大深入了一步。我们将输入变量记为u,输出变量记为Y,系统状态变量记为X,则系统在输入控制下的演化方程由

(线性系统)(2)


(非线性系统)(3)


决定。现代控制理论也主要讨论线性系统,方程(2)中表示状态变量、输入变量、输出变量的X,u,Y分别是m,n,l行的一列矩阵,A,B,C分别被称为系统的关系矩阵、输入矩阵、输出矩阵,它们是m×m,n×m,l×m维矩阵。输入、输出之间不再是原来的简单关系,中间要通过“状态”将它们联系起来。根据输入与状态、输出与状态之间的关系,人们又将状态变量空间分成四个子空间,它们分别反映了系统的输入变量能否控制系统的状态,系统的状态能否通过输出变量观察到。这四个子空间是:能控能观子空间、不能控能观子空间、能控不能观子空间、不能控不能观子空间。原来在经典控制论中讨论的问题,相当于现在在能控能观子空间中来讨论系统的演化问题,经典控制论对其余三个子空间中系统的性质无法进行分析。现代控制理论可以研究问题的范围比原来广泛、内容比原来深刻。现代控制理论分析系统的能控、能观性,对于设计建立自动控制系统不仅有理论价值,而且有实际作用。

现代控制理论还讨论了最优控制问题,前苏联学者庞特里亚金(Г.С.Понтрягин)提出极大值原理,解决了如何控制系统使之达到最优控制的方法问题;贝尔曼(Bellman)动态规划理论也是解决如何最优控制的问题。卡尔曼(Kalman)滤波理论利用状态、输出、输入的递归关系大大改善了原来Wiener滤波(对于平稳随机过程的滤波理论)中的问题,这些理论的相继提出都是利用了状态空间基本概念。

最近针对复杂系统的控制问题,又提出大系统控制理论,利用分级递阶控制,解决多层次、多部门联合控制的问题。目前这方面的工作对解决实际问题有一些办法,如讨论级间关联及控制问题,理论发展不是很大。

从控制论所研究的问题来看,可以分成工程控制论、生物控制论、社会控制论等。工程控制论比较成熟,上述控制理论的概念与方法都是工程控制论的内容;生物控制论、社会控制论由于所研究系统复杂,目前还多停留在借用控制论的概念,定性解释生物、社会的现象,较少用定量的数学工具进行计算。多数科学家认为,对于生物、社会系统,不可能像工程系统那样,有确定的因果关系,可以使用较简单的控制理论解决问题。生物系统、社会系统比较复杂,原来的理论无法解决问题,需要提出新的复杂系统的控制理论。目前我国学者提出来的定性与定量相结合的系统理论是解决这一问题的较好方法。

控制论、运筹学都是讨论一个系统,在某种约束条件下,如何达到最优状态,在这一意义上,它们是类似的,都属于系统科学的技术基础层次。但运筹学讨论系统的静态特性,讨论系统稳定状态的情况;控制论则讨论系统动态的情况,讨论在一定控制下,系统如何达到目的的时间过程。可以认为运筹学是一种静态控制、开环控制、程序控制,讨论在一定“控制”之下系统最终能否达到预定的目标;控制也可以看成一种运筹、一种管理,一种不仅要求系统最终达到目标,而且连实现目标的途径、实现目标的时间过程也进行考虑、有所要求的运筹学。

4
信息论

信息论是研究信息在系统演化过程中,主要是在通信过程中,进行传递、识别的理论。在研究复杂系统演化过程中,信息占有重要的位置,系统越复杂,研究其演化时,信息所占的地位越重要。Shannon等人主要针对通信过程中信号传递与接收的问题,建立起了研究信息传递过程中的损失及如何识别信息等的应用学科—信息论,它在系统科学中也占有重要地位。而且随着这一学科的进一步发展,它在研究包括人在内的复杂社会系统中必将发挥越来越重要的作用。

信息是对在某一过程中人们认识不确定性减少的量度,记为I=S(Q/X)-S(Q/X′)。该过程前对Q事件知识为X,其不确定性S是Q及X的函数,过程后对Q事件的知识为X′,不确定性的减少即为信息。

在这里不考虑信息的质,一般可将信息定义为

                            (4)


其中为第i个状态出现的概率,对i取和遍及所有可能的状态,通常取K=1。此公式物理意义在信息熵的讨论中再详细进行分析。

这里仅从电报通讯简单的分析中来看一下信息定义。在通讯过程中,每个字符通常有·、—,两种可能性,一个16个字符的电码排列有种可能性,按照前定性讨论,收到电码,将种可能性去掉,因此得到信息量可以定义为,也可定义为

按人们对信息的习惯看法,认为两个独立事件提供的总的信息量,应等于各事件提供的信息量之和。一个14字符和一个2字符组成16字符的电码它们信息量之间的关系,按人们希望应是

                             (5)

按对数定义信息


  

因此人们采用对数形式来定义信息量。一般每个字符都只有两种可能,一个电码n个字符组成,则总的排列有个,采用以2为底对数计算非常方便,有=n,其信息量与字符长短有直接关系。以2为底对数表达式得到信息量值单位称为bit。n个字符组成电码信息量为

        (6)


也可另外考虑,每个字符中一个符号出现的概率为,在n个字符电码中一种符号排列出现的可能性为,按照公式(4)可得

       (7)


与(6)结果一样,这表明对于系统各种可能性出现概率一样时,(4) 定义与我们给出的从实际问题分析得出的定义(6)一样。对于各种状态出现可能性不一致时,(4) 信息定义仍然适用。(4)信息定义告诉我们,系统各种可能性分布均匀时,所得信息量大,各种可能分布不均匀时,信息量小。

信息传输理论主要在通讯理论中进行讨论,申农(Shannon)针对如何使有限的码元能够传递尽量多、错误少的信息方面作了大量工作,提出了有关编码的三个定理:即①无失真信源编码定理,定理讨论了信息熵与编码长度的关系,提出了在一定情况下,如何使码元最少的理论;②信道编码定理,定理讨论在给定信道时,如何寻找一种编码方式,使译码错误任意小;③限失真信源编码定理,定理讨论失真度与信息传输率的关系。这些理论构成了现代通讯理论的基础,从这些理论可以看出信息论的实质是研究信息系统的控制、管理、优化等问题。

由于科学技术的不断发展,又提出了广义信息的概念,它已经不能用公式(4)来描写。人的一个动作、一个声音都构成信息,信息是和人们思想基础、接受情况有关系的。一个手势,对不同的人有不同的意义,对不了解情况的一般人信息为零,对事前约好的人之间就存在信息,故它的信息量大小也就无从说起。因此在讨论广义信息量时需要综合考虑信源、信道、信宿三个因素,不能只谈信源包含多少信息。当然这方面的工作还需要努力,才有可能对广义信息提出一种定量计算的方法。

总结有关系统科学在技术基础层次上的内容,可以看到这些理论适用于比较简单的系统,它们具有一些比较明显的特点:

1)系统内各部分之间关系简单,一般为线性系统

控制论主要讨论机械、电子系统;信息论主要讨论电报系统;运筹学也仅讨论经济生产中一些简单的数量关系系统。

2)控制对系统的作用是1—1对应的关系

外界与系统的作用可用代数式或微分式等数学关系给出,在一定环境下系统的演化可通过数学公式的计算给出。对于一个控制系统,给出系统的演化目标,可以找出相应控制的表达式,使系统能沿着我们事先预定的道路前进。

3)这些理论讨论的都是渐变的过程

系统状态变量是时间的连续函数,基本上不讨论系统状态出现结构变化的突变情况。

实际系统的演化是非常复杂的,后面我们讨论系统理论的内容主要是复杂系统的演化规律;非线性系统的演化行为;控制作用不明显,靠系统内部自组织作用形成新结构的过程特点;系统有多个演化结果,演化道路与控制不是1—1对应时系统的演化特点;系统发生突变的特点和行为。我们有理由相信,今后在应用层次上所包括的内容应该更多,特别应有复杂系统演化在应用层次上的内容,比如复杂系统的系统工程,控制复杂系统演化的理论等。

5
线性代数

矢量空间、线性变换和线性算符、线性方程与本征值问题、抽象矢量,从算术计算到代数表达式,从代数表达式到具体的三维空间的变量,从具体的三维空间的变量到抽象的不一定在物理空间中的矢量,我们对于数学对象的描述是一个不断地深入和不断地抽象化、一般化的过程。同时,所有的数学计算到最后确实还需要具体的数字来代表。沟通这个从具体到抽象,再从抽象到具体的桥梁就是矢量空间和线性代数。

我们通过邻接矩阵或者概率转移矩阵的乘法来表示间接联系;我们还会在word2vec的例子里面看到由于我们希望给一个词语一个可计算的数学表象,并且这个表象最好还能够做加减法能够计算两个词语相似程度,我们也用了矢量来表示;我们还会看到用矩阵和矢量来描述操作和状态的例子。例如,数学上如何建立一个计算如下过程的定态的表象:有两个盒子A, B 里面分别放了红色白色r,w两个球,然后,我们每次从每个盒子里面拿出来一个球,以q的几率交换,以(1 ? q) 的几率不交换两个球。以后我们会看到这个问题将来会表达成为一个Markov 过程状态转移矩阵的本征向量的问题。大量的现象都可以用矩阵和矢量这个数学结构来表示。

此外,数值线性代数也是其他所有的计算技术的基础之一(另外三个是Monte Carlo 方法、神经网络和FFT——快速Fourier 变换)。如果你了解高性能计算,你就会知道所有的高性能计算软件的基础都是BLAS 和Lapack两个线性代数包。

6
概率论
确定性的事件可以看成随机事件的一个特例,服从δ分布的一个特例。所谓δ分布就是在给定时刻这个“随机”变量仅有一个可能取值。在这个视角下,所有的经典事件都由概率论描述。从古典概型,我们已经知道随机事件可以用随机变量来描述,离散随机变量的每一个可能取值对应着一个概率,连续随机变量可以用概率密度分布函数描述,同时离散和连续随机变量都可以用累积概率分布函数来描述。概率论最核心的性质是概率叠加原理:互斥事件的加法。随机变量的测量是一个基本上所有的教材都不讨论的问题,但我们认为关于这个问题的认识非常重要。例如考虑这样一个事件:扔出骰子并且骰子的某一面,例如6 这一面向上之后,观测这个正面的值,然后我们说这个随机事件的概率分布就是6 这一面100%,其他取值的概率为零。那么是否意味着在观测之前的概率分布每一面都是16是错误的呢?我们认为,如果认为是错误的,则是对概率论和随机事件非常错误的理解。在原来的这个硬币的状态到后来的这个硬币的状态之间,存在着一个操作:测量。测量的前后,硬币的状态确实原则上可以发生改变的。在测量之后,确实硬币的状态是100%取值为6,但是并不意味着测量之前的状态的描述也发生了改变,大多数经典客体的状态在测量前后不发生改变。这一点,原则上,没有必要对于随机客体还保持。

原则上,我们允许这个世界上存在着真正随机的客体。然而,如果真的存在,那么我非常怀疑,一个没有深刻理解概率论的学者,可以理解这个世界的任何部分。统计学对于系统科学的研究者来说尤其重要。我们要面对大量的实际数据,我们要从实际数据中发现规律,有的时候还要建立模型来理解数据背后的故事。这些任务,不很好地理解统计学,就不可能完成。Monte Carlo 和统计学其实是一个硬币的两面,相反相承。在Monte Carlo 和统计学中,我们都会注意到系综这个概念的重要性。

7
力学和统计力学
经典力学(在这里不包含相对论),作为一个学科分支,基本上已经停止发展,除了个别的理论领域,例如湍流的形成以及多体系统的轨道等;以及一些应用领域,例如流体力学、结构力学等。那么,我们为什么还要学习经典力学呢,而且所有的物理以及相关专业学生都要从经典力学开始学起呢?力学,对于物理学来说,除了知识,更重要的它是一门物理学导论课。从思想上,经典力学让我们了解什么是物理学。物理学就是描述物体状态(包含运动状态和结构状态等)的变化,以及寻找导致物体状态变化的原因的科学,以及了解把事物抽象成理想模型的观念。从概念上,我们知道运动的描述、建立位形空间、坐标系、相对性原理、力、能量、保守系统等概念;从技术上,我们将学习到最小作用量原理,分析力学的技术,这些技术将来在整个物理学里面都非常重要。

那么,系统科学为什么要研究力学呢?技术上,分析力学的技术和把一个问题转化为极值优化问题的方式值得我们学习。思想上,力学的思想,从状态的描述到状态发生变化原因的研究思路以及把事物抽象成理想模型的观念,不仅仅是物理学的思想,而是整个科学的思想。当然,具体概念的层次,有可能不太重要,但是,如果没有这些具体概念,我们的思想和技术就是空中楼阁,或者无皮之毛。
统计物理学主要内容是系综理论,从系统的Hamiltonian 开始,状态分布函数是怎样的,如何计算出来配分函数,并用配分函数来计算一些统计平均量和讨论相变。同时,当配分函数难以计算的时候,为了避开配分函数计算的Metropolis 方法,并用它计算了统计量研究了相变。这些就是统计物理学的核心内容。除了这些核心内容,统计物理学的基础问题:到底平衡态是从哪里来的,什么条件下系统会处于平衡态,这是从力学到统计力学的问题。

熵是来源于热力学或者说统计物理学的一个具有一般意义的概念。实际上,对于任何分布函数,熵都是一个重要概念,熵也是信息科学的基本概念。系综是另一个来自于统计物理学但是实际上对于任何分布函数都是有意义的重要概念。相变是另一个来源于热力学和统计物理学的一般性概念。

统计物理学是一个从微观到宏观的桥梁,当有了系统的微观运动方程,又需要研究系统的宏观性质的时候,往往我们可以借鉴统计力学,尤其是从微观状态的动力学描述,变成分布函数的动力学描述,这是研究角度的转变。很多问题的研究中,可能需要做这样的转换。此外,Boltzmann 分布也是系统科学研究者经常用到的一个分布函数。

8
量子力学

量子力学(Quantum Mechanics),是研究物质世界微观粒子运动规律的物理学分支,主要研究原子、分子、凝聚态物质,以及原子核和基本粒子的结构、性质的基础理论。它与相对论一起构成现代物理学的理论基础。量子力学不仅是现代物理学的基础理论之一,而且在化学等学科和许多近代技术中得到广泛应用。19世纪末,人们发现旧有的经典理论无法解释微观系统,于是经由物理学家的努力,在20世纪初创立量子力学,解释了这些现象。量子力学从根本上改变人类对物质结构及其相互作用的理解。除了广义相对论描写的引力以外,迄今所有基本相互作用均可以在量子力学的框架内描述(量子场论)。

量子力学并没有支持自由意志,只对于微观世界物质具有概率波等存在不确定性,不过其依然具有稳定的客观规律,不以人的意志为转移,否认宿命论。第一,这种微观尺度上的随机性和通常意义下的宏观尺度之间仍然有着难以逾越的距离;第二,这种随机性是否不可约简难以证明,事物是由各自独立演化所组合的多样性整体,偶然性与必然性存在辩证关系。自然界是否真有随机性还是一个悬而未决的问题,对这个鸿沟起决定作用的就是普朗克常数,统计学中的许多随机事件的例子,严格说来实为决定性的。

在量子力学中,一个物理体系的状态由波函数表示,波函数的任意线性叠加仍然代表体系的一种可能状态。对应于代表该量的算符对其波函数的作用;波函数的模平方代表作为其变量的物理量出现的几率密度。

量子力学是在旧量子论的基础上发展起来的。旧量子论包括普朗克的量子假说、爱因斯坦的光量子理论和玻尔的原子理论。

量子力学基本的数学框架建立于:量子态的描述和统计诠释、运动方程、观测物理量之间的对应规则、测量公设、全同粒子公设的基础上。

在量子力学中,一个物理体系的状态由状态函数表示,状态函数的任意线性叠加仍然代表体系的一种可能状态。状态随时间的变化遵循一个线性微分方程,该方程预言体系的行为,物理量由满足一定条件的、代表某种运算的算符表示;测量处于某一状态的物理体系的某一物理量的操作,对应于代表该量的算符对其状态函数的作用;测量的可能取值由该算符的本征方程决定,测量的期望值由一个包含该算符的积分方程计算。一般而言,量子力学并不对一次观测确定地预言一个单独的结果。

取而代之,它预言一组可能发生的不同结果,并告诉我们每个结果出现的概率。也就是说,如果我们对大量类似的系统作同样地测量,每一个系统以同样的方式起始,我们将会找到测量的结果为A出现一定的次数,为B出现另一不同的次数等等。人们可以预言结果为A或B的出现的次数的近似值,但不能对个别测量的特定结果做出预言。状态函数的模平方代表作为其变量的物理量出现的几率。根据这些基本原理并附以其他必要的假设,量子力学可以解释原子和亚原子的各种现象。

量子的世界你会学会用概率的视角来看问题,而且还要被迫超越概率的视角。在经典的世界里面,概率仅仅是一个工具--在信息不完全的情况下的一种技术描述手段。在量子的世界,我们会看到这个技术描述手段所带来的理解上的问题和挑战,以及这个技术手段的必要性。甚至,我们还会看到,用概率也不足以描述量子的世界。量子力学是一扇门,打开你用不同的眼光看世界的一扇门。从量子力学中数学结构和物理现象的关系上,你能更加深刻地体会什么是科学。从量子力学能够体会到物理学或者说整个科学就是给现实世界寻找合适的数学结构,不管这样的结构多么不符合来自于经典世界经验的直觉。科学就是把批判性思维、数学和测量用于现实,尊重现实,构建模型,并且注意模型的系统性--尽量少的假设能够解释尽量多的事实,同时模型之间尽量不要有冲突。对科学、数学、现实、批判性思维、测量之间的关系的理解,对于系统科学的研究者是非常有意义的。

9
随机过程

物理系统的力学方程不管经典力学还是量子力学都是确定性的。但是,经典力学Liouville 方程描述的是密度分布函数的演化,密度分布函数可以做几率解释;量子力学Schr?dinger 方程描述的是密度矩阵的演化,密度矩阵可以做几率解释。那么有没有系统在本质上就需要包含随机性的方程呢?如果有,怎么处理呢?

根本上是否存在随机系统是一个哲学问题,我们不讨论,尽管我们已经看到在量子力学中看起来一旦测量就会带来根本上的随机性。我们讨论在描述的层次,什么时候需要随机描述。考虑一个完全确定的力学系统:一群小分子连着一个大热浴,就像我们在统计物理学中经常见到的正则系综。整体必然满足确定性的力学方程。但是,如果我们只关心这群小分子,而不去测量大热浴的状态,那么这群小分子就好像是处于一个满足正则系综分布的随机个体。我们抛硬币,确实每一次的力学过程都是完全确定的,但是1对于时间离散过程,t 就是一个参量。对于每一个给定时刻t,dx (t) 就是通常的微分。初始速度的大小和方向,空气阻力的细节,我们不能完全控制,于是这个硬币离随机个体差不了多远。所以,环境和初始条件不可完全把握,可以造成描述上的随机性。随机性描述的层次有可能还有一个来源,演化方程对应的轨道存在不稳定性:两条某段时间离的很近的轨道,在其他时间可以离得很远,或者反过来。随机性还可能存在别的来源,例如量子力学的测量,每次总是会选择一个被测量算符的本征态,但是选择哪一个是不确定的。这个过程是否存在更深刻的确定性描述我们还不知道,但是至少在描述的层次,这里是有随机性的。所有的这些随机性,都会导致我们需要随机性的描述。

换一个角度思考,我们看到,经典力学可以采用随机描述的框架(Liouville方程),量子力学可以采用随机的描述(Liouville-von Nuemann方程),所以随机描述是力学系统的正常的描述。当然这些方程本身都是确定性的,仅仅是方程描述的变量可以做随机解释。在这个意义上,就算在一个非常明确的力场中的确定性的经典力学系统,我们也完全可以用随机描述来讨论它。结合这两个方面的因素,我们说,随机描述才是描述的主要手段,确定性的描述仅仅是一个特例。

我们发现,确定性的力学过程完全可以等价地用相空间分布函数的演化方式来描述,而统计力学的根本问题就是这个相空间分布函数的定态分布的问题,而且统计物理学的Metropolis 方法就是构造某个随机过程然后得到这个随机过程的稳态,进而量子力学也是一个概率意义上的描述(只不过,这个概率的简单事件满足态的直接叠加原理而不是概率论性叠加原理)。因此,我们说力学、统计力学和量子力学就是概率论(量子概率论,或者说满足态叠加原理的概率论)。在统计物理学中还有一个很重要的分支我们没有谈到:扩散和输运等非平衡过程的统计力学研究。这样的现象的例子有液体中花粉粒子等悬浮小颗粒的扩散,温度不同的两个热浴连着的一个管道上流动着的热流等等。这些过程也可以通过随机过程来描述。花粉粒子运动的数学模型就是Brown 运动。

很多物理学实际上就是随机过程,而随机过程也从物理学的研究中获取进一步发展的动力和方向。Markov过程是随机过程的一个重要代表。当然还有其他一些例子,比如Wiener 过程,Brown 运动,Ornstein–Uhlenbeck过程,相关的概念和技术:转移概率,转移速率,稳态分布,Fokker-Planck 方程,随机微分方程,Langevin 方程,Master 方程,Monte Carlo 方法。

※ ※ ※
创新体系工程基础理论和方法
推动系统工程理论再发展

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多