分享

话题1:面对无处不在的纷繁现象,如何选题?

 遇见数学 2021-12-12
  1. 如何发现问题和提出问题?有没有什么策略?
  2. 如何判断一个选题好不好?有没有判断准则?
  3. 问题的确定是不是一定发生在问题解决之前?
从数学建模的过程来看,首先需要面对的就是从自然或社会现象中发现问题并提出问题——发现问题和提出问题并不是一回事,前者侧重于发现,后者则侧重于提出;擅长“发现”不见得擅长“提出”,因为“提出”需要选取适当的形式和语言,关注适当的方面;擅长“提出”也不见得擅长“发现”,因为“发现”需要敏锐的观察力和强烈的好奇心;发现问题和提出问题是最基本的科学素养,也是各类各级数学建模教育教学首要培养的能力。
我们世界有无数的现象,每个现象又含有无数的数据,我们甚至无法穷举某个简单事物的所有方面。例如一个鸡蛋,它有质量和体积,温度和颜色,营养和口感,这些都因鸡蛋的不同而变化,甚至任意两个鸡蛋壳表面气孔的多少与分布也不尽相同。还能举出无限多的关于鸡蛋的或微观或宏观的数据,它们构成我们思考鸡蛋的无限多个方面。但是奇妙的是,虽然这些方面具有无穷的数量,乃至于不可能在有限时间内枚举完成,但我们并不会因此而无法识别鸡蛋。甚至大多数时候,只需要不到一秒钟,我们就能从家里的冰箱中完成对鸡蛋的识别。
但是这种自信有时候只是一种短暂的自我催眠。请考虑下面的三个任务,并思考完成这些任务你所需要的时间,以及估计完成后结果的准确率。
任务 1:你的面前放着一枚白皮鸡蛋和一枚白皮鸭蛋,但是并不知道哪个是鸡蛋哪个是鸭蛋。请你从中选出鸡蛋。
任务 2:你的面前放着 枚白皮禽蛋,已知其中有 枚白皮鸡蛋和 枚白皮鸭蛋,但是并不知道哪些是鸡蛋哪些是鸭蛋。请你从中挑选出所有的 枚鸡蛋。
任务 3:你的面前放着由白皮鸡蛋和白皮鸭蛋混合的 枚禽蛋,并不知道其中鸡蛋和鸭蛋各自的数量,也不知道哪些是鸡蛋哪些是鸭蛋,只知道禽蛋的总数为 枚。请你从中挑选出所有的鸡蛋。
很明显,上面的三个任务无论是从工作量还是难度上都是逐渐增加的。任务 2 虽然比任务 1 的工作量大,但是因为知道鸡蛋的总数,所以使得结果出错的概率大大降低——只需核对挑选出来的鸡蛋的个数是否是 ,就能检查出许多情况下的错误。但对于任务 3 来说,除非是训练有素、经验丰富的商户和主妇,否则很难打包票自己的挑选结果一定 准确无误。
我们仔细思考一下,从任务 1 到任务 3,所需要调用的识别工具——鸡蛋和鸭蛋的区别——到底发生了哪些变化。因为规定了鸡蛋和鸭蛋的颜色相同,所以我们可以从大小、重量和形状上进行区分:鸭蛋一般比鸡蛋大一些也重一些,且鸭蛋更接近椭球形而鸡蛋更接近球形。
在任务 1 中,我们只需要调用大小、重量和形状中的一个方面,就能得到结果,当然我们可以再用剩余两个方面中的某个来检验结果,从而提升判断的准确程度。到了任务 2 中,因为所需选择的鸡蛋数量增加,而大小、重量和形状这三方面都是统计结论,这就使得依靠单一方面的判断变得十分可疑。具体来说,单从大小而言,即使 的鸭蛋大于 的鸡蛋,也有大约 的鸭蛋和鸡蛋无法单纯通过大小来准确识别。对于重量和形状都是如此,我们不妨假设使用单独每个方面的判断准确率为 。这时候我们如何去提升判断的准确率呢?
一个简单的办法是同时使用大小、重量和形状这三方面进行交叉判断:如果其中超过半数( 个或 个)方面的判断结果为鸡蛋,就判定为鸡蛋,反之则判断为鸭蛋。不难计算这种方法的判断准确率为 ,这比使用单一方面判断的准确率提升了
利用中学学习过的向量知识可得另一个有效提升准确率的途径。具体来说,我们将大小、重量和形状三方面的判断结果(“鸡蛋”或“鸭蛋”)用数字 替代,这样每一次的判断结果就是一个由数字 组成的三维向量 ,其中 。如果这个结果向量作为三维坐标距离点 比距离点 更近,就判定为鸡蛋,否则判定为鸭蛋。不难证明这种方式和刚才的方法其实是等价的,只是换成了一种偏几何味道的描述。
对于大千世界的认识,通常都要归结到判别和分类。例如解某个实数方程,可以看作是将实数进行分类(分为解和非解);解某个微分方程,可以看作是将函数空间进行分类;认识某个人,可以看作是提取其特征,得到某种判别法则,便于再见到时从人群中判别;看病的全过程也是在不断地判别和分类,从挂号挂哪个科室,到分诊到哪位医生,到诊断出是什么疾病,到哪些药物适合这种疾病,检查还是不检查、住院还是不住院、手术还是不手术。甚至学做饭也是学习判别和分类——首先是对食材分类,哪些食材适合这道菜,哪些不适合;然后是对预处理方法进行分类,哪些菜切丝,哪些菜焯水,哪些菜打糊;还有先后顺序和火候的分类。可以说,我们人类对于自然的认识,就是完全建立在无数的判别和分类之上。
我们难以对判别和分类进行语义区分,它们之间即使不互相等价也是互相融合。但从前面鸡蛋和鸭蛋的例子中,我们至少可以提炼出判别和分类的四个特点:
  1. 一件事物的特征很多,选取不同的特征会得到不同的判别和分类方法;
  2. 依据事物特征而做的判别和分类可能会出错,从多方面综合判断可以提高准确率;
  3. 面对不同的任务,需要考虑不同的特征数量和方面,实践难度也不同;
  4. 等价的判别和分类方法可能有不同的数学表述。
回到数学建模来说,上面的四点总结可以有效地帮助我们发现和提出问题,具体来说可分为如下的六步:

第 1 步:选择生活中的某项事物。最好是根据兴趣选取,如果没有兴趣也可暂且随机选取。

第 2 步:罗列这项事物中所包含的方面,例如:体积、重量、颜色、材质、结构等等。

第 3 步:思考一个辅助问题——如何将这项事物从其它的事物中判别和分类出来?都能想到哪些方法?这些方法又针对事物的哪些方面?

第 4 步:通过对第 3 步中辅助问题的思考,对事物所包含的诸多方面进行再筛选,去掉不感兴趣或作用不大的那些,必要时可以利用基本假设简化事物所处的环境。

第 5 步:思考另一个辅助问题——这些筛选出来的方面能够为我们利用这项事物提供哪些便利?能够帮助我们优化?还是预测?还是能够帮助我们挖掘事物的运行法则?等等。

第 6 步:将第 5 步中辅助问题的思考改写为问题的形式,以自然语言的形式呈现出来。

这里举一个具体的例子便于读者参考。我现在正在敲击我的笔记本电脑键盘,我就索性以它举例。这个键盘有很多的方面:按键的颜色、面积大小、几何形状(我的笔记本电脑键盘按键呈略微的弧形)、按键间距、排列顺序、背光亮度、材质手感、按动键程等等。其中我对颜色、几何形状、背光亮度、材质手感和按动键程不感兴趣,对余下的面积大小、按键间距、排列顺序感兴趣。这三点的优化从直觉上可以避免误触,提升打字的速度。于是一个很好的问题就出现了:如何对键盘的按键面积、间距和排列进行优化,以提升打字速度?
有读者可能会疑惑:过程我都懂,但是你为什么最后选择了“提升打字速度”这个目标,并且集中考虑按键的“面积”、“间距”和“排列”这三个方面呢?如果选择“让键盘看起来更美观”这个目标,从而考虑“颜色”、“形状”和“背光”就不行吗?
当然可以!这个“看起来更美观”的问题,不仅是个实在的问题,而且还是一个很好的问题!甚至对于某些以生产潮流消费品的企业而言,这个问题比“提升打字速度”要更加重要。
就问题本身而言,没有好坏之分。一个人希望“优化”铅笔的构造以达到“能用铅笔喝汤”的目标,也是一个实在的问题,甚至解决起来一点也不容易。
但是人类的数量和生命是有限的,而问题的数量是无限的。在有限人类的有限生命中,无法解决所有的问题,所以人们就需要选取一些“更有价值”的问题来解决。这种价值是人所赋予的,不是事物的自带属性——对于大自然而言,我们不能说一双塑胶鞋比一堆落叶更有价值;同时这种价值也带统计属性,一个人认为有价值的事物,可能其他人并不这样认为,人类社会不会将资源倾斜于极少数人的偶然想法,除非这个想法可以被论证在将来能够在较大范围内发挥作用。虽然这种运行机制会造成个别天才在某个历史阶段的埋没(在数学上,阿贝尔和伽罗瓦在生前都未曾获得应有的学术地位),但是这些金子般的想法不会被一直埋没,总会在适当的历史阶段被重视起来——但是前提是,它真的是金子,而非某些人自以为是的想当然。
放到数学建模当中来看,如何判断所提出的问题是否是一个好的数学建模课题呢?下面的五条判断准则可供参考。符合的条目越多,该问题是一个好的数学建模课题的可能性就越大:
准则 1:非数学不可察。即不用数学模型的方法就很难将这个问题描述和研究清楚。现在有很多人为了发论文,将一些模型伪装成数学模型的样子,但是其实并不是数学模型。例如高中生物教材中有一个实验,观察生长素浓度与发芽率之间的关系。有的老师将实验数据点描绘在平面直角坐标系中,看到随着生长素浓度提升,发芽率先增加后降低的规律,并且在 中找到某条光滑曲线实现了较好的数据拟合,当作 课程样例发表。但是其实这并不包含数学模型,顶多算是生物学模型。因为并不需要使用数学模型,就能够通过实验数据直接看出“随着生长素浓度提升,发芽率先增加后降低”这个结论,而进一步的数据拟合并没有告诉我们任何新的规律——实际上,“拿到数据就拟合”的处理方法甚至是缺乏最基本的科学素养的,因为数据拟合最重要的前提是拟合函数型要有实际意义,并不是拟合得越好就是越好的拟合函数——但是如果继续研究,通过机理建模和科学规范的数据分析,得到“发芽率的相对变化速度(即发芽率的瞬时变化速度与当前时刻发芽率之比)与生长素浓度的数量级成线性关系”,这个结论就是非数学不可察的结论,这个结果蕴含了刚才的生物学结果(即后者可以由前者通过代数变形得出),属于更深一层的规律,难以通过生物实验直接观察得出。所以一个问题是否满足“非数学不可察”这一准则,除了问题本身的提法以外,还取决于研究的深度和方向。
准则 2:能为人们更好地了解自然奥秘提供新方法。牛顿创立微积分之所以伟大,是因为微积分开启了研究科学规律的一把新钥匙。从微积分开始,人们得以使用微分方程(组)来描述自然过程,将自然界的规律描述为某个微分方程(组)的解。但是直到麦克斯韦的电磁学方程组广为流传之前,人们还有一个樊笼没有打破——就是认为自然规律是首先被发现的,再用数学模型来描述。在此之前历史上的很长一段时间里,人们接受通过数学模型对于现象的预测,但是并不接受通过数学模型对于规律的揭示。这里面有宗教的原因,也有对于亚里士多德的古典科学研究范式的固执坚持的原因,后者直到 17 世纪依然是科学研究的主流方法。随着麦克斯韦方程组的提出和实验例证,人们发现自然规律是可以作为数学模型的解被挖掘的。数学模型不仅可以描述和优化,也可以用来预测,甚至可以帮助人们看到未曾看到的规律。从研究方法的革命性作用来看,微积分和麦克斯韦方程组值得位列历史上最重要的那些数学模型之列(即便不是其中最重要的两个的话)。
准则 3:引入新的数学结构。新的数学结构往往出自对一个好问题的研究过程中,这也是为什么人们说一个好的问题往往能够引导一个领域的走向。一个典型的例子是波动方程的建立。波动方程是一个二阶偏微分方程,实际上是牛顿第二定律在时空中的推广。它的形式虽然简单,其解的理论却十分丰富,为物理和数学的发展注入了很大活力。实际上,著名的薛定谔方程就是将物质波的概念和经典波动方程相结合的产物,通过它人们得以计算任何微观粒子作为波的具体函数形式,并确定其所处的能级。从这个意义上来讲,波动方程的建立,是一个非常好的数学建模案例。当然,对于中小学生而言,通过数学建模引入数学中尚未发现的新结构无异于天方夜谭,但是我们完全可以启发学生从数学建模课题中挖掘出他自己尚未学过的数学结构。例如:我们可以给高中生讲药剂量模型,这个模型旨在优化医院的给药时间表和药剂量配比,在做出一些合理的基本假设(例如假设药物是通过针剂注射,这样可以假定注射后血液中药物浓度是瞬间提升的,得以忽略缓释过程)之后,这个模型可以转化为一个多阶段递推模型——每个阶段内是类似于指数衰减的连续模型,用以描述药物进入人体后被吸收的过程;各阶段之间依靠数列递推来反映药物注射的瞬时效果;上一阶段结束时血液中的药物浓度叠加上新注射的药物浓度,作为后一阶段开始时血液中的药物浓度。这个模型中的数学工具对于一个高二学生而言十分简单,但是却带来了一个深刻的数学结构——局部的连续模型可以通过代数的方式(数列递推)“粘连”为一个整体模型。这个数学结构很难在传统数学课本中找到,但是却在现代数学中发挥了十分重要的作用。实际上,用代数群将局部的几何特征粘连起来从而得到新的几何对象,是现代数学中的一种重要方法。
准则 4:研究结论和方法能迁移到其它领域。一个好的数学建模课题往往具有某种泛性,代表它具有良好的可迁移程度。1997 年美国教育评价专家韦伯提出“知识的深度”(Depth of Knowledge,DOK)的概念,将知识深度分为四个等级,从低到高分别为“回忆与再现”、“技能与概念”、“问题解决及应用”和“思维迁移与创造”。实际上,迁移与创造属于同一水平,并没有像很多人以为的迁移比创造更简单,因为迁移中包含了相当一部分创造的成分。当学生将一个理论中的结论或方法迁移到另一个领域中时,首先需要挖掘出原有理论的基本假设和适用范围。目标领域和这些基本假设和适用范围相契合,是进行迁移的前提。但是这种契合并非总是简单对应,往往需要通过搭建新的概念来实现不同领域间信息的“翻译”。一个我身边的例子发生在 2014 年,那一年的全国大学生数学建模竞赛中有一道赛题是“储药柜的设计”,要求用尽可能少的储药空间实现药物的随取随用。我的一位学生(当时他刚上高二)在做这道题目时,将物理学中的电通量的思想迁移到这个问题中,将不同体积的药盒看作是带有不同电荷的粒子,从而创造性地解决了这个问题。另一个例子来自生态动力学,其中的一个经典结果是 Lotka-Volterra 原理,它指出:在一片草原上,如果适量捕猎兔子,则狼在周期内的平均数会减少,但兔子在一个周期内的平均数却增加;如果适量捕猎狼,则狼在周期内的平均数反而会增加,且兔子在一个周期内的平均数也会增加。这个反直觉的结论可以通过一个微分方程组严格证明出来,并且成为畜牧业的理论支撑。到了上世纪 60 年代,Richard Goodwin(1965,1967)的工作使得 Lotka-Volterra 原理从生态学范畴走进经济学,用以描述工业部门或企业间的合作与竞争。现在,随着互联网经济和电子商务的发展,Lotka-Volterra 原理及其模型又被引用来分析不同电子商务平台的发展。
准则 5:所得结果能提升人们的幸福感或有利于生活生产。还有一些数学模型,可能不具备新的数学结构,也无法迁移到其它领域,但是却能解决生产生活中某些人们关心的问题,提升人们的幸福感,提升生活质量或生产效率,这样的模型和课题也是十分出色的。对于学生而言,很难在初学时就挖掘出重要规律或解决重大问题,这时从身边日常生活中的小事开始做起就是很好的选择。例如在某一年的北京联校数学建模活动中,就有学生研究“卫生卷纸一小节多长最好”,通过优化厕所卫生纸的单节长度,在方便人们使用的同时避免资源浪费。其中所使用的数学不见得十分深刻,但是也反映出了数学在社会生活中的作用,不失为一个很好的建模课题。
有的读者可能会产生疑惑:刚才说的五条准则的判断对象到底是“数学模型”还是“引出数学模型的选题”呢?这一节的内容不是关注于“如何发现和提出问题”吗?为什么对于好问题的判断准则看上去似乎也可以拿来判断解决方案的好坏呢?难道不是先把问题想好才能着手建立模型吗?如果我通过模型的作用来判断选题的好坏,难道不是一种类似于循环论证的逻辑错误吗?
当年我在念大二的时候,系主任给我们说了一段话,让我们无论如何记住并在生活、学习和工作中不断体会。惭愧的是,直到本科毕业前,我对它们依然没有任何体会,但是后来随着人生阅历和研究经验的增多,逐渐发现里面蕴含了无穷的哲理,也不断指导着我突破各种困难和认识边界。下面我将这四句话分享给读者,并将通过它们来解答刚才提出的疑惑。它们是:
原因的原因不一定是原因,结果的结果不一定是结果; 
原因不一定在结果之前,结果也不一定在原因之后。
回到刚才的疑惑:“难道不是先把问题想好才能着手建立模型吗?”很遗憾,这个问题的回答通常而言是否定的,尤其是对于原创性较高的研究工作更是如此,任何有过原创性研究经验的人都毫无疑问会同意这一点。我们下面举两个例子来说明,它们中的一个来自于大数学加布尔,另一个来自我的几位高中生学生。
提起布尔,我们通常指的是英国数学家和哲学家乔治.布尔(George Boole,1815-1864),他在 1854 年发表的《思维规律》中提出了日后被称为“布尔代数”的数学结构,并逐渐成为计算机、数字电路设计和数理逻辑的通用语言。可以说,没有布尔代数,也就没有现代计算机。但是当时布尔的研究初衷,是希望使用集合语言的形式结构帮助澄清和概率有关的一些事件描述,用以解释当时还缺乏严格性的概率论中的某些命题。但随着研究的深入,这位从小学教员出身的自学成才的旷世奇才并未能给概率论带来严格的基础(虽然后来柯尔莫哥洛夫建立概率论基础时采纳了布尔的思想),反而其研究逐渐导向更普遍的形式逻辑问题。这个例子表明,问题的提出往往是伴随着这个问题的解决过程而不断进化的过程,而非“一锤定音”。前些年我们国家有些部门指定科研人员按照领导给出的“创新蓝图”去研发,这是十分荒谬的。只要是创新,就不可能有“蓝图”——如果我们上来就知道要研究什么、能研究出什么、能研究到什么程度,那只能说明这项研究是在复现前人的成果。实际上,任何原创研究在一开始都是“前景模糊”的,人们不但不清楚继续研究会面对什么,绝大多数时候也并不清楚是否会研究出结果,甚至连问题的提法和研究方向都一头雾水。所以我们才把研究叫做“Research”,从词根来说就是“不断地寻找”。寻找什么呢?在研究的过程中不断寻找方向,不断寻找问题的更好提法。爱因斯坦说“提出问题比解决问题更重要”,并不是指没有问题就没得可研究,而往往在于没有深入研究就无法将问题以正确的形式提出。
另一个例子来自我 2016-2017 年的几位学生。当时我所管理的数学建模实验室和国文科保公司建立了合作协议,这家公司是一家具有甲级资质的文物保护科技公司,当时该公司正承担齐云山摩崖石刻的保护工作。齐云山位于安徽省黄山市,是中国四大道教名山之首,因其山体上分布着数量庞大的古代文人摩崖石刻而闻名于世,其中乾隆的巨幅“寿字碑”可能是最为出名的一处景观。包括摩崖石刻在内的室外石刻文物保护一直以来有个难题,就是“不破坏不保护”——因为缺少预测石刻文物何时损坏的方法,往往只能采用“亡羊补牢”的方式,在发现文物破损之后立刻修复。但是这样一来,随着损坏后修复的部分越来越多,本来历史悠久的文物就会经过这种“新陈代谢”的过程变成“现代复制品”,这样就会使其研究价值大打折扣。于是建立一个“摩崖石刻文物预警系统”就是一件很有意义且迫切的事。受国文科保公司委托,我先后分两年带领我的几位学生利用假期时间到齐云山实地建模,最后给出了一个可靠的基于各项检测指标的预警指标系统并发表。但是在建模过程中,我们对研究方向三易其稿——在一开始包括我们、国文科保公司的工程师以及专家学者在内的所有人都不知道这个模型的结果要长成什么样子,也不知道要朝哪个方向建立模型。最初我通过历史数据建立了各检测指标之间的动力学方程,但是在专家答辩时被否定。有意思的是评审专家也是看到这个结果之后才意识到这个并不是他们想要的结果。之后又推翻现有问题的提法,改为寻找能够描述保护前后文物状态的差别的数学模型,但是没有成功。后来又将问题方向改为建立各个指标间加权平均的数字特征,其中权重分布的确定是模型的关键。通过数学上的建模和求解,我们最终得到了一个指标模型,并通过了业内专家答辩。特别印象深刻的是,直到最终答辩现场,包括专家学者、国文科保公司和我们在内的多方,才最终明白我们到底应该研究什么问题。
上面的这两个例子表明:往往并不能够奢望在研究之前就以正确的方式提出问题,甚至往往并不能够提前确定正确的提问方向,适合的提问方式或方向往往需要通过一定的研究,经过不断修订和迭代才能逐渐清晰。这虽然不符合社会大众对于“先提问后解答”的认识,但是却是科学研究的一般规律——实际上,社会大众之所以会形成“先提问后解答”的误解,是因为在传统的数学教学中,从小到大我们所见到的数学问题都是以考试题或练习题的形式出现,而这些题目是已经提好的问题,所以如果没有经过数学建模的训练,就很自然地会产生“先提问后解答”的错误认识。这也是为什么数学建模教育从中小学开始就是必要的原因,它有助于帮助人们脱离应试教育的视野限制,体验科学研究的真实过程。幸运的话,在这个过程中,将逐渐形成庞加莱所说的“面向心智的雅致统一”的审美,这种审美将成为创造更大价值的决定性基础。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多