【原】看一篇数学论文时，我们在看什么？ “论”一个数学家的基本素养

老胡说科学 2022-12-08 发布于江苏

展开全文

数学论文有着非常独特的体裁，这是在 20世纪初建立起来的。一篇典型的数学论文通常都是形式的和非形式的写作的混合物。在理想情况下（但绝非总是如此），作者要写一个可读的引言，告诉读者他能在本文余下的部分里读到什么。如果文章分成几个部分，绝大多数文章，除非太短都会分成几个部分，则若每一部分都以下面的论证的非形式的大纲开始，那对于读者就会很有帮助。但是文章的主要实质部分应该是比较形式、比较详细的，使得如果读者打算花上充分的力气，他就能说服自己∶这篇文章是正确的。

一篇典型的论文的目的是建立起一些数学命题，有时目的仅在于此。例如，论文的价值就是它证明了一个 20年没有解决的猜想。有时，建立这些数学命题是为了一个更广泛的目标，例如解释一个人们理解不够的数学现象。但是，不管是哪一种，数学命题都是数学的主要价值所在。

命题中最重要的通常称为定理（theorem），但是也有些命题就称为命题（propositon），还有时叫做引理（lemma）、推论（corollary）。这些种类的命题很难作清楚的划分，但是它们的字面意思也就说明了怎样区分。定理就是您认为是具有内在的兴趣的命题，它可以从一篇论文里抽出来，例如用来对朋友们讲，在讨论班上作报告。成为论文的主要目标的命题通常就叫定理。一个命题其实也就是一个定理，但是它们时常有点令人“厌烦”。论文里面要去证明令人厌烦的结果，听起来有些奇怪，但是它们可能是重要而且有用的。它们令人厌烦，是由于它们怎么也使人惊奇不起来。它们就是那些我们需要、也希望其为真、证明起来也没有困难的定理。

下面是一个简单的例子，是一个可能更愿意称之为命题的定理。二元运算“*”的结合律指出∶

我们时常把这个定律非正式地说成是“括号不起作用”。然而，尽管它告诉我们，直接写x*y*z也不会引起歧义，可是，如果说a*b*c*d*e也不会引起歧义，就不那么显而易见了。我们怎么知道仅仅因为在三个对象的情况下，括号的位置没有影响，则在多于三个对象的情况，括号也不起作用？

许多学数学专业的大学生读完了大学，还没有注意到这还是一个问题。似乎结合律就表示括号不起作用。他们基本上是对的，虽然并不完全显然，但是证明这一点不会给人带来惊喜，而且结果是很容易证明的。因为我们时常会需要这个简单的结果，又很难称它为定理，把它称为一个命题也还是适合的。

当证明一个定理时，证明时常过长也过于复杂。这时，如果希望有人愿意读下去，就需要使证明尽可能清晰。最好的方法莫过于建立一些子目标，其形式就是位于假设和我们想得到的结论之间的一些中介的命题。这些命题时常就称为引理。举一个例子∶假设想对根号2是一个无理数的标准证明给出一个非常详细的表述。有一个需要的事实就是∶

每一个分数 p/q都等于一个分子分母不同时为偶数的分数，即可将p/q写成r/s，其中r和s不能全是偶数，而这个事实也需要证明。

为清楚起见，你会决定把这个证明从主要的证明中分离出来，并称之为一个引理。这样，就把自己的工作分成了两个分开的工作∶一是证明引理，二是用这个引理去证明主要的定理。可以把这个做法与写计算机程序平行对照起来∶当写一个复杂的程序的时候，一个好办法是把主要任务分成一些子任务，并且各写一个小程序，把这些小程序当成“黑盒子”，以便在用得着的时候让程序的其他部分去访问它们。

有些引理很难证明，而且在不同的背景下也用得着，所以最重要的引理比那些不甚重要的定理可能更重要。然而有一个一般的规则，如果证明一个结果的主要理由在于把它用作证明其他结果的踏脚石，那就把这个结果称为引理。

如果一个数学命题可以容易地从另一个命题导出，就称它为另一个命题的系（或者直接就说是其推论），有时，一个主要定理后面接着几个系，借以说明这个定理的力量。有时，主要定理也叫做系，因为证明的所有工作都是为了证明一个不同的、不那么简练有力的结果，而主要定理可以由它很容易地得出来。如果发生了这种情况，作者应会说明，这个系是论文的主要结果，而其他作者则会称之为定理。

一个数学命题是通过证明来确立的。数学的一个最值得注意的特点就在于可以有证明，例如，一个由欧几里得在大约两千多年前发明的论证在今天仍然被接受为完全有说服力的证明。然而，一直到19世纪末和20世纪初，这个现象才为人恰当地理解，就是直到数学语言被形式化以后。到那时他才可能把证明的概念弄明确。从逻辑学家的观点来看，所谓证明就是一连串的数学命题，每一句都用形式语言写成，而且具有以下的性质∶

最前几个命题是初始的假设，或称前提；这一串中的其余命题根据逻辑的规则，从它们前面的命题得出，这些逻辑规则又如此简单，所以这些推导都清楚地是有效的；
这一串命题的最后一个就是想要证明的命题。

对于实际出现在一篇规范化的数学论文，写在“证明”这个标题下的东西，只是上述关于证明的思想的理想化。这是因为一个纯粹形式化的证明将是冗长而几乎无法卒读的。尽管如此，论证在原则上可以形式化这个事实，为数学大厦提供了非常有价值的支撑，因为它给出了解决争论的途径。如果一位数学家给出了一个奇怪的没有说服力的论证，要看它是否正确，最好的方法就是请他或她作出更加形式化、更加详细的解释。这样做，要么会暴露出错误，要么会使得这个论证更加清楚。

定义

数学论文的另一个非常重要的成分是定义。举例来说，如果要证明一个关于三角形的定理，而且总是需要用到从一个顶点到对边的距离，这就麻烦了，因为总需要说“从A，B，C分别到BC，CA，AB的距离”，这样，就不如选择一个词“高”，并且写道∶“给定三角形的一个顶点，定义其高为从一个顶点到它的对边的距离”。如果考虑的三角形是钝角三角形，就得小心一点，写道∶“给定三角形ABC的顶点A，定义其高为由A到通过B，C两点的唯一直线的距离”。从此以后，就可以使用“高”这个词，而不必说上那一大段话，行文就简洁多了。像这样的定义不过是为简便而给定的定义。

但是，真正有趣的定义是不那么显然，而是一旦有了它，就会用新的方式来思考的那种定义。一个很好的例子就是函数导数的定义。如果你不知道它，对于如何求实的函数

达到最小的正的 x，你的思想就是一片空白。如果你知道了它，这个问题就成了一个简单的习题。这可能有点夸张，因为你还得知道，这个最小值会出现在导数为0处，你还得知道如何微分f（x），但这些都是简单的事实，真正的突破是在概念本身。

像这样的定义有许多例子。但是有趣的是，在数学的某些分支里面，它们比在其他分支里面更加常见。有些数学家会告诉你，他们的研究的主要目的就在于找出正确的定义。有了这些定义，他们的整个领域就被照亮了。确实，他们必须要去写证明，但是，如果定义正是他们所寻找的，证明时常会是相当直截了当的。是的，有他们能用这些定义来解决的问题，但是，就和上面的极小化问题一样，这些问题对于整个理论并不是中心，说这些数学家是在展示他们的定义的力量更恰当些。对于另外一些数学家，定义的主要目的在于证明定理，但是，甚至这些非常的以定理的证明为导向的数学家时而也会发现，一个好的定义对于增强解决问题的本领起了重大的作用。

这就把我们引导到（怎样看待）数学问题。一篇数学论文的主要目的通常都是证明定理。但是，读文章的主要理由之一却是为了推进自己的研究。所以，如果一个定理是用了一种可以用于其他背景的技巧，那么这篇文章是会受欢迎的。如果一篇文章里面包含了好的未解决的问题，它也会受到很大的欢迎。作为一个例证，我们来看一个绝大多数数学家都不会认真对待的问题，借以从中看到这个问题缺少了些什么。

一个数称为回文数，如果它的十进表达式是回文的形式∶22，131和548845都是回文数的例子。131是有趣的，因为它是一个素数。让我们试着来找更多的素回文数。一位的素数当然都是回文的，而二位回文数必以11为因子，所以，只有11本身是素数。这样，我们很快就到了三位数。这里有几个素回文数的例子∶101，131，151，191，313，353，373，383，727，757，787，797，919和929。不难看到，所有偶数位回文数都以11为因子。但是，素回文数并未止于929。例如，10301就是下一个最小的素回文数。

现在，任何一位稍有一点点好奇心的人都会问∶是否有无限多个素回文数？结果是，这居然是一个未解决的问题。人们相信是有无限多个素回文数（这是基于素数应该是充分随机的，而奇数位的回文数也看不出有特别的理由一定就有因子），但是谁也不知道如何去证明它。

这个问题有一个很大的优点，就是它很容易懂，这使它很吸引人，但费马大定理和哥德巴赫猜想不也正是由于很容易懂而吸引人吗？但是这个素回文数的问题并不像后两个问题那样，不能成为中心的问题。绝大多数的数学家会把它放进“休闲数学”或者“数学游戏”这样的智慧宝盒里去，然后就忘得一干二净。

这种抛弃的态度的理由何在呢？难道素数的研究不是数学的中心对象吗？确实是的，但是回文数却不是，其所以不是的主要理由在于“回文数”的定义极端地不自然。如果知道了一个数是回文数，则与其说是知道了这个数的特性，不如说知道的是表示这个数的方式的特性，而由于历史的原因，我们恰好是采用了这个方式。特别是，具有回文数形式依赖于我们选取了以10作为记数的基底。设若以3位记数法的基底，131这个数将写成11212，倒过来写就不一样了。

这个说法虽然有一定的说服力，却不是完整的解释，因为有可能某些有趣的性质正是牵涉到 10 的。下面再举一个例子，形如

的素数是否有无穷多个，这个问题被认为是有趣的，虽然其中使用了一个特别的数2，选用2是有正当理由的。

因为若取 a>2，则a^n-1恒有因子a-1（它是一个大于1的正整数），所以，除非n=1，a^n-1一定不是素数。因此，形如 a^n-1的素数是否有无穷多个?这个问题的答案一定为否。此外，形如2^n-1的数还有许多性质，使它们更可能是素数。

但是，即令把10换成一个"更自然的"数2，并且来看那些回文数写成二进制后怎样，那也还得不到一个会被看成严肃的研究主题的性质。设给定一个正整数 n，定义 r（n）为其颠倒数，就是先把它写成二进制，再颠倒次序来写，这样得到的数。这时，一个二进制意义下的回文数，就是使得n=r（n）的数 n。但是，函数r（n）是非常奇特而且“非数学”的。举例来说，从1到20这些数的颠倒数依次是∶1，1，3，1，5，3，7，1，9，5，13，3，11，7，15，1，17，9，25，还有5，这给出了一个看不出任何模式的序列。

实际上，当我们计算这个序列时，就会看到它比初看起来还更加是人为的。人们可能会想，颠倒数的颠倒数就是这个数本身，但是不然。例如取数10，它在二进制中是1010，所以其颠倒数是0101，就是5。但是在正常情况下，5是会写成101的，所以5的颠倒数仍然是5，而不是10。但是，我们又不能规定把5写成0101，因为这样一来5就不是回文数了，而它应该是的。

这是不是意味着没有人会有兴趣去证明确有无穷多个素回文数了？完全不是。可以很容易地证明小于n的素回文数的个数在根号n附近，与n比较，这只占一个很小的部分。在这样稀疏的集合里面去证明关于素数的结果，是难得出了名的，所以解决这样一个猜想将是一个突破。然而“回文数”的定义实在太人为造作了，所以无法在一个数学证明里详细地使用这个定义。解决这个问题唯一现实的希望是去证明一个广泛得多的一般结果，使这个问题成为其许多推论里的一个。这样一个结果将是奇妙的，无可否认是有趣的。但是如果总在想着回文数，是发现不了它的。所以最好试一试去提出一个更加一般的问题，或者去找一个更自然的这一类的问题。后一方面的一个例子是∶有没有无穷多个素数可以写成m²＋1的形式？这里m是一个正整数。

一个好问题的最重要的特性可能就在于它的一般性∶一个好问题的解答，时常会超越这个问题而有许多分支。对于这种使人愉悦的性质，也许"可一般化"是一个更准确的字眼，因为一个极好的问题可能看起来很特殊。例如"根号2是一个无理数”这个命题只是关于一个数的。但是一旦您知道了怎样去证明它，对于怎样证明根号3也是无理数就不会有困难了。事实上，这个证明可以推广到广泛得多的一类数。很常见的一种情况是∶一个好问题，在您开始去想以前，看起来是没有什么意思的。然后就会体会到，问这样的问题是有道理的∶它可能是一个更一般的问题的“第一个困难的情况”，或者是一大堆问题的选择得很好的例子，而在这些问题里都会遇上相同的困难。

有时，一个问题就只是问一件事，但是一个想去问一件数学上的事情的人，心里对于答案如何已经会有一个好主意了。一个猜想就是作者坚信但又无法证明的数学命题。和对于问题一样，有些猜想好于其他的，一个最好的猜想对于数学研究的方向会有重大的影响。