分享

《代数的历史 人类对未知量的不舍追踪》

 东方文捷 2021-05-25

.

《代数的历史》 人类对未知量的不舍追踪 

阐明代数基本知识的数学入门书,数学家的趣味故事集,带领读者踏上有趣的数学之旅,全面经典的代数科普图书

约翰·德比希尔John Derbyshire) 著,张浩 译

编辑推荐

阔别十年,经典再现,全新修订版再次出发。
更严谨、更翔实、更好读,全面展现代数自诞生至今的面貌。
畅谈代数知识与数学家故事,适合对数学感兴趣的大众读者阅读。
《美国科学家》、美国数学学会推荐,曾获美国《图书馆杂志》*****科普著作、《科学图书和电影杂志》****图书。

内容简介

本书向读者介绍了代数学自诞生以来的发展历程,内容涵盖代数学中的重要概念,如未知量、抽象概念、方程、向量空间、域论、代数几何,等等。作者以诙谐的笔触展现了代数几千年发展史中的重大事件和核心人物,并介绍了代数的基本知识,以代数这一重要而有趣的角度呈现数学思维的戏剧性进化历程,向读者展现了一种感知世界的全新方式。作者凭借历史学家的叙事能力,带领读者踏上一段令人称叹、充满挑战的数学之旅。本书适合对代数学及其历史感兴趣的读者阅读。

作者简介

[美] 约翰.德比希尔(John Derbyshire)

约翰.德比希尔(John Derbyshire)出生于英国,是一位美国系统分析师、作家和评论家,曾学习过数学和语言学。他曾是美国《国家评论》的专栏作家,其写作题材非常广泛,著有《素数之恋》《梦见柯立芝》等多部作品。

目录

引言 1
数学基础知识:数和多项式(NP) 7

第 一部分 未知量
第 1章 四千年前 18
第 2章 代数之父 33
第3章 还原与对消 47
数学基础知识:三次方程和四次方程(CQ) 62
第4章 商业与竞争 71
第5章 放飞想象力 91

第二部分 普遍算术
第6章 狮子的爪子 108
数学基础知识:单位根(RU) 120
第7章 攻克五次方程 126
数学基础知识:向量空间和代数(VS) 147
第8章 飞跃到第四维 158
第9章 矩形数阵 177
第 10章 维多利亚时代的多雾群岛 195

第三部分 抽象层次
数学基础知识:域论(FT) 222
第 11章 黎明的枪声 233
第 12章 环女士 251
数学基础知识:代数几何(AG) 271
第 13章 几何学重生 284
第 14章 代数无处不在 313
第 15章 从普遍算术到普遍代数 334

图片版权 360
人名对照表 363

收起全部↑

精彩书摘

  从政治角度讲,新月沃地的三个主要区域看起来差异非常大。巴勒斯坦是一处偏僻的地方,但是它是通往别处的交通要道。当时的人们认为它属于古埃及的势力范围。古埃及是一个种族统一的国家,而且在其边界没有能对它形成严重威胁的族群。这个国家在遭受我后面要讲述的第一次外来侵略之前已有一千五百年的历史,比如今的英国的历史还要悠久。在自认为安全的环境下,古埃及人很早就形成了一种类似于中国古代封建统治的思维方式,建立了中央集权的君主专制,由通过层层选拔的人才建立起来的庞大官僚系统统治着。早在大约公元前2500年到公元前2350年的第五王朝,就有近2000个官衔。正如罗伯特·维森在《帝国秩序》(The Imperial Order)一书中所说的那样:“在这种奇妙的等级制度下,人与人都是不平等的。”
  美索不达米亚却呈现出完全不同的景象。这里的种族关系更加复杂,最初是苏美尔人,随后依次是阿卡德人、埃兰人、亚摩利人、赫梯人、喀西特人、亚述人以及阿拉米人占据优势。古埃及式的官僚专制也曾在美索不达米亚占据一时的主导地位,当时一个强大的统治者可以掌控足够大的领土,但这些帝国都难以持续很长时间。其中最早也最重要的是萨尔贡大帝的阿卡德王朝,这个王朝从公元前2340年到公元前2180年统治了整个美索不达米亚160年,最后因高加索部落的袭击而瓦解。我在这里讲述的是公元前18世纪和公元前17世纪,那时萨尔贡的荣耀已经成为逐渐消退的记忆。然而,它却给这片地区留下了一种相对通用的语言:闪米特语族中的阿卡德语。苏美尔语一直存在于该地区的南方,显然它被认为是受教育的人熟知的一种高贵语言,颇像罗马人使用的希腊语或中世纪和近代欧洲早期使用的拉丁语。

  然而,美索不达米亚通常处于一种百家争鸣的状态,这里的语言和文化有很多共同点,但没有统一。在这种环境下,美索不达米亚的创造力最为繁荣,可与黄金时代的希腊城邦、文艺复兴时期的意大利或19世纪的欧洲相媲美。统一是偶然而短暂的。这个时代无疑是“令人向往”的,也许,这就是创造力的价值。

引言

本书是一部代数的历史,写给好奇的非数学专业人士。作为这样一本书的作者,我似乎应该在开头告诉读者什么是代数。那么,什么是代数呢?

我最近逛了一家机场书店,发现那里摆放着高中生和大学生常用的公式表小折子,在折叠成三联的塑封纸上印有某个数学主题的所有基础知识,其中有两部分是关于代数的,标题分别是“代数——第1 部分”和“代数——第2 部分”,副标题说明这两部分“涵盖了小学、中学和大学课程中的数学原理”。1

12002 年由位于美国佛罗里达州博卡拉顿市的 BarCharts 公司出版,作者是 S. B. 基兹利克。

我浏览了这些内容。有些主题在数学专业人士看来并不属于代数。比如,“函数”“数列和级数”应该属于数学家们所说的“分析”。不过,总的来说,这两部分概括了基础代数的主要内容,还明确地给出了现行美国高中和大学基础课程中“代数”一词的常见定义:代数是高等数学中有别于微积分的一部分。

然而,在高等数学中,代数作为一门独立的学科有其鲜明的特点。20 世纪伟大的德国数学家赫尔曼·外尔(1885—1955)曾在 1939 年发表的一篇文章中留下一句名言:

最近,拓扑学天使和抽象代数恶魔正在为争取各个数学领域的数学家的灵魂而决斗。2

2引自《杜克数学杂志》第5 期第489~502 页的《不变量》。

读者或许知道拓扑学是几何学的一个分支,它有时也被称为“橡皮几何学”,研究的是图形在拉伸、挤压但不撕裂的情况下保持不变的性质。(对此不了解的读者可以先阅读第14 章中关于拓扑学的详尽介绍。关于外尔的更多评论也可参考第14 章。)拓扑学告诉我们平环与纽结之间的差异、球面与甜甜圈表面之间的差异。为什么外尔要把无害的几何研究与代数严格对立起来呢?

或者,你可以看看第15 章开头给出的那份获奖名单,其中列出了近年来科尔代数奖(Frank Nelson Cole Prize in Algebra)的获奖情况。非分歧类域论、雅可比簇、函数域、原相上同调 3……显然,我们已经远离二次方程和绘图了。它们的共同点是什么呢?最简洁的答案就隐含在外尔的名言中:抽象

3本书遵循黎景辉教授在《代数 K 理论》一书中的建议,将英文“motivic cohomology”译为原相上同调,“motive”译为原相。——译者注

※※※

当然,所有数学都是抽象的。最早的数学抽象发生在几千年前,当时人类发现了数,完成了从 3 根手指、3 头牛、3 个兄弟、3 颗星星等可观察的 3 的实例向本身就可以被单独考虑的心智对象“3”的充满想象的飞跃,这里的“3”不再表示 3 根手指之类的特殊实例。

将抽象层次提升到第二层的第二次数学抽象发生在公元 1600 年前后的几十年里,人们采用字母符号体系(使用字母符号)来表示任意数或未知数:“data”(给定的量)或者“quaesita”(要求的量)。艾萨克·牛顿爵士(1642—1727)称之为“普遍算术”。这段漫长而充满羁绊的旅程主要是为了求解方程,或者说是确定某些数学情形中的未知量。这是一次在我们的集体意识中播下“代数”种子的旅程,也是我在本书第一部分要讲述的内容。

如果在 1800 年问一位受过良好教育的人什么是代数,他也许会说,代数就是在做算术和求解方程的过程中使用字母符号来“放飞想象力”(莱布尼茨)。当时,掌握或者至少熟悉数学中的字母符号体系的用法是欧洲通识教育的一部分。

然而,在 19 世纪 4,这些字母符号开始从数的领域中分离出来。各种奇怪的新数学对象 5 被发现 6:群、矩阵、流形以及很多其他对象。数学开始飞向新的抽象层次。一旦字母符号体系彻底深入人心,这个过程就是字母符号体系的自然发展。因此,把它看作代数学历史的延续不无道理。

4有时,我会像历史学家约翰·卢卡奇(1924—2019)那样使用“19 世纪”来指代 1815 年到 1914 年这段时期。不过这里按照的是通常的历法。

5“数学对象”指的是数学家感兴趣的东西,他们努力理解和发展与之有关的定理。非数学专业人士最熟悉的数学对象包括数和点、线、三角形、圆、立方体等欧几里得几何中二维平面和三维空间中的图形。

6发现还是发明?我倾向于采用“柏拉图式”的观点,认为这些对象存在于世界的某个地方,等待人类的智慧去发现它们。这就是大多数数学家在大部分时间里做大多数数学研究时的心态。这一点非常了不起,但是它与代数学历史的关系不大,因此我不再赘述。〔关于这个问题可以参考《最后的数学问题》(人民邮电出版社,2019 年)。——译者注〕

因此,我把本书分成以下三个部分。

第一部分:从远古时期到大约公元 1600 年,字母符号体系(即用字母表示数)被广泛使用。

第二部分:字母符号体系在数学上取得的首次辉煌成果,以及符号从传统算术和几何概念中缓慢分离最终导致新数学对象的发现。

第三部分:近世代数——把新的数学对象置于坚实的逻辑基础之上,抽象层次更高。

因为代数学的发展与所有人类活动一样,是随机且无规律可言的,我很难严格按照年代顺序叙述,特别是 19 世纪的代数。尽管如此,我希望我的叙述方式是合理的,希望读者对代数学发展的主要线索有清晰的认识。

※※※

我的目的不是向读者讲授高等代数。这方面的优秀教材有很多,我会在叙述过程中推荐一些教材。这本书不是教材。我只希望能够展示一些代数学概念的模样,以及后来的代数学概念是如何从先前的概念中发展而来的,哪些人扮演了重要的角色,历史背景又是怎样的。

然而,我发现如果不对这些代数学家所做的工作做一些简单的解释,就不可能说清楚这门学科的历史。因此,本书中有大量的数学知识。对于那些高中课程中通常不会讲到的内容,我把它们简单地整理了一下,放在贯穿整本书的“数学基础知识”部分中,而这些基础知识穿插安排在你需要通读以便跟得上历史叙述的地方。每一部分的数学知识都介绍了若干基础概念。在某些情况下,我会扩展正文中的概念。介绍这些基础知识的目的在于唤起那些已经学过某些大学数学课程的读者的回忆,或者为那些没有这样的经历的读者提供最基本的知识。

※※※

当然,这本书是参考了很多其他人的书编著而成的。我将在正文和注解里注明引用的著作。不过我会经常提到三份资源,因此我有必要在一开始就提醒自己不能忘了致谢。第一份资源是极其有用的《科学传记大辞典》(Dictionary of Scientific Biography),它不仅提供了数学家的详细生平,而且还给出了数学思想起源和传播的重要线索。

另外两本主要参考的著作是数学家为数学家们写的代数学历史:范德瓦尔登(1903—1996)的《代数学的历史》(1985 年出版);伊莎贝拉·巴什马科娃和加林娜·斯米尔诺娃合著的《代数学的起源与演变》(2000 年由阿贝·舍尼策译成英文)。在后文中,我在引用这些书中的内容时将直接引用其作者的名字(如“范德瓦尔登说……”)。

我在这里还要感谢另一位为本书做出重要贡献的人——美国芝加哥大学的理查德·斯旺(1933— )教授。他审阅了本书的手稿,能得到他的指点,我感到万分荣幸。斯旺教授提出了很多意见、批评、修正和建议,大大提升了本书的水准。我衷心感谢他的帮助和鼓励。尽管我力争做得更好,但是“更好”不是“完美”,书中仍然会存在一些错误或者遗漏,对此我负全部责任。

※※※

这本书讲述代数学的故事。这一切开始于遥远的过去,伴随着从陈述句“这个加这个等于这个”到疑问句“这个加什么等于这个”的简单的思维转变,这是未知量,即现在每个人都会把它与代数联系在一起的 x,第一次进入人类的思想,实际上是经过了较漫长的时间后,才出现了用符号来表示未知量或任意数的需求。一旦建立起这样的字母符号体系,对方程的研究就进入了更高的抽象层次。于是,新的数学对象出现了,它推动数学向更高的抽象层次飞跃。

如今,代数学已经成为所有智力学科中最纯粹、最严格的学科,它的研究对象是对抽象的抽象的再抽象,非数学专业人士几乎无法领会到其成果的巨大威力和非凡魅力。最令人惊讶也最神秘的是,在这些缥缈的心智对象的层层嵌套的抽象之中,似乎包含着物质世界的最深刻、最本质的秘密。

.

.

数学基础知识:数和多项式(NP)

在书中某些章节之间的连接处,我将打断对代数学历史的叙述,插入一些简要的数学基础知识,帮助你了解或回顾一些必要的数学内容,以便你能够顺利理解后面要讲述的故事。

第一组数学基础知识设在开篇之前。为了让你能理解接下来所讲述的内容,这部分包含了两个你必须掌握的数学概念:多项式

※※※

数的现代概念在 19 世纪后期开始形成,并在 20 世纪二三十年代在数学界广泛传播。数的现代概念好似层层嵌套的“俄罗斯套娃”模型,其中共有五个“俄罗斯套娃”,分别用镂空字母 \mathbb{N}\mathbb{Z}\mathbb{Q}\mathbb{R} 和 \mathbb{C} 表示。

最里层的“套娃”是自然数,自然数全体记为 \mathbb{N}。这些数是通常 1 用于计数的数,如 1、2、3 等。它们可以被形象地排成一行向右无限延长的点(图 NP-1)。

1在现代用法中,自然数通常包括 0。从哲学意义上讲,我赞同这一点。如果你让我到隔壁房间数一数房间里的人数,然后向你汇报结果,那么“0”是一个可能的结果。因此,0 应该包含在这些用于计数的数字中。但是,由于本书是从历史的角度进行叙述的,所以我从自然数中去掉了 0。

图 NP-1 自然数集 \mathbb{N}

自然数非常有用,但是它们有一些不足之处。主要的不足之处在于,从一个自然数中减去另一个自然数不总是可行的,用一个自然数除以另一个自然数也不总是可行的。你可以用 7 减去 5,但是不能用 7 减去 12——我的意思是说,这样做想得到一个自然数结果是不可能的。用专业术语讲就是,\mathbb{N} 在减法运算下不是封闭的\mathbb{N} 在除法运算下也不是封闭的:你可以用 12 除以 4,但不能用 12 除以 5,因为其结果就不再是自然数了。

减法的问题因为零和负数的发现而得到解决。大约在 600 年,古印度数学家发现了零。负数是欧洲文艺复兴时期的成果。将自然数系扩张,使其包含这些新的数字,就得到了第二个“俄罗斯套娃”,它包含第一个“俄罗斯套娃”。这个数系就是整数系,整数全体用符号 \mathbb{Z}(来自德文单词“Zahl”,意为“数”)表示。整数可以形象地用向左右两端无限延长的一行点来表示(图 NP-2)。

图 NP-2 整数集 \mathbb{Z}

现在,我们可以随意进行加法、减法和乘法运算,当然,做乘法运算需要了解符号法则:

正正得正,正负得负,负正得负,负负得正。

或者更简洁地说:同号相乘得正,异号相乘得负。当可以进行除法运算时,符号法则同样适用,如 -12 除以 -3 得 4。

然而,除法在 \mathbb{Z} 中不总是可行的,\mathbb{Z} 在除法运算下不是封闭的。为了得到一个在除法运算下封闭的数系,我们还要再次扩张,引入分数(包括正分数和负分数)。这就是第三个“俄罗斯套娃”,它包含了前两个“套娃”。这个“套娃”被称为有理数,有理数全体记为 \mathbb{Q}(来自英文单词“quotient”,意为“商”)。

有理数是“稠密的”。这意味着在任意两个有理数之间,你总可以找到另外一个有理数。\mathbb{N} 和 \mathbb{Z} 都不具有这样的性质。11 和 12 之间没有自然数,-107 与 -106 之间也没有整数。然而,在有理数\dfrac{1190~507}{10~292~881} 和 \dfrac{185~015}{1~599~602}  之间总可以找到一个有理数,虽然这两个有理数相差不到 16 万亿分之一。例如,有理数\dfrac{2~300~597}{19~890~493} 比前面出现的第一个有理数大,但是比第二个有理数小。因为任意两个有理数之间都存在一个有理数,所以你可以在任意两个有理数之间找到无穷多个有理数。这就是“稠密”的真正含义。

因为 \mathbb{Q} 具有稠密性,所以它可以用一条向左右两端无限延伸的连续直线来表示(图 NP-3)。每一个有理数在这条直线上都有一个位置。

图 NP-3 有理数集 \mathbb{Q}(注:我们可以用同样的图形来表示实数集 \mathbb{R}

你看到整数之间的空隙是如何被填充的了吗?任意两个整数,比如 27 和 28,其间的有理数都是稠密的。

你看到整数之间的空隙是如何被填充的了吗?任意两个整数,比如 27 和 28,其间的有理数都是稠密的。

要注意,这些“俄罗斯套娃”是嵌套的,\mathbb{Q} 套着 \mathbb{Z}\mathbb{Z} 套着 \mathbb{N}。还有另一种看待它们的方法:自然数是“名誉整数”,整数和自然数是“名誉有理数”。为了强调,名誉数可以被“装扮”成适当的模样。自然数 12 可以被“装扮”成整数 +12,或者有理数 \dfrac{12}{1}

※※※

还有另外一些数,它们既不是整数也不是有理数。公元前 500 年左右,古希腊人发现了这类数。这个发现给古希腊人的思维带来了深刻的影响,而且还提出了一些问题,这些问题至今也没有令所有数学家和哲学家都满意的答案。

这类数的最简单的例子是 2 的平方根,如果你把它与自身相乘,就得到 2。(在几何中,边长是单位 1 的正方形的对角线的长度就是 2 的平方根。)很容易证明,没有一个有理数可以表示成边长为单位 1 的正方形的对角线的长度 2。用很类似的方法可以证明:如果 N 不是完全 k 次幂,那么 N 的 k 次方根一定不是有理数。

2欧几里得首次给出了一般的证明,他使用了反证法。假设这件事成立,即假设存在某个有理数 \dfrac{p}{q}(其中 p 和 q 都是整数)满足 \dfrac{p}{q}\times\dfrac{p}{q}=2。假设 \dfrac{p}{q} 是最简分数(将分子和分母中的公因子约去,这总能做到),那么 p 和 q 中必定有一个是奇数。用 q^2 乘上式两边得到 p^2=2q^2,而且只有偶数的平方是偶数,所以 p 一定是偶数,q 一定是奇数。因此 p=2kk 是某个整数。于是 p^2=4k^2,所以 4k^2=2q^2q^2=2k^2,因此 q 也一定是偶数。那么 p 和 q 就都是偶数,出现矛盾。因此假设不成立,所以存在平方等于 2 的有理数。(另一个证明可以在我的书《素数之恋》的注释 11 中找到。)

显然,我们需要另外一个“俄罗斯套娃”,它要能够包含所有这些无理数。这个新“套娃”就是实数系,用 \mathbb{R} 表示。2 的平方根是一个实数,但它不是有理数:它属于 \mathbb{R} 但不属于 \mathbb{Q}(当然它也不属于 \mathbb{Z} 或 \mathbb{N})。

实数同有理数一样,也是稠密的。我们在任意两个实数之间总能找到另外一个实数。因为有理数是稠密的,已经“填满”了图示中的直线(图 NP-3),你也许会提出这样的疑问:如何把实数挤进有理数之间?更怪异的是,\mathbb{Z} 和 \mathbb{Q} 是“可数”的,但 \mathbb{R} 是不可数的。可数集合的意思是,其中的元素可以与用来计数的数集 \mathbb{N} 中的元素 1, 2, 3,…相匹配,一直到无穷。然而,对于实数 \mathbb{R},你做不到这一点。从某种意义上讲,\mathbb{R} 非常大,比 \mathbb{N}\mathbb{Z} 和 \mathbb{Q} 都大,以至于 \mathbb{R} 无法数出来。那么,超级无穷多的实数可以安插在有理数之间吗?

这是一个非常有趣的问题,数学家们也因此伤透了脑筋。不过,这不属于代数学的历史,我在这里提到它只是因为第14 章要提到可数性的问题。你记住以下这点就够了:表示 \mathbb{R} 的图和表示 \mathbb{Q} 的图看起来是一样的,都是一条向左右两端无限延伸的连续直线(图 NP-3)。当这条直线表示 \mathbb{R} 时,它被称为“实数轴”。更抽象地说,“实数轴”可以作为 \mathbb{R} 的同义词。

※※※

在 \mathbb{N} 中,加法和乘法总是可行的,减法和除法有时可行。在 \mathbb{Z} 中,加法、减法和乘法总是可行的,除法有时可行。在 \mathbb{Q} 中,加法、减法、乘法和除法(在数学中不允许除以 0)都是可行的,但是开方却出现了问题。

\mathbb{R} 可以解决这些问题,但只限于非负数。根据符号法则,任何数与自身相乘都得到一个非负数。或者换一种说法:在 \mathbb{R} 中,负数没有平方根。

从 16 世纪起,这个限制开始成为数学家们前进的障碍,所以必须加入新的“俄罗斯套娃”。这个“套娃”就是复数系,记为 \mathbb{C}。在 \mathbb{C} 中,每一个数都有平方根。事实证明,只用普通的实数和一个新数 \sqrt{-1} (通常记为 i)就可以构建整个新数系。例如 -25 的平方根是 5i,因为5{\rm i}\times5{\rm i}=25\times(-1)=-25。那么 i 的平方根是什么?这不难回答,我们熟悉的乘法去括号法则是(u+v)\times(x+y)=ux+uy+vx+vy,所以

\left(\dfrac{1}{\sqrt{2}}+\dfrac{1}{\sqrt{2}}{\rm i}\right)\times\left(\dfrac{1}{\sqrt{2}}+\dfrac{1}{\sqrt{2}}{\rm i}\right)=\dfrac{1}{2}+\dfrac{1}{2}{\rm i}+\dfrac{1}{2}{\rm i}+\dfrac{1}{2}{\rm i}^2

由于 {\rm i}^2=-1,并且 \dfrac{1}{2}+\dfrac{1}{2}=1,所以上面等式的右边正好等于 i。因此,等式左边括号中的数就是 i 的平方根。

和之前一样,新的“俄罗斯套娃”也是嵌套的。实数 x 是“名誉复数”x+0{\rm i}(形如 0+y{\rm i} 或简写为 y{\rm i} 的复数称为虚数,其中的 y 为实数)。

根据 {\rm i}^2=-1,很容易推出复数的加法、减法、乘法和除法的运算法则,如下所示:

加法:(a+b{\rm i})+(c+d{\rm i})=(a+c)+(b+d){\rm i}

减法:(a+b{\rm i})-(c+d{\rm i})=(a-c)+(b-d){\rm i}

乘法:(a+b{\rm i})\times(c+d{\rm i})=(ac-bd)+(ad+bc){\rm i}

除法:(a+b{\rm i})\div(c+d{\rm i})=\dfrac{ac+bd}{c^2+d^2}+\dfrac{bc-ad}{c^2+d^2}{\rm i}

因为复数有两个独立的部分,所以不能用直线来表示 \mathbb{C}。我们需要一个向各个方向无限延伸的平面来表示 \mathbb{C},这个平面被称为复平面(图 NP-4)。复数 a+b{\rm i} 可以用通常的直角坐标表示成这个平面上的一个点。

图 NP-4 复数集 \mathbb{C}

注意,每一个复数 a+b{\rm i} 都对应一个非常重要的非负实数,这个实数被称为该复数的,定义为 \sqrt{a^2+b^2} 。我希望图 NP - 4 可以清楚地说明这一点,根据毕达哥拉斯定理 3,复数的模就是在复平面内它到零点的距离,零点通常被称为原点

3毕达哥拉斯定理(即我们常说的勾股定理。——译者注)考虑的是一个平面直角三角形的边长。通过简单的观察可以发现,直角所对的斜边一定比其他两个直角边长。这个定理说的是斜边长的平方等于两个直角边长的平方之和:c^2=a^2+b^2,其中 a 和 b 分别是两个直角边的长度,c 是斜边的长度。这个公式的另外一种表示法c=\sqrt{a^2+b^2} 如图 NP-4 所示。

我们以后还会遇到其他数系,但是一切都是从这五个依次嵌套的基本数系开始的:\mathbb{N}\mathbb{Z}\mathbb{Q}\mathbb{R} 和 \mathbb{C}

※※※

关于数的内容就介绍到这里。本书经常提到的另一个关键概念是多项式。这个词的词源是希腊文和拉丁文的混合,意思是“有很多名称”,“名称”指的是“有名称的部分”。似乎是法国数学家弗朗索瓦·韦达(1540—1603)在 16 世纪晚期首先开始使用这个词的,在此一百年后这个词才出现在英文中。

多项式是从数和“未知量”开始,仅通过加法、减法和乘法运算得到的数学表达式(不是方程,因为这里没有等号),这些运算可以出现任意有限多次,但不能出现无限次。以下是一些多项式的例子:

\begin{matrix}5x^{12}-22x^7-141x^6+x^3-19x^2-245\\9x^2-13xy+y^2-14x-35y+18\\2x-7\\x\\\dfrac{211}{372}x^4+\pi x^3-(7-8{\rm i})x^2+\sqrt{3}x\\x^2+x+y^2+y+z^2+z+t^2+t\\ax^2+bx+c\end{matrix}

注意以下几点。

  • 未知量。多项式中可以出现任意有限多个未知量。

  • 用字母表示未知量。真正的未知量是我们真正感兴趣的那些值,拉丁文为“quaesita”(意为“要求的量”),它们通常用拉丁字母表的结尾字母表示:xyz 和 t 是最常用的表示未知量的字母。

  • 未知量的幂。因为我们可以做任意有限次乘法,未知量的任意自然数次幂都可能出现,如 xx^2x^3x^2y^3x^5yz^2 等。

  • 用字母表示“已知量”。“已知量”的拉丁文是“data”,通常是取自 \mathbb{N}\mathbb{Z}\mathbb{Q}\mathbb{R} 或 \mathbb{C} 中的数。我们可以用表示已知量的字母来扩充一个表达式。这些字母通常取自拉丁字母表的开头(abc 等)或者中间(pqr 等)。

  • 系数。现在,“data”作为一个英语单词有其自身的含义,而且几乎没有人会说“已知量”。多项式中的“已知量”现在被称为系数。上面的第三个多项式的系数是 2 和 -7,第四个多项式(严格地说,它是一个单项式)的系数是 1,最后一个多项式的系数是 ab 和 c

※※※

多项式只是所有数学表达式的一个小子集。如果引入除法,我们就可以得到更大的一类表达式,这类表达式叫作有理分式,例如:

\dfrac{x^2-3y^2}{2xz}

这是一个包含 3 个未知量的有理分式,但它不是多项式。引入更多的运算可以进一步扩大这个集合:开方、取正弦、余弦或对数,等等。最后得到的表达式都不是多项式。

得到一个多项式的步骤是:取一些“已知”数,这些数既可以是明确的数(17、\sqrt{2} 、π等),也可以是代表数的字母(abc、……pqr 等);将这些数与一些未知量(xyz 等)混合,进行有限次加法、减法和乘法运算,结果就是一个多项式。

尽管多项式在数学表达式中只占很小的比例,但是它们非常重要,特别是在代数中更重要。当数学家使用形容词“代数的”时,通常可以被理解为“关于多项式的”。仔细检查一下代数学中的某个定理,即使是抽象层次非常高的定理,经过层层分析其意义,我们很可能就会发现多项式。可以肯定地说,多项式是从古至今的代数学中最重要的概念。

第一部分 未知量

第1章 四千年前

按照我在引言中给出的广义定义,在有记载的历史中,代数很早就开始了从陈述式算术到疑问式算术的思维转变。我们已知的最古老的包含数学内容的书面文字记载,实际上包含了一些可被称为代数的内容。这些文字记载可以追溯到公元前二千年的上半叶,距今约 37 或 38 个世纪 1,它们是由生活在美索不达米亚和古埃及的人们书写的。

1美索不达米亚早期历史的年代测定还没有定论。在撰写本书时,我经常参考“中间年表”,这也是我用的年表。此外,还有低年表、超低年表和高年表。“中间年表”中标注于公元前 2000 年的事件在高年表中的时间可能是公元前 2056 年,在低年表中的时间可能是公元前 1936 年,在超低年表中的时间可能是公元前 1911 年。专业的亚述学家因争论这些问题甚至产生了友谊或婚姻的破裂。我对此没有强烈的意见,这个时期的确切年代对我的叙述并不重要。出现在 1950 年之前的大部分资料中的更早的日期在今天看来都是不可确信的。

对现代人来说,那个世界似乎遥不可及。公元前 1800 年距恺撒大帝时代的时间跨度与恺撒大帝距我们现在这个时代的时间跨度一样久远。除了少数专家之外,关于那个时代、那些地域的广泛传播的知识只有《圣经·创世纪》中支离破碎且有争议的记载,所有受过良好训导的西方一神论宗教信徒们都非常清楚这些内容。这是亚伯拉罕和以撒、雅各和约瑟、吾珥和哈兰、所多玛和蛾摩拉的世界。彼时的西方文明包括整个新月沃地,这片连绵不断的肥沃土地从波斯湾向西北延伸至底格里斯河和幼发拉底河平原,横跨叙利亚高原,然后向下穿过巴勒斯坦到达尼罗河三角洲和埃及(图 1-1)。这片地区的人们曾彼此相知。新月沃地周边常年有交通往来,从位于幼发拉底河下游的吾珥到位于尼罗河中游的底比斯之间都有交通往来。亚伯拉罕也许正是沿着这些很多人走过的路,从吾珥到巴勒斯坦,最后长途跋涉到埃及。

{%}

图 1-1 新月沃地

从政治角度讲,新月沃地的三个主要区域看起来差异非常大。巴勒斯坦是一处偏僻的地方,但是它是通往别处的交通要道。当时的人们认为它属于古埃及的势力范围。古埃及是一个种族统一的国家,而且在其边界没有能对它形成严重威胁的族群。这个国家在遭受我后面要讲述的第一次外来侵略之前已有一千五百年的历史,比如今的英国的历史还要悠久。在自认为安全的环境下,古埃及人很早就形成了一种类似于中国古代封建统治的思维方式,建立了中央集权的君主专制,由通过层层选拔的人才建立起来的庞大官僚系统统治着。早在大约公元前 2500 年到公元前 2350 年的第五王朝,就有近 2000 个官衔。正如罗伯特·维森在《帝国秩序》(The Imperial Order)一书中所说的那样:“在这种奇妙的等级制度下,人与人都是不平等的。”

美索不达米亚却呈现出完全不同的景象。这里的种族关系更加复杂,最初是苏美尔人,随后依次是阿卡德人、埃兰人、亚摩利人、赫梯人、喀西特人、亚述人以及阿拉米人占据优势。古埃及式的官僚专制也曾在美索不达米亚占据一时的主导地位,当时一个强大的统治者可以掌控足够大的领土,但这些帝国都难以持续很长时间。其中最早也最重要的是萨尔贡大帝的阿卡德王朝,这个王朝从公元前 2340 年到公元前 2180 年统治了整个美索不达米亚 160 年,最后因高加索部落的袭击而瓦解。我在这里讲述的是公元前 18 世纪和公元前 17 世纪,那时萨尔贡的荣耀已经成为逐渐消退的记忆。然而,它却给这片地区留下了一种相对通用的语言:闪米特语族中的阿卡德语。苏美尔语一直存在于该地区的南方,显然它被认为是受教育的人熟知的一种高贵语言,颇像罗马人使用的希腊语或中世纪和近代欧洲早期使用的拉丁语。

然而,美索不达米亚通常处于一种百家争鸣的状态,这里的语言和文化有很多共同点,但没有统一。在这种环境下,美索不达米亚的创造力最为繁荣,可与黄金时代的希腊城邦、文艺复兴时期的意大利或 19 世纪的欧洲相媲美。统一是偶然而短暂的。这个时代无疑是“令人向往”的,也许,这就是创造力的价值。

※※※

在不同帝国统治美索不达米亚的各个时期中,最令人印象深刻的一个时期是公元前 1790 年到公元前 1600 年。那时的统一者是汉谟拉比,他于这个时期之初在幼发拉底河中游的巴比伦城邦掌权。汉谟拉比 2 是亚摩利人,说阿卡德方言。他统治了整个美索不达米亚,把巴比伦变成当时最伟大的城市。这就是第一巴比伦帝国(古巴比伦王国)。3

2汉谟拉比(Hammurabi)的另一个常见拼写是“Hammurapi”。古英文文献使用的是“Khammurabi”“Ammurapi”和“Khammuram”。然而,认为汉谟拉比就是《圣经·创世记》14:1 中的暗拉非(Amraphel)的观点今天已不被认同。亚伯拉罕的时代是人们推测的,但是人们似乎认为他生活的年代早于汉谟拉比统治的时代。

3西方传统更熟悉的是第二巴比伦帝国。第二巴比伦帝国(新巴比伦王国)指的是尼布甲尼撒二世的帝国,当时犹太人被监禁,但以理也侍奉过这位君主,在伯沙撒王的盛宴期间,墙上出现的文字预示了第二巴比伦帝国将被波斯人攻陷。这一切发生在汉谟拉比时代的一千年后,不属于我们讲述的这部分故事。

古巴比伦王国是一个有文字记载的伟大文明。他们的著作都是用楔形文字写成的。也就是说,写出的文字是用楔形笔压在湿黏土上形成的图案。这些被刻上字的泥板和圆柱桶经过烧制而得以长久保存。苏美尔人在很久之前就发明了楔形文字,在萨尔贡时代引入阿卡德。到了汉谟拉比时代,这种书写方法已经演变成包含 600 多个符号的书写体系,每一个符号代表一个阿卡德语音节。

《汉谟拉比法典》是汉谟拉比在他的帝国强制执行的伟大法律体系。下面是取自《汉谟拉比法典》序言中的用阿卡德楔形文字书写的语句(图 1-2)。

图 1-2 楔形文字

这句话的发音类似于“En-lil be-el sa-me-e u er-sce-tim”,意思是“恩利尔,宇宙和地球之主”。从单词“be-el”可以看出,这是一种闪米特语,它与英文“Beelzebub”(别西卜,神话中引起疾病的恶魔)的前缀有关,这让我们想起了希伯来文“Ba'al Zebhubh”,意思是“蝇王”。

实际上,楔形文字在古巴比伦王国消亡之后仍然沿用了很长时间,一直到公元前 2 世纪。古代世界的很多语言使用的都是楔形文字。伊朗的某些遗迹上有楔形文字铭文,属于公元前 500 年左右居鲁士大帝的王朝。早在 15 世纪,这些铭文就被当时的欧洲旅行家注意到了。自 18 世纪晚期开始,欧洲学者开始尝试破译这些铭文 4。到 19 世纪 40 年代,人们对楔形文字的理解已经有了良好的基础。

4这里出现的几个关键人物是丹麦人卡斯滕·尼布尔(1733—1815)、德国人格奥尔格·弗里德里希·格罗特芬德(1775—1853)和英国人亨利·罗林森(1810—1895)。顺便说一下,格罗特芬德来自德国汉诺威,后来被汉诺威王室的哥廷根大学聘请,从事破译楔形文字的工作。哥廷根大学后来成为闻名世界的数学研究中心。

大约就在同一时期,很多考古学家开始发掘美索不达米亚的古代遗迹,例如法国人保罗·埃米尔·博塔(1802—1870)和英国人奥斯丁·亨利·莱亚德(1817—1894)等。他们发现了大量经过烧制的刻有楔形文字的泥板。这类考古工作一直持续到今天,现在全世界各地的私人或公共收藏总计有超过 50 万块这样的泥板,它们所属的时代大约在公元前 3350 年到公元前 1 世纪。这些泥板大都属于汉谟拉比时代,因此形容词“巴比伦的”经常用在与楔形文字有关的任何事情上,尽管古巴比伦王国的统治时期还不足两个世纪,而使用楔形文字的历史却长达 30 个世纪。

※※※

至少从 19 世纪 60 年代起,人们就已经知道一些楔形文字泥板中记录了数字信息。首先,被破译的这类信息都出自人们很容易想到的具有活跃商业传统的组织有序的行政部门,如库存、账目等资料,此外还有大量的历法资料。古巴比伦人掌握了深奥的历法和广博的天文学知识。

然而,到了 20 世纪初,出现了很多明显与数学有关的泥板,但这些内容既与计时无关,也与记账无关。直到 1929 年,奥托·诺伊格鲍尔(1899—1990)才开始注意它们并进行相关研究。

诺伊格鲍尔是奥地利人,出生于 1899 年。他参加过第一次世界大战,结果与同胞路德维希·维特根斯坦(1889—1951)一同被抓入意大利战俘营。第一次世界大战结束后,他首先成为一名物理学家,后来又转向数学研究,进入哥廷根大学,跟随 20 世纪初最伟大的一些数学家理查德·柯朗(1888—1972)、埃德蒙·兰道(1877—1938)和埃米·诺特(1882—1935)学习。到了 20 世纪 20 年代中期,诺伊格鲍尔的兴趣开始转向古代数学。他对古埃及进行了研究,并发表了一篇关于莱茵德纸草书的论文。稍后我将详细介绍莱茵德纸草书。随后,他又将关注点转向古巴比伦,学习阿卡德语,着手研究汉谟拉比时代的泥板。研究成果就是他在 1935 年到 1937 年出版的三卷巨著《楔形文字数学文本》(Mathematische Keilschrift - Texte,德文“keilschrift”的意思是“楔形文字”),古巴比伦数学的巨大财富首次在这部著作中得到展示。

诺伊格鲍尔是奥地利人,出生于 1899 年。他参加过第一次世界大战,结果与同胞路德维希·维特根斯坦(1889—1951)一同被抓入意大利战俘营。第一次世界大战结束后,他首先成为一名物理学家,后来又转向数学研究,进入哥廷根大学,跟随 20 世纪初最伟大的一些数学家理查德·柯朗(1888—1972)、埃德蒙·兰道(1877—1938)和埃米·诺特(1882—1935)学习。到了 20 世纪 20 年代中期,诺伊格鲍尔的兴趣开始转向古代数学。他对古埃及进行了研究,并发表了一篇关于莱茵德纸草书的论文。稍后我将详细介绍莱茵德纸草书。随后,他又将关注点转向古巴比伦,学习阿卡德语,着手研究汉谟拉比时代的泥板。研究成果就是他在 1935 年到 1937 年出版的三卷巨著《楔形文字数学文本》(Mathematische Keilschrift - Texte,德文“keilschrift”的意思是“楔形文字”),古巴比伦数学的巨大财富首次在这部著作中得到展示。

纳粹上台后,诺伊格鲍尔离开了德国。虽然他不是犹太人,但他在政治上是一名自由主义者。在哥廷根大学数学研究所清除犹太人后,诺伊格鲍尔被任命为该研究所的所长。康斯坦丝·里德(1918—2010)在《希尔伯特》一书中称诺伊格鲍尔“担任此要职只有一天,因为他在校长办公室中激烈争辩,拒绝在所谓的忠诚宣言上签字”。诺伊格鲍尔首先去了丹麦,然后到了美国,他在美国接触到了新的楔形文字泥板藏品。1945 年,他和美国亚述学家亚伯拉罕·萨克斯(1915—1983)合作,出版了《楔形文字数学文献》(Mathematical Cuneiform Texts)。这本著作现在仍是关于古巴比伦数学的英文权威著作。当然,这方面的研究仍在继续,古巴比伦人的辉煌成就现在已经众所周知。特别是,我们现在知道他们掌握了一些可以被称为代数的技巧。

※※※

诺伊格鲍尔发现,汉谟拉比时代的数学文本有两种:“表格文本”和“问题文本”。表格文本就是乘法表、平方表和立方表等表格,以及一些更高级的列表,比如现存于美国哥伦比亚大学的“普林顿 322”泥板就列出了毕达哥拉斯三元组,即满足a^2+b^2=c^2的三元组 (a,b,c),根据毕达哥拉斯定理,这三个数对应于直角三角形的三条边。

古巴比伦人迫切需要这样的表格,因为虽然他们书写数字的系统在当时很先进,却不能像我们熟悉的 10 个数字那样方便地进行计算。他们的数字体系是六十进制而不是十进制。例如,十进制数 37 表示 3 个 10 加上 7 个 1,而古巴比伦人的 37 表示 3 个 60 加上 7 个 1,相当于十进制数 187。因为缺少用来“占位”的 0,事情变得更加困难。因为今天的记法中有 0,所以我们可以区分 284、2804 和 208 004 等。

分数的书写方式就像我们表示小时、分钟和秒那样,这种方式其实是古巴比伦人的原创。例如 2.5 用这种表示就写成 2:30。古巴比伦人知道,在他们的体系下,2 的平方根大约是 1:24:51:10。这个数是 1-[24-(51-10÷60)÷60]÷60,它与 2 的平方根的精确值相差约一千万分之六。与整数一样,缺少占位数字 0 会产生歧义。

即使在表格文本中,代数计算的思维也很明显。比如,我们知道平方表可辅助进行乘法计算,公式

ab=\dfrac{(a+b)^2-(a-b)^2}{4}

把乘法简化为减法(和一个简单的除法)。古巴比伦人知道这个公式,或者说他们知道其本质,只是不知道怎么用上面的办法表示成抽象的公式。他们把这个公式看成一个可以运用于特定数字的步骤,即我们今天所说的算法

※※※

这些表格文本非常有趣,但是,只有在问题文本中我们才能看到代数的真正开端。比如,其中有二次方程的解法,甚至还有一些特殊的三次方程的解法。当然,这些文本都不是用类似现代代数记号写成的,所有这些都写成涉及实际数字的文字问题。

为了让读者充分感受古巴比伦数学,我将用三种形式给出《楔形文字数学文献》中的一个问题,分别是楔形文字、文字翻译以及这个问题的现代表述。

图 1-3 展示的是这个问题的楔形文字。它书写在一块泥板的两面,图中是该泥板的正反面,这两面并排摆放。5

5事实上,楔形文字不都那么难理解。了解用楔形文字记数的最佳简短指南是约翰·康威(1937—2020)和理查德·盖伊(1916—2020)合著的《数之书》。

图 1-3 楔形文字的问题描述

诺伊格鲍尔和萨克斯将这块泥板的内容翻译如下:文字是阿卡德语,字母和数字是苏美尔语,括号里面的内容是原文不清楚的或根据理解补充的。

(左图的译文)

[igib]um 比 igum 大 7。6

问 [igum 和 ]igibum 是多少?

对你来说,平分 7,这是 igibum 超过 igum 的值,(其结果)为 3;30。

把 3;30 与 3;30 相乘,(得到的结果是)12;15。

对于得到的结果 12;15,

加上 [ 乘积 1,0],(结果是)1,12;15。

1,12;15[ 的平方根 ] 是什么?(答案:)8;30。

记下 [8;30 和 ]8;30,这两个数相等,然后

6“igum”和“igibum”是古巴比伦数学文献中表示互为倒数的两个数的专有术语。——译者注

(右图的译文)

从一个 8;30 中减去 3;30,

把这个数加到另一个(8;30)。

一个数是 12,另一个数是 5。

igibum 等于 12,igum 等于 5。

(注意:诺伊格鲍尔和萨克斯使用逗号把数的数位分隔开,使用分号分隔整数部分和小数部分。所以“1,12;15”表示1\times60+12+\dfrac{15}{60}=72\dfrac{1}{4} 。)

下面是用现代方法求解该问题的过程。

一个数比它的倒数大 7。注意,因为古巴比伦的数的进位制存在歧义,所以 x 的“倒数”可能是 \dfrac{1}{x}\dfrac{60}{x}\dfrac{3600}{x} 等。事实上,x 的“倒数”可能是 60 的任何次幂除以 x。但从原作者的求解过程可以看出,这里取的“倒数”应该是 \dfrac{60}{x}。于是

x-\dfrac{60}{x}=7

x 和它的“倒数”是多少?因为上面这个方程可以化简成

x^2-7x-60=0

我们可以运用熟知的公式 7 得到

7给不熟悉二次方程求根公式的读者介绍一下:二次方程x^2+px+q=0有两个解x=\dfrac{-p\pm\sqrt{p^2-4q}}{2}

x=\dfrac{7\pm\sqrt{7^2+(4\times60)}}{2}

这给出了答案 x=12 或 x=-5。古巴比伦人不知道负数,直到 3000 年后,负数才开始被普遍使用。所以他们关心的解只有 12,它的“倒数”(即 \dfrac{60}{x})是 5。古巴比伦人的算法实际上并不能得出上面的二次方程 8 的两个解,而是等价于求 x 和它的“倒数”的一个略微不同的公式

8本书中的“二次方程”“三次方程”“四次方程”“五次方程”等一般指一元方程。——译者注

x=\sqrt{\left(\dfrac{7}{2}\right)^2+60}\pm\dfrac{7}{2}

如果想对此吹毛求疵,你可以说,这表明严格来说他们没有解出二次方程。尽管如此,你也不得不承认这是青铜时代早期的数学中令人印象非常深刻的成果。

※※※

我再强调一次,汉谟拉比时代的古巴比伦人并没有真正的代数字母符号体系。这些都是文字问题,量用原始的编号系统来表示。对于使用“未知量”进行思考这个方向,他们仅仅向前迈了一两步,即在阿卡德语文献中用苏美尔语单词表示未知量,例如上面问题中的“igum”和“igibum”。(诺伊格鲍尔和萨克斯把“igum”和“igibum”都翻译成“倒数”。在其他地方,泥板上使用苏美尔语来表示矩形的“长”和“宽”。)这些算法不具有普适性,不同的文字问题使用了不同的算法。

由此产生了两个问题。第一,他们为什么要提出这些文字问题?第二,是谁首先解决了这些问题?

对于第一个问题,古巴比伦人并不打算告诉后人他们为什么要提出这些文字问题。比较可靠的猜测是,这些文字问题可能是一种检查计算的方式,计算可能涉及测量土地面积,而问题可能是求建造某种尺寸的沟渠时需要挖出的泥土量。当人们圈出一块长方形土地计算它的面积时,他们可以“反过来”通过某个二次方程的算法求出它的面积和周长来确认得到的结果是正确的。

对于第二个问题,汉谟拉比时代的泥板中出现的原始代数是非常成熟的。根据我们对远古时代知识进步速度的了解来看,这些技术一定酝酿了好几个世纪。是谁最先想出来的呢?我们无法知道这个问题的答案,但是这些问题泥板使用了苏美尔语,暗示了苏美尔人可能是其创始者(同现代数学使用希腊字母一样)。我们有汉谟拉比时代之前的文献,也就是三千年以前的资料,但它们都是算术文献。直到公元前 18 世纪和公元前 17 世纪,代数思想才开始出现。如果存在可以说明这些代数思想发展更早的“过渡”文献,那么,它们或者没有被保存下来,或者至今尚未被发现。

汉谟拉比时代的泥板也没有告诉我们任何关于作者的信息。我们知道大量古巴比伦人的数学成果,却不知道任何一位古巴比伦数学家。我们知道其名字的第一位可能是数学家的人生活在新月沃地的另一端。

※※※

正当汉谟拉比王朝在美索不达米亚的统治日益巩固的时候,古埃及正在遭受第一次外来入侵。这些侵略者在希腊语中被称为希克索斯(Hyksos),这个单词是埃及语“外来统治者”一词的讹误。这些外来者从巴勒斯坦开始入侵,他们没有采取突袭的方式,而是对它缓慢地进行吞并和殖民,大约在公元前 1720 年,希克索斯在尼罗河三角洲东部的阿瓦里斯建都。

在希克索斯王朝,有一位名叫阿姆士(约公元前 1680—前 1620)的人,他是我们现在知道名字的第一位与数学有一定联系的人。至于他是否是职业数学家尚无定论。我们是通过一份可追溯到公元前 1650 年左右(希克索斯王朝的早期)的纸草书知道他的。这份纸草书表明,阿姆士是一名抄写员,抄写的是一份写于第十二王朝(大约公元前 1990 ~前 1780 年)的资料。这是我们知道的源于希克索斯王朝的文献之一,希克索斯的统治者们非常崇拜当时的古埃及文明。或许阿姆士不懂数学,只是盲目地抄写他看到的文字。然而,这似乎不太可能。这份纸草书中的错误很少,那些存留的错误看起来更像计算错误(后面的计算用的是错误的数),而不是抄写错误。

这份资料通常被称为《莱茵德纸草书》,以纪念苏格兰人亨利·莱茵德(1833—1863)。莱茵德患有肺结核,于 1858 年冬天到埃及度假休养,其间在卢克索城买下了这份纸草书。在他去世五年后,大英博物馆得到了这份纸草书。现在,人们认为应该以这份纸草书的作者的名字为其命名,而不是以购买者的名字为其命名,因此,人们现在通常也称之为《阿姆士纸草书》。

虽然这是数学中令人兴奋的伟大发现,但是在我所讨论的意义中,阿姆士纸草书仅包含了代数思维最浅显的痕迹。下面是这份纸草书中的问题 24,它是一个代数问题:“一个量加上自身的四分之一等于 15。”我们用现代记法写出来,就是已知

x+\dfrac{1}{4}x=15

求未知数 x。阿姆士使用了试错法求解,这份纸草书中几乎没有出现古巴比伦风格的系统化算法。

※※※

詹姆士·纽曼(1907—1966)在《数学的世界》中写道:“关于古埃及数学的水平在学习古代科学的学生中,存在着较大的不同认识。”9 这些不同的观点现在依然存在。然而,在阅读了古巴比伦和古埃及的代表性文献之后,我不明白为什么还有人主张,这两个公元前 1750 年左右分别在新月沃地两端繁荣起来的文明古国在数学发展水平上是相当的。尽管它们的数学都是算术风格,而且也没有证据表明他们拥有任何抽象能力,但是古巴比伦的问题显然比古埃及的问题更深刻、更精妙。(顺便说一下,这也是诺伊格鲍尔的观点。)

9译文引自李文林等译《数学的世界Ⅱ》第109 页。——译者注

这些古代人仅使用最原始的数字书写方法就取得了如此辉煌的成就,这真是了不起的事情。但也许更令人惊讶的是,在随后的几个世纪里,他们几乎没有取得新的数学进展。

第2章 代数之父

我们接着要说古埃及。“代数之父”丢番图 1 生活在公元 1 世纪、2 世纪或 3 世纪的古罗马帝国统治下的古埃及亚历山大城,为了纪念他,本章以他的荣誉称号作为标题。

1丢番图把自己的名字写成希腊文的形式“Diophantos”。欧洲人是通过拉丁文译本来了解他的著作的,因此他的拉丁文名字“Diophantus”沿用至今。

丢番图到底是不是代数之父,这正是律师所谓的“难以决定的问题”。一些非常受人尊敬的数学史学家都否认这一点。比如,在《科学传记大辞典》中,库尔特·沃格尔认为丢番图的工作并不比古巴比伦人和阿基米德(公元前 3 世纪,见下文)的工作更代数化,并得出结论:“丢番图肯定不是人们通常称的代数之父。”范德瓦尔登把代数的起源向后推迟了一段时间,他认为数学家花拉子密(780—850)才是代数之父。花拉子密比丢番图晚 600 年,我们将在第3 章介绍他。此外,现在的本科生所学的被称为“丢番图分析”的数学分支通常作为数论课程的一部分,而不在代数课程里讲授。

下面我将讲述丢番图的工作,并对此提出我自己的观点,你们可以做出自己的判断。

※※※

在公元前 141 年美索不达米亚整个地区被帕提亚人征服之前,美索不达米亚人在持续了几个世纪的种族和政治纷争中一直使用楔形文字进行书写。人们今天还保留着这次征服之前用楔形文字书写的数学文献。在汉谟拉比帝国和美索不达米亚被帕提亚人征服的 1500 年间,人们在数学字母符号体系、技术和认知方面几乎没有任何进步,这得到了研究过该课题的每一位学者的证实,这是一件令人惊讶的事情。研究过楔形文字的数学家约翰·康威(1937— 2020)说,从泥板来看,唯一的差异就是最新的泥板中有“占位零”的标记,即一种可以区分如“281”和“2801”的方法。古埃及同美索不达米亚一样,没有任何证据表明古埃及数学从公元前 16 世纪到公元前 4 世纪取得了显著的进步。

尽管古巴比伦和古埃及的数学家们在自己的祖国没有取得什么进步,但是他们早期的辉煌成果已经传遍了古代西方,甚至可能传得更远。事实上,从公元前 6 世纪开始,古代世界的代数故事就是一段古希腊故事。

尽管古巴比伦和古埃及的数学家们在自己的祖国没有取得什么进步,但是他们早期的辉煌成果已经传遍了古代西方,甚至可能传得更远。事实上,从公元前 6 世纪开始,古代世界的代数故事就是一段古希腊故事。

※※※

在丢番图之前,古希腊数学主要研究几何,这是古希腊数学的特点。对此,通常给出的理由在我看来颇有一番道理,这个理由是毕达哥拉斯学派(公元前 6 世纪晚期)信奉可以在数的基础上建立数学、音乐和天文学的观点,但是无理数的发现困扰着毕达哥拉斯学派,所以他们将兴趣从算术转向几何,因为算术中似乎包含一些无法描述的数,但这样的数在几何中却可以准确无误地用线段的长度来表示。

因此,早期的古希腊代数概念都是用几何形式表示的,通常晦涩难懂。比如,巴什马科娃和斯米尔诺娃指出,欧几里得的伟大著作《几何原本》第6 卷的命题 28 和命题 29 给出了二次方程的求解方法。我认为它们确实给出了二次方程的求解方法,但至少在第一次阅读时,这种方法并不容易被发现。下面是托马斯·希思爵士(1861—1940)翻译的欧几里得《几何原本》第六卷的命题 28:

在已知线段上作一个等于已知直线形的平行四边形,它是由取掉了相似于某个已知图形的平行四边形而成的:这个已知直线形必须不大于在原线段一半上的平行四边形,并且这个平行四边形相似于取掉的图形。2

2这段译文引用自兰纪正、朱恩宽翻译的《欧几里得几何原本》,陕西科学技术出版社,2003 年。——译者注

你看懂了吗?巴什马科娃和斯米尔诺娃说,这段话等价于求解二次方程x(a-x)=S。我赞同她们的理解。

欧几里得生活在亚历山大托勒密将军(即托勒密一世,在位时间是公元前 306 年到公元前 283 年)统治下的亚历山大城(图 2-1、图 2-2),当时的亚历山大城和古埃及的其他城市都在托勒密一世的统治下。欧几里得在亚历山大城创办了学校,开始传道解惑。在欧几里得出生前不久,亚历山大在尼罗河三角洲的西岸建立了亚历山大城,它与古希腊隔着地中海遥遥相望。人们认为欧几里得在古埃及定居之前曾经在雅典的柏拉图学院接受过数学训练。不管怎样,公元前 3 世纪的亚历山大城是卓越的数学中心,比古希腊更重要。

图 2-1 古亚历山大城。法罗斯灯塔曾是著名的灯塔,它是古代世界七大奇迹之一,在 7 世纪到 14 世纪的一系列地震中被摧毁。人们认为大图书馆就在这个城市东北方的宫殿附近。锯齿形线条表示原来的城墙(公元前 331 年)

图 2-2 亚历山大城的法罗斯灯塔,这是马丁·海姆斯凯克(1498—1574)根据想象绘制的

阿基米德比欧几里得年轻 40 多岁,他很可能曾在亚历山大城的欧几里得的继任者的指导下学习,仍然学习几何方法,尽管他把几何方法应用在更复杂的领域中。比如,他的著作《论圆锥体和椭球体》探讨的就是平面与一种复杂的二维曲面的交线。这部著作清晰地表明,阿基米德可以求解某些特定类型的三次方程,就像欧几里得可以求解一些二次方程一样,但是,阿基米德使用的语言全部都是几何语言。

※※※

公元前 3 世纪的辉煌时期过后,亚历山大学派的数学开始衰落。到了混乱的公元前 1 世纪(想想安东尼和“埃及艳后”克利奥帕特拉的故事),亚历山大学派的数学似乎消失殆尽。随着早期罗马帝国稳定之后,数学有了一定程度的复兴,同时也出现了脱离纯几何的思维转变。丢番图就在这个新时期生活和工作。

正如本章开始时所说的,关于丢番图,我们几乎一无所知,甚至不知道他生活在哪个世纪。最流行的猜测是公元 3 世纪,经常被引用的时期是公元 200 年到 284 年。我们注意到丢番图,是因为他写了一部题为《算术》的著作,这部著作只有不到一半流传到现在。现存的主要部分包括 189 个问题,其目标是寻找满足一定条件的一个数或一组数。在这部著作的引言里,丢番图概述了他的字母符号体系和方法。

在我们看来,他的字母符号体系相当原始,但在当时已经非常精致了。我们用一个例子来说明。下面是一个现代形式的方程:

x^3-2x^2+10x-1=5

丢番图把它写成下面的形式:

这里最容易辨认的就是数。丢番图使用希腊字母体系来书写数,其做法是采用希腊字母表中的 24 个普通字母,再加上 3 个过时不用的字母,一共 27 个字母。把这些字母分成 3 组,每组有 9 个字母。扩充字母表的第一组中的 9 个字母代表 1 到 9 的个位数字,第二组中的 9 个字母代表 10 到 99 的十位数字,第三组中的 9 个字母代表从 100 到 999 的百位数字。古希腊人没有代表 0 的符号,当时世界上的其他人也没有代表 0 的符号。3

3例如,“\psi\mu\theta”表示 749。用作单位的字母可以再被利用来表示几千,例如,“\delta\psi\mu\theta”的意思是 4749。\delta 通常代表 4,在这里代表 4000。对于超过 9999 的数,数字被分成 4 个一组,用“M”(代表 Myriad,意为“无数的”)或丢番图的点记号分开。例如,“\delta\tau o\beta\cdot\eta”代表 43 728 907。(看起来有点儿奇怪的字母“”已经被废除,在这里用来表示 900。因为“\zeta”代表 7,所以“”表示 907。注意这里没有占位的 0,因为这种方法不需要 0。)

所以,在前面给出的方程中,{\overline{\alpha}} 代表 1,{\overline{\beta}} 代表 2,{\overline{\iota}} 代表 10,{\overline{\varepsilon}} 代表 5(字母上面的横线表示用这些字母来代表数)。

在其他符号中,'\acute{\iota}\sigma 是 '\acute{\iota}\sigma o\varsigma 的缩写,意思是“等于”。注意,这里的字母上面没有横线,它们是用来拼写单词(实际上是单词的缩写)的字母,而不代表数。倒三叉戟符号  代表减去它之后到“等于”号之前的东西。

还剩下 4 个符号需要解释:K^{{\rm Y}}\varsigma\Delta^{{\rm Y}} 和 \dot{{\rm M}}。第二个符号 \varsigma 代表未知量,相当于现代的 x。其他符号都代表这个未知量的幂:K^{{\rm Y}} 代表三次幂(来自希腊语“\kappa\upsilon'\beta o\varsigma”,意思是立方),\Delta^{{\rm Y}} 代表平方(来自希腊语“\delta\upsilon'\nu\alpha\mu\iota\varsigma”,意思是“力量”或“幂”),\dot{{\rm M}} 表示零次幂,也就是今天我们说的“常数项”。

知道这些含义之后,我们就可以对丢番图的方程逐字翻译如下:

x^31x10-x^22x^01=x^05

如果加上省略的加号和某些括号,那么这个方程的意思就更清楚了:

(x^31+x10)-(x^22+x^01)=x^05

由于丢番图把系数写在变量后面,而不像我们那样把系数写在变量前面(我们写成 10x,他写成 x10),而且因为任何非零数的零次幂都是 1,所以这个方程等价于我最初写成的那个形式:

x^3-2x^2+10x-1=5

从这个例子可以看出,丢番图已经有相当精巧的代数记法。我们不清楚其中有多少符号是他原创的。使用特殊符号表示未知量的平方和立方可能是丢番图的发明,然而用 \zeta 表示未知量的方法可能是他从一位更早的作者那里学来的,这位作者是收藏于美国密歇根大学的《密歇根纸草书 620》的作者。4

4在这种用法中,希腊字母 \varsigma 的头顶有一道横线,我没有写成那样。《密歇根纸草书》可追溯到公元 2 世纪早期,要比普遍认可的丢番图生活的时代早一个世纪左右。

丢番图的字母符号体系也有一些缺点,其中主要的缺点是它不能表示两个以上的未知量。用现代术语来说,这个字母符号体系虽然有 x,但是没有 y 或 z。这是丢番图面临的一个主要困难,因为他的著作中大部分内容与不定方程有关(高斯误称丢番图的著作研究的全都是不定方程)。这需要简单解释一下。

※※※

数学家使用“方程”来表示某种东西等于另外一种东西。比如“二加二等于四”就是一个方程(或称为等式)。当然,包括丢番图在内的数学家们感兴趣的是含有某些未知量的方程。未知量的存在把一个方程从陈述句“是这样”变成疑问句“是这样吗?”,或者更常见的“何时这样?”。下面的方程

x+2=4

隐含着这样的问题:“什么加上二等于四?”答案当然是 2。所以这个方程在 x=2 时成立。

然而,假如我问下面方程的解是什么,答案就没那么明显了:

x+y+2=4

数学家看到这个方程的第一反应是想知道你在寻找什么样的答案。我们仅考虑正整数作为方程的解吗?那么该方程唯一的解是x=1,y=1。如果解可以是非负整数(即包含 0),那么该方程还有两个解:x=0,y=2x=2,y=0。如果解可以是负整数,那么该方程就有无穷多组解,比如x=999,y=-997。如果解可以是有理数,那么该方程也有无穷多组解,比如x=\dfrac{157}{111},y=\dfrac{65}{111} 。当然,如果解可以是无理数或复数,那么该方程就会有更多的无穷多组解了。

诸如此类,含有多个未知量并且可能出现无穷多组解(解的数量取决于所求的解的类型)的方程被称为不定方程

最著名的不定方程是费马大定理(即费马最后定理)中出现的

x^n+y^n=z^n

其中 xyz 和 n 都是正整数。当 n=1 或 n=2 时,这个方程有无穷多组解。费马大定理称当 n 是大于 2 的正整数时,该方程没有正整数解。

1637 年左右,皮埃尔·德·费马(1607—1665)在阅读丢番图的《算术》(拉丁文译本)时突然想到了这个定理,于是他在该书的页边空白处留下了著名的注记,陈述了这个命题,然后(也是用拉丁文)补充道:“对此我已经发现了一个完美的证明,可是这里的空白太小,写不下。”实际上直到 357 年之后,这个定理才被安德鲁·怀尔斯(1953— )证明。

※※※

如前所说,《算术》一书讨论的大部分内容是不定方程。而且丢番图还处于一个非常不利的境地,因为他只有一个表示未知量的符号(其他符号代表未知量的平方、立方等)。

为了了解丢番图是如何克服这个困难的,我们可以看看他对《算术》第2 卷问题 8 的求解方法,费马就是在这个问题的空白处写下了他的著名注记。

请购买后,继续阅读剩余章节内容。

.

.


.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多