分享

百年伽罗瓦—伽罗瓦理论介绍

 星光闪亮图书馆 2018-04-12

书接上回大魔王拉格朗日的故事及拉格朗日中值定理,大魔王拉格朗日有个徒弟柯西 “苦瓜”数学家柯西的故事及柯西中值定理,但是柯西却延误了两名数学家被柯西坑了的两个天才数学家——阿贝尔和伽罗瓦。阿贝尔的故事之前已经有讲过阿贝尔数学大奖背后的故事。这次再来看看伽罗瓦的故事及超级难理解的群论。


数学史上是不乏天才的,但是如果说非要要挑出几个最璀璨的,那大概是高斯、柯西、拉马努金……但是如果要说年纪最轻、经历最传奇的,那就绕不开这个名字——伽罗瓦。

一个十几岁解决了困扰了数学界几百年的n次方程根式解存在问题的男孩,一篇包括柯西在内的欧洲数学家都没有看懂的论文,一个投身于狂热的政治运动、又为了心爱的姑娘和专业的军人参加近乎是自杀的决斗的天才。伽罗瓦的一生,就像他群论和域论交替出现的伽罗瓦理论一样,瑰丽多彩。


接下来,这篇推送将会努力以最浅显的语言,从头开始梳理一下这位旷世的天才最著名的工作——伽罗瓦理论,也就是一元n次方程根式解的存在性问题。


【然而还是敬告各位读者,伽罗瓦理论对于大学数学来说也是非平凡的数学,大量的公式符号不可避免,想要深入理解还是参考文末的资料】

【顺便说一句,这才是主页菌天天学习的东西……苦逼的人生啊QwQ】


方程根式解问题:

早在几百年前,数学家们就已经搞出来一般的二三四次方程的通解形式,虽然丑,但是有:

二次:

三次:

四次:

五次



然而,到了五次方程的时候,人们发现再也找不到一般的根式表达了。在几代数学家的失败之后,人们开始猜想,是不是不存在五次方程的求根公式了呢?如果五次没有,那么五次以上一定都没有。可是为什么没有呢?

要知道,要说明一个东西有很容易,要说明所有现有的方法都做不到却很难。这个问题困扰了全体数学家整整两三百年,而最后,却是被一个毛头小伙子——伽罗瓦解决了。

而他的方法,就是开创性的应用了和群论以及域论有关的知识。


一、铺垫:

群、子群、正规子群

相信不论是学过抽象代数还是没有学过抽象代数的人,都曾听说过群论的鼎鼎大名。那么,到底什么是群呢?


幻想你来到了另外一个生命星球,来到了他们的小学课堂。这是一门你不知道是什么科目的课,他们说着你不懂的语言。这个时候,你如何搞懂他们在干啥呢?


你听到老师说:“Ena~ Ena~”

学生们大叫:“Dva!”

老师又说:“Ena~Dva~”

学生们回答:“Omar!”

老师:“Dva~Dva~”

学生:“Kya!”

……


是的,你也许完全不知道Ena、Dva、Omar和Kya是什么,但是你会注意到对于老师给出的两个单词,学生们总是会回答以某一个单词。这就像一个映射一般,对于给定的两个元素,总有一个元素与这个二元组对应。

我们不妨说,学生和老师在讨论一个集合上的某种“运算”,对于给定的两个元素A和B,总存在一个唯一的C与这个运算对应,记为C=A*B


例如上面的情况就可以记为:

Ena*Ena=Dva

Ena*Dva=Omar

Dva*Dva=Kya


最后你听到了老师说:“Ena~Omar~”,学生们异口同声回答:“Kya yesu!”

于是你终于猜到,这好像是加法,Ena=1,Dva=2,Omar=3,Kya=4。而那个运算*,其实就是整数里的加法一样。


所以,我们其实在观察这样一个集合,里面有一堆我们不知道也不关心是啥的元素(比如Ena,Dva,Omar和Kya),然后有一种运算,对于给出的两个元素可以“运算”(其实是我们定义出来)一个结果。


但是请注意,如果仅仅是在一个集合上定义了一个运算,使得运算的结果依然落在集合里,那么这个还不能叫做群,只能叫做一个“半群”(而且请注意,是集合加上这个运算叫做半群,单独的集合什么都不是)。一个集合G和其上面的运算*还要满足下面的几个性质才能叫做群:


1.(之前提过的要求)a,b∈G,a*b∈G

【封闭性:运算结果仍在群中】


2.a,b,c∈G,(a*b)*c=a*(b*c)

【结合律:连续运算顺序无关】


3.存在一个元素e,使得对于所有G的元素x,都有x*e=e*x=x

【存在幺元,或称不变元,与其运算保持不变】


4.对于任何一个元素x,存在一个元素x-1,使得x*x-1=x-1*x=e

【存在逆元,一个元素和逆元运算等于幺元】


对于满足上面这些要求的集合和其上的运算,我们称之为一个群。


我们开始了解,群是一“群”元素,但是他们不是孤立的。这些元素通过一个运算,群里的元素形成了紧密的联系,最简单的例子,就是下面的克莱因四元群:

解释一下,+就是我们前面一直用的*的运算标识,每一行和每一列的交点处就代表着运算的结果。例如e行和f列的交点是g,意味着e+f=g

上面的这个表里有一个0,它和所有元素运算之后保持另一个元素不变,因而是幺元;且每一行、每一列都有e,这意味着每个元素都存在逆元。结合律也可以验证。


但是,抽象代数、或者说是群论,最有魅力的地方就在于,这些元素完全是抽象的,你可以给他们以任何一种合理的诠释,只要满足那几个要求即可。例如,上面的克莱因四元群就和下面的这个正方形重合操作群是一致的:

元素0

元素e

元素f

元素g


注意,这里的每个元素代表着一种旋转或者翻转的操作,在操作前后正方形是重合的,只是顶点的顺序产生了改变。而两种操作元素的“运算”a*b就是先执行a再执行b的操作。【注意:顺序很重要,群里的操作一般不满足交换性,也就是说a*b和b*a是不一样的】读者可以自行验证上面所说的运算表(就像加法小九九一样)。例如e*e=0的意思就是,如果你左右翻转两次,就相当于什么都没有做;e*f=g的意思就是,如果你先左右翻转再上下翻转,其效果等于直接将整个正方形旋转180度。


注意,这里出现了一件有趣的事情。此前我们讨论的例子(比如整数和整数上的加法),这个集合都是无限大的。而这里则不然,只有四个元素,他们无论如何怎么相互运算,都逃不出这四个元素的范围,就像孙悟空逃不出如来佛的手掌心一样。因为要知道,保持正方形的形状但是完成顶点之间的对换还有操作还有很多,比如下面这个按照对角线翻转:

但是克莱因四元群里的四个操作无论怎么任意相互运算,都造不出这样一种操作。运算的任意性和它们形成的操作的有限性形成了如此鲜明的对比,其背后的数学内涵耐人寻味。这四个元素就像一个与世无争的孤岛一样,自己任意运算,却囿于其中。


子群

但是四个元素是最小的孤岛吗?不是!我们接下来介绍子群的概念就告诉我们,在孤岛之内还有更小的孤岛,就像在一个班级之内还是会有更小的朋友圈子。


例如看0和e这两个元素

看到了吗?只看0和e之间,其实他们也是在自己玩,如果我们只有保持不动和左右翻转这两种操作的话,那么其实我们无论怎么对一个正方形变换,得到的肯定就只有正反两种正方形而已,所以道理是显而易见的。


于是我们知道,如果已经有一个集合和一种运算构成了群,而且这个集合内部还有一些更小的集合的子集,他们竟然也满足封闭性(那就是内部任意相互运算不会跑出来),那么就构成了一个小一点的群,我们称之为子群。【我没有提群的剩余三个性质,想一想为什么?】


随便想想就知道,任何一个群至少有两个子群:一个是自己全部,一个是仅仅包含不变操作的幺元的集合。但是还有一些既不是自己又不仅仅是幺元的子集,它们是非平凡的子群。


而最简单的例子,就是上面的克莱因四元群。要知道,正方形的四个顶点任意排列操作可是有4!=24种可能性的,但是克莱因四元群只有四个元素,它们任意运算就出不了这个集合。


正规子群

但是子群里还有一类具有更独特地位的子群,那就是正规子群。(后面伽罗瓦证明根式解的时候,与正规子群的性质息息相关)。正规子群当然是子群,但是它是一类更有趣的(或者说性质更好的)子群。


正规子群在子群的基础上做了这样的要求:在外界看来,这个子群自成一个圈子。什么叫做自成一个圈子呢?那就是任何一个元素x从左边和这个子群N里的元素运算出的所有结果(记为xN),和从右边作用这个子群运算得到的所有结果(记为Nx)是同样的(xN=Nx)。也就是说如果我们把N中的元素称作N类元素的话,那么一个元素和N类元素的运算与它在左边还是右边无关。


换句话说,我们如果在等式两边右乘上x的逆x-1,就能得到xNx^{-1}=N。这个式子非常重要,记住它,最后会用到它。


域论和多项式方程的根:

好的,群论暂时就先说这么多吧。我们现在进入到关系更密切的多项式理论和域论之中。


域也是一个集合,上面定义着加法和乘法两种运算,这两种运算都构成了群,同时,加法和乘法还满足分配率,那就是说a(b+c)=ab+ac成立。我们最常见的域比如说有理数域,任何两个有理数加减乘都是有理数,而且任何一个有理数x都有相反数,非零的有理数都有倒数(它们分别是x在加法和乘法下的逆)。所以,全体有理数在有理数的加法和乘法下构成了一个域。


但是注意哦,还有一些并不平常的域,例如形如a+b×sqrt(2)的数(a和b是有理数,sqrt(2)表示根号2),我们稍加检验就知道


它们都满足原来的有理数加上有理数乘以根号2的形式,所以这也是一个域。


简单介绍完域我们来看看多项式的根,考虑多项式f(x)=(x^2-5)(x^2+1),我们显然看到这个多项式的根式是±Sqrt(5)和虚数±i。但是有关多项式最核心的的一个东西出现了,那就是我们总是可以给多项式的根换标签(专业名词为自同构),使得换完标签后这个域保持着原来所有的运算性质。


简单来说就是,原来这个多项式有两个根为±sqrt(5)。我们现在总是可以把正的根号五当做负的根号五,把负的根号五当做正的根号五。当做的含义就是,我们把所有的数a+b×sqrt(5)写成a-b×sqrt(5)来运算,我们会发现一切跟加法、乘法和逆有关的等式保持不变

注意到了吗?AMAZING!我们如果在心里把b前面的符号默默换掉,然后用我们换掉的数字做运算,得到的结果刚好也是把符号换掉的结果!也就是说,仅仅调换根号五的符号做一个调换,不会改变a+b×Sqrt(5)这个域的一切运算性质。而其实,把根号五改成虚数单位i,依然成立。


一个域存在着一些“换标签”的操作,使得这个域在换完标签之后依然保持着原来域的运算性质。用精确的语言来说,就是有一个映射σ是将某一个域F内的每一个元素换成F内的另外一个元素,满足对于域内的任何两个元素x,y:

σ(x+y)= σ(x)+ σ(y)

σ(xy)= σ(x) σ(y)

σ(x的逆)= σ(x)的逆


但是这件事情有什么意义呢?

要知道,群是一个用来表示对称性的结构。每当我们看到对称性的时候都会不由自主的想到群。道理是,群之间元素的运算依然落在群里,很好的表现了诸如“上下对称且左右对称,则旋转180度也对称”这样的对称性质的保持。


在进入下面的内容之前,相信你可能已经有点被绕晕了。一会是子群,一会是域,一会是域,一会儿又是自同构。这一切究竟跟五次方程没有根式解有什么关系呢?一句话说明我们要干的事情就是:【仔细读几遍以确认我们要干什么】


一个包含了有理数和五次方程的所有根的域,具有很多自同构的对称性,这其中使得有理数保持不动的那类自同构操作刻画了这个域的性质。我们只需要说明,这种对称性结构是用加减乘除和开根所能表达的数域能力之外的,就说明了五次方程没有根式解。

为什么要这么做呢?我们首先需要理解用根式来表示出一个高次方程根的过程本质是什么。回忆一次方程不需要根号,域的除法性质天然让ax=b不需要根号就能表达出根x=b/a;而在二次方程里,我们不可能仅仅用加减乘除表示出根了,所以我们引入了开方。但是与其说是引入了开方运算,不如说是我们引入了平方等于某个有理数的“有理数域”之外的元素进行了“开疆拓土”。最简单的例子,x^2-2x-1=0是一个有理数域里无解的方程,但是我们引入了平方等于2的元素根号二之后就可以表示了(1+根号2)。类似的你会想到,一般的三次方程,需要引入三次方为有理数的扩域操作。


所以,我们用加减乘除和开方表示出一个高次方程的解的过程,其实实质是通过一步步扩张现有的域,努力把新的元素放入域中,而在最后让方程的根落在我们扩展的域中。这样的做法叫做扩域。例如上面的把根号2引入有理数域的过程,就可以记为Q(sqrt(2))【这个域内的元素就是那些形如a+b*sqrt(2)的数】,表示在Q中加入根号二之后让它们任意加减乘除最后能够得到的所有数字所构成的数域。而最后根式解表示出来时那一层层嵌套的根号,就是我们每一步扩域最好的见证。

(上图是正十七边形圆心角的余弦值的根式表达式,一共嵌套了三层根号。但是因为都是二次方的扩域,所以高斯以此证明了正十七边形是可以通过尺规作图得到的)


但是等等!因为多项式的性质,所能扩张出的域总是带有某种对称性!比如上面的Q(sqrt(2)),我们会注意到如果我们写成Q(-sqrt(2))也是可以的,换句话说,如果我们设出这样一个映射σ:σ(a+b*sqrt(2))=a-b*sqrt(2),那么原来是多项式x^2-2x-1=0的根(1+2*sqrt(2))经过映射之后变成1-2*sqrt(2)也必然成为这个多项式的根!


事实上,这不是偶然,我们只要让这个在Q(x)的域里的自同构映射σ对所有有理数q保持着σ(q)=q,那么σ作用于多项式的一个根x,得到的σ(x)不出意外一定也是多项式的一个根,这是因为考虑原来的有理系数域上的多项式以及其根x,我们有

然后我们用σ作用于等式两边:

倒数第二步的等号,正是来自于σ保持了有理系数的不变性。其余我们能够分离次方和乘法的理由,来自于σ是解的域上自同构上的良好性质。这个等式最后两项的相等告诉我们,σ(x)也满足f的根的形式,所以σ(x)一定也是f的根。


AMAZING!所以我们注意到这样一个重要的性质——如果我们有了一个最后包含了原来多项式所有根的域,其过程是一路加入了α1,…,αn,使得最后的域为Q(α1,…,αn)【顺便提一句,这样的通过有限次加入前一个域里多项式的根的形式,一步步得到整个域的过程叫做代数扩张,而最后包含原来多项式所有根的域叫做多项式f的分裂域】,那么其实我们可以通过整个域的自同构作为某种探针和投射,来推敲这个多项式分裂域的对称性质。


通俗起见,我们看一个多项式的例子,那就是(x^2-2)(x^2+1)=0


这个方程的根有四个,分别是±sqrt(2),±i。想要让有理数域包含这些数字进去,我们需要把sqrt(2)(或者-sqrt(2))以及i(或者-i)一步步加入域中,就像这样:

第一步扩域

第二步扩域


以上的过程就是先加入根号二,再加入i的扩域过程。因为我们是通过根式扩展这个域的,所以它具有很好的对称性。比如我们已经说明,第一步的扩域Q(sqrt(2))中,包含了这样的一个自同构(注意我们要保持有理数不变)

而显然,因为Q(sqrt(2),i)比Q(sqrt(2))还要大,所以这样的同构性质对于更大的域还是保持的。但是其实对于更大的域,还有一种同构操作

看到没有!域大了就是浪!因为大的域包含了更多的对称性,所以也就可以包含更多的域内部的自同构操作。而其实,我们还有另外一种扩大Q到我们需要的域的方法:

只不过是顺序不同而已,之前是先放进去根号二,然后再放入i。现在我们先放入i,再放入根号2。而在这种不断“开疆拓土”的过程中,第一步里就有了上面σ2自同构的一个特殊情况:

没错,这其实还是上面的那个自同构,毕竟它实质上就是最广泛意义下复数的共轭。


可是等等!我们从两条道路、用不同的顺序不断扩域达到了包含(x^-2)(x^2+1)所有根的域。但是似乎我们有的对称却很有限,我们如果是加入了根号二,那么同构的操作就是把根号二前面的有理系数取反;我们如果加入了虚数单位i,那么同构的操作就只能把i前面的系数取反。


这提示我们,一个域在扩张之后所增加的对称性,和我们填入的元素有很大的关系!事实上我们将要说明,每一步加入根式根或者加入虚数的扩域过程F→F(u),和一个扩张之后的域F(u)上的一种自同构操作一一对应!


就是上面的那个例子:我们现在有四个域,根据扩张的关系(能够通过添加一个元扩张得到则连一条线),我们得到以下的一个塔状的架构:

再考虑每一个保持每一级域不变的条件下,最大的域Q(sqrt(2),i)具有的自同构的操作。带上恒等映射,我们把所有满足要求的自同构写在每一个域边上(事实上,这也正是添加一个元所具有的对称性的体现)

解释起来就是,Q这个域所能包含的自同构是最多的(因为它什么别的东西都没有,),而对于Q(sqrt(2)),那么保持这个域不变的分裂域Q(sqrt(2),i)的自同构就只有恒等和交换i的符号了【反正这个域也没有i嘻嘻】其余同理……


其实我们还漏了一个操作,对于Q而言,如果仅仅需要保持Q不变在Q(sqrt(2),i)上考虑自同构,还有第三个自同构操作σ3,它先把含有i的全部调换符号,再把含有根号二的调换符号。所以这个完整的图如下:

重点来了,如果说一个域F扩张之后变成了E,那么E/F这样一个扩张过程势必减少了一些对称性的自同构操作(如果到了最后我们得到了整个域,那么显然我们除了固定不动的恒等映射别无选择)。而每一个中间过程的域K的性质,就是根据保持K不变的条件下,能够对最大的分裂域做多少自同构操作所体现的【操作越多说明这个域越靠近有理数域的中心,越底层】。所以我们现在不妨把域都丢掉,专门观察一下这个自同构的结构:

这其实还是上面那个域塔的图,但是我们把自同构操作提出来之后,你会发现原来是大的域在上,小的域在下;现在则变成了小的群在上,大的群在下……


等等,你说这些σ构成了群?

对啊,运算表在这里:

【这个表很好验证,四个自同构可以自己复合一下(例如先变根号二的符号再变i的符号,或者连续变两次i的符号)】


盯着这个表,我不禁陷入沉思…………

哦对了,这个表好熟悉啊!这不是……刚才提过的克莱因四元群吗?

没错,憋了七千多字,终于可以把伽罗瓦最经典最核心的话说出来了:


如果一个方程是可以用根式表示出其根的,那么存在一个从Q逐级搭建起来最终触及到分裂域【包含该多项式所有根】的域塔,以及把每一个域换成一系列(保持被换掉的域不变的分裂域上的)自同构的群塔。这个群塔和域塔之间是一一对应的。

上面的例子里,这两个塔就是:

这就是大名鼎鼎的伽罗瓦对应。更复杂的群塔如下(左边是域,右边是群):


还有一个不加证明给出的结论:

无论是加入一个根号的结果,还是素数次的单位根,扩张域的过程对应的群塔里缩小的群之商群,是一个循环群。


好了,既然我们现在知道添加根式扩张域具有这样好的结构性质,我们就来看看我们能不能对五次方程的根式域(也就是分裂域进行这样的操作呢?)


那我们首先得找到一步一步上到顶楼的阶梯(也就是一步步的扩张)。

可是假如我们眼前有一个例如x^5-16x+2所有根x1,x2,x3,x4,x5组成的一个域,对应的是这么一坨

要知道,我们之前的那个域,是结构非常好的:

一个上图是一个非常通俗的解释,那就是一个结构很好的(数学上叫做可解的域),一定可以分成这样一层一层的洋葱一样的同心圆结构。自同构实质上就是保持内层的域(圆)不变,转动外层环形区域内元素的过程。而我们接下来要证明的,就是上面这个五次方程的域,不存在这样的好的同心圆结构。


如何证明呢?我们先看对于那些有同心圆结构的域,我们怎么划分出这样的一层层的分界?


这里引用一个例子:设想现在有好几个班级,比如甲乙丙丁,然后有若干个全年级范围内进行交换新年礼物的计划(A,B,C,D)。那么问题来了,你怎么判断一个调换计划(比如A)是否保持了甲班级的礼物都没有交换到别的班级去呢?(假定我们无法得知交换的具体方式)


我们其实只需要进行这样的操作:先执行A计划,然后除了甲班之外的所有班级执行任意一个其他的交换礼物计划,最后再按照A计划反向调换回来。注意到,如果A计划使得甲班的同学的礼物没有出去到其他班级,那么第二步的调换对于他们而言没有影响,最后回来的一定还是自己的礼物。


现在回到前面的问题,把礼物当成“标签”,把交换礼物当做域内部的自同构。刚才说了,能不能划分出一个“甲班”这样的子一级域(由大圆到小圆缩小的过程),实质就是考察是否存在一些自同构的操作组成的集合N,使得任何全局的操作x,xNx^{-1}=N。


而这也就意味着,每一个域的自同构群,必须是扩张之后域自同构群的正规子群,这样的扩张成为正规扩张,而正规扩张之后的商群必须是一个循环群。


好了,是时候给五次方程以致命一击了。


我们接下来说明,五次方程的根组成的这样的域,有时是做不到这一点的。考虑自同构群为任意五个元素的置换S5(也就是说调换任何两个根且保持Q不变的置换都是自同构),它的正规子群只有{e}和A5两个,但是由A5缩小到{e}的过程不是一个正规扩域,商群不为循环群,故这是不可能的,所以五次方程没有根式解。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多