分享

伽罗瓦理论(3):对称性和群

 天选小丑 2023-07-28 发布于广西
在上一篇文章《伽罗瓦理论(2):用根置换解方程的初尝试》中,我们了解了范德蒙和拉格朗日在探索解方程通用方法方面的新尝试。他们的方法给我们呈现出了解方程和根置换之间的联系,并且引出了一个非常重要的概念——对称性。对称性不仅可以用来描述具体的事物或者几何对象,也可以用来描述多项式方程的根。伽罗瓦正是在拉格朗日等前人的研究成果上得到了启发,从而洞察到了多项式方程根的对称性与根式解之间的本质联系,然后通过创造等一系列深邃而优美的新概念、新思想,以高屋建瓴之势彻底解决了多项式方程根式可解性的大问题。现在我们需要深入地来理解对称性的含义,以及描述对称性的语言——,为后续理解方程根式解大定理的证明做一个重要的理论铺垫。

1  什么是对称性?


对称性这个概念我们每个人都很熟悉。在日常生活中,具有对称性的事物随处可见。你所用的书本、电脑、电风扇,自然界中的蝴蝶、青蛙、蜻蜓,以及正方形、菱形和圆形等几何图案,甚至是你自己的身体,等等等等,都是对称的。对称性无处不在

但是,在数学上,对称性的含义不仅仅是直观上看起来对称的那些事物,一些抽象的数学对象或者物理定律也具有对称性,对称性是一个深刻而优美的概念。

我们从一个简单的例子开始,直观感受一下对称性的含义。

下面是一个正三角形(也称等边三角形),这个三角形三条边等长,在平面中占据了一定的空间,并处在某一个具体的位置中(中心点所处的位置)。

Image

根据正三角形的性质,如果我们把这个三角形绕着它的中心旋转120°,那么它将与原来的图形重合,即它保持结构不变(三角形的边长、形状、所占据的空间方向和所处的位置等结构特征都保持不变)。因此,我们说这个三角形在绕中心点旋转120°这个变换(也可以称为操作)下保持不变。旋转120°这个变换就称为这个三角形的一个对称变换

我们可以用一个比较出名的游戏规则来理解这个对称变换。假如你先看了一眼放在你前面的一个正三角形,然后主持人说:天黑请闭眼,这时有人趁机给这个三角形做了一个手脚,也就是对它做了一个变换。变换结束之后,主持人说:天亮了请睁眼,然后让你分辨一下这个三角形是否被人动过。如果你睁眼之后发现三角形还是保持原来的结构,即它的边长、形状、所占据的空间方向和所处的位置等结构特征都保持不变,以至于你无法区分三角形是否被动了手脚,那么就说明刚刚那个人对这个三角形所作的变换是一个对称变换。

当然,这个三角形的对称变换不止一个,还有旋转240°和旋转360°这两个对称变换。由于旋转360°刚好是一整圈,所以其效果与旋转0°这个变换相同,都是保持三角形原地不动,相当于什么都没做,这样的变换也是一个对称变换,我们称之为恒等变换

但是,如果旋转的角度不是0°、120°、240°这三个角度,那么结果就不一样了。比如,旋转90°这样的变换就无法保持三角形的结构不变,因为各边指向了与原来不同的方向。
Image

这里特别说明一下,对于旋转变换我们没有指明是逆时针旋转还是顺时针,实际上用哪一种都可以,比如逆时针旋转120°就相当于顺时针旋转240°。所以无论选择逆时针还是顺时针,旋转对称变换都是那三个,我们不妨就选择逆时针的旋转方式来描述。

由于正三角形本身也是轴对称的图形,所以除了旋转这一类的变换之外,当我们沿着任意一条对称轴(每条边上的垂直平分线)把三角形进行翻转的时候,其结构也会保持不变,所以翻转变换也是一种对称变换。(这里的翻转要求是翻转180°使得三角形回到原来所在的平面)
Image

很明显,这样的翻转对称变换也有三个。因为三角形有三条对称轴,每一条对称轴就表示了一个翻转对称变换。同样的,这里的翻转变换我们不妨也选择沿着对称轴逆时针旋转的方式来描述。

所以旋转变换和翻转变换加起来有6个,在这6个变换的作用下,正三角形都能够保持与原来的图形重合,即保持结构不变。由于这6个变换作用在正三角形这个对象上能够保持其结构不变,所以我们说正三角形在这6个变换下具有对称性。比如,我们可以说正三角形在0°、120°、240°这三个角度的旋转变换下具有对称性。也可以说,正三角形在三条对称轴的翻转变换下具有对称性。

总之,当我们说一个对象具有数学意义上的对称性的时候,我们必须指明是在哪些变换下具有对称性,脱离了具体的变换谈对称性,这在数学上是没有意义的。比如,当你说正三角形具有对称性的时候,你到底在说什么?没有具体的变换何来对称性?如果我给你一个旋转90°的变换,你这个正三角形还具有对称性可言吗?

所以,对称性就是一个对象在一些变换下保持结构不变的性质。这就是数学上关于对称性的一个简单定义。从这个定义中,我们可以看到,除了要有一个对象之外,还有另外三个关键词:变换结构不变。当然,我们上面所说的正三角形旋转变换和翻转变换指的都是刚性运动变换,即在变换过程中都能够保持所有点之间距离不变的变换,这种变换不能对正三角形进行类似折皱、伸缩和弯曲等操作,使得点与点之间的距离发生变化,否则就没办法保持三角形的结构不变性。

2  群的定义


为了一步一步地导入群的定义,我们继续以上面的正三角形为例。虽然我们已经搞清楚了正三角形的所有对称变换(3个旋转变换和3个翻转变换),也知道它在这些变换下具有了对称性。但是,这并不是对称性的全部内涵,我们还需要进一步了解这些对称变换之间的关系。

为了更好地描述正三角形这6个变换之间的关系,我们悄悄地给各三角形的每个顶点标上不同的符号,这样我们就可以看出它们被旋转到了哪儿。这些符号只作标记之用,并不属于需要保持的结构。如果不看这些符号,这个三角形在旋转变换和翻转变换后看起来就和原来完全一样。同时,我们也用x、y、z给每条对称轴起一个名称,然后用I、U、V分别表示旋转0°、旋转120°和旋转240°这三个旋转对称变换,用P、Q、R分别表示绕x轴翻转、绕y轴翻转和绕z轴翻转这三个翻转对称变换。如下图所示:

Image

现在我们先来看三个旋转变换作用在三角形之后是什么结果。结果如下图所示:

Image

上面那个三角形是变换前的初始状态,下面是三个旋转变换单独作用一次之后正三角形的终态。如果我现在让两个旋转变换按照先后顺序依次连续作用两次,结果会是怎么样呢?比如,先对处于初始状态的正三角形做一个U变换(旋转120°),然后再做V变换(旋转24),结果变为:

Image

从这个结果中我们可以观察到,连续施加两次旋转变换之后,正三角形保持初始状态不变,即三个顶点的位置与第一次旋转前的初始位置一样。也就是说,我们对正三角形依次连续施加U和V变换(先做U,后做V)之后,其结果与恒等变换的作用结果相同。

再看一个例子。如果我们先对正三角形做Q变换,即先绕y轴翻转,然后再做U变换,即旋转120°,经过这两个变换连续作用之后,三角形的结果变为:

Image

我们对正三角形连续施加Q和U变换(先做Q,后做U)之后,其结果与P变换(绕x轴翻转)的作用结果相同。

如果我们把正三角形所有的对称变换看成一个集合,即这个集合的元素是正三角形的6个对称变换,不妨记为S:={I,U,V,P,Q,R}。然后我们在这个集合的元素之间定义一个二元运算“·”,称为“乘法运算”。比如,我们可以把U和V取出来做乘法运算:V·U。这个运算的规则我们就定义为变换的复合

所谓变换的复合,就是我们上面已经说到的按照先后顺序依次施加两个以上的变换。比如,V·U表示的是对正三角形先做U变换,后做V变换,即从V·U这个表达式的右边开始施加变换。而这样连续两次的变换结果我们已经知道了,它与I变换的作用结果相同,I变换也是集合S中的元素。因此,集合S中的两个元素U和V作乘法运算V·U之后的结果仍然在集合S中。

我们可以按照通常的乘法运算来这样表示:V·U=I。甚至有时候我们还可把“·”符号省略,直接记为VU=I。同样地,Q和U这两个运算的乘法运算和运算结果可以记为:UQ=P。P变换也是集合S中的一个元素。因此,Q和U两个元素作乘法运算U·Q之后的结果仍然在集合S中。

所以,对于集合S和定义其上的二元乘法运算“·”,我们猜测“两个元素作乘法运算之后的结果依然在原集合中”这个规律可能具有普遍性,而不仅仅对于VU和UQ才成立。事实上,不难验证,集合S中任意两个元素的运算结果如下面的乘法表所示:

Image
表3.2.1:正三角形对称变换乘法表

这个乘法表最左边一列和最上面一行都是集合S中的所有元素,中间的那个矩阵的矩阵元素表示左边第一列某个元素与上面第一行某个元素作乘法运算之后的结果。

这个乘法表完整地描述了正三角形的6个对称变换之间的运算关系。从中我们可以看出,在变换复合的乘法运算下,集合S中的任意两个元素作乘法运算之后,结果仍然是S中的元素。如果用数学语言来描述,那就是: 所以,我们说正三角形这6个对称变换构成的集合S,在乘法运算(变换的复合)下具有封闭性

这就是我们从正三角形对称变换的观察中提炼出来的、反映了对称变换之间关系的第一个法则:对称变换集合在乘法运算下具有封闭性

因为集合S中的元素在乘法运算(变换的复合)下具有封闭性,那么对于任何两个元素a和b,它们运算之后的结果a·b还是S中的元素。既然a·b也是S中的元素,那么我们就可以继续把它与另外一个元素c作运算,即(a·b)·c。比如,我们先取U和Q两个元素作运算,然后再将它们的运算结果与V作运算,那么根据表3..2.1,其结果为:(U·Q)·V=P·V=R。即我们先让UQ结合进行运算,然后再让它与V进行运算。

我们也可以改变结合的顺序,看看结果是否一样。比如,我们考虑这样的结合顺序:U·(Q·V)。即先让QV结合进行运算,然后再将它们的运算结果左乘U。同样根据表3.2.1,我们有:U·(Q·V)=U·P=R。

因此,两种不同的结合顺序运算出来的结果是相同的,都等于R。这就表明,正三角形对称变换之间的运算(变换的复合)满足结合律,即对于集合S中的任何三个元素a,b,c,都有(a·b)·c=a·(b·c)。这是我们提炼出来的第二个法则:对称变换集合在乘法运算下满足结合律

我们再观察表3.2.1那个乘法表,第一列表示所有元素与I右乘的结果都等于元素本身。同样地,第一行表示所有元素与I左乘的结果也都等于元素本身。我们可以把这两个结果总结为:存在一个元素e,使得对于任意一个元素a,都有a·e=e·a=a。在正三角形的对称变换集合S中,这个e就是I,即恒等变换。我们把这个e称为单位元。这是我们提炼出来的第三个法则:对称变换集合在乘法运算下存在一个单位元,使得对于任意的元素a,都有a·e=e·a=a成立。

对于正三角形,我们考察旋转120°和旋转240°这两个变换的乘法运算,即V·U。根据乘法运算的定义,即变换的复合,V·U表示对正三角形先做U变换,后做V变换,即先旋转120°、再旋转240°,这样变换的结果相当于把正三角形旋转一整圈360°,也就相当于什么都没做,跟恒等变换I的作用结果相同,即V·U=I。同样地,也有U·V=I。因此,对于对称变换集合S中的一个元素,比如U,我们都可以找到另外一个元素V,使得V·U=U·V=I。

实际上,U和V互相成为对方的逆变换。也就是说,当我们施加U变换之后,我们可以找到另外一个变换V,使得被施加了U变换后的正三角形复原到原来的初始状态,相当于什么都没动的恒等变换I。逆变换的法则实际上就是算术中的除法运算,比如对于有理数3,我们可以找到另外一个有理数1/3,使得3*1/3=1。

从表3.2.1可以看出,对称变换集合S中的任意一个元素都存在逆元素。其中,翻转对称变换的三个元素P、Q、R的逆元素都是它们自己本身,比如:先让正三角形绕x轴翻转,然后再翻转一次,就回到原来的初始状态,相当于什么都没做的恒等变换,即P·P=I。因此,对于S中的任意一个元素a,我们都可以在S中找到唯一一个逆元素b,使得a·b=b·a=e(这里的e就是恒等变换I)。

所以,我们提炼出来的第四个法则就是:对称变换集合的任意一个元素在乘法运算下都存在一个逆元。

综上所述,我们从正三角形的对称变换集合S,以及定义其上的乘法运算中提炼出了4条法则,我们不妨先简称为:封闭性结合律存在单位元存在逆元。这4条法则体现了正三角形对称变换集合中元素之间的运算关系

虽然上面这4条法则我们从正三角形这个特殊例子中提炼出来的,但是它们的适用性可不仅局限于正三角形,正四边形可不可以?比如正方形,显然是可以的,正方形在旋转0°、90°、180°、270°和围绕4条对称轴的翻转变换下下都可以保持结构不变,因此,正方形在这8个变换下具有对称性。我们不难验证,它的所有对称变换构成的集合在变换的复合这个乘法运算下也满足4条法则。同样地,正五边形、正六边形,  ,正n边形的对称变换在乘法运算下也满足4条法则。再继续推广下去,我们发现这4条法则不仅适用于几何对象的对称性,也适用于其他具体事物的对称性,比如风车、电风扇、分子晶体、建筑物等等。

因此,这4条法则是所有具有对称性的对象所共有的抽象法则,也可以称为公理。我们把这种从对称性对象中抽象出来的、满足4条公理的集合和运算称为。它的数学定义如下:
定义3.2.1    群
在非空集合  中定义元素之间的一种二元运算,称为乘法,记作'  '(在不混淆的时候可略去  )。如果  对乘法运算满足下列4条公理,则称  是一个,记作  ,或简单地用  表示:
(1)封闭性: 若 ,则  ;
(2)结合律: 若 ,则  ;
(3)存在单位元:对于任意的  ,存在  ,满足:  ,  称为  的单位元
(4)存在逆元:对任意的  ,存在一个  ,使得:
  ;  称为  的逆元,记为:  。
在这个定义下,我们上面所说的那个由正三角形对称变换组成的集合S,就在乘法运算(变换的复合)下构成了一个。还有正四边形、正五边形、正六边形,  ,正n边形等几何对象的对称变换在乘法运算下也构成群,因为它们的对称变换也满足上述4条公理。还有很多很多其他对称图形,它们的对称变换也在乘法运算下构成群。

Image


当然,上面这个群的数学定义虽然看起来很严谨,但是也显得有点高冷,我们还是作一番补充。

在群的这个定义中,封闭性和结合律这两个公理的意思是非常明确的,也没什么好说的。我们这里补充一点,那就是单位元和逆元都是唯一的

证明如下:

假设存在两个单位元  和  ,那么根据单位元的性质,我们有如下两个等式同时成立: 第一个等式是把  作为单位元,然后把  作为普通元素与单位元  相乘,结果当然还是  ;第二个等式是把  作为单位元,然后把  作为普通元素与单位元  相乘,结果当然还是  。而等式左边的乘积  表示的是同一个群元素,因此就有: 这个结果表明:群的单位元是唯一的

对于逆元的唯一性,可以用类似的反证法来证明。任意给定一个元素  ,假设存在两个逆元b和c,那么根据逆元的定义,我们有: 用b乘以第二个等式两边,左边为:   右边为: 而一个等式两边同乘一个元素的结果当然还是相等的,于是上面两个式子相等,即: 这个结果表明:群元素的逆元是唯一的。   

除了单位元和逆元的唯一性,我们还可以再进一步延伸,看看群这个概念还有什么含义。

首先,构成一个群需要两个基本要素:一个非空集合G,以及一个定义在这个集合之上的二元运算·”,有时候也称为群乘法运算。之所以要定义一个运算,是因为,如果只给一个集合,我们就只知道这个集合中的元素,而不知道这些元素之间的关系。在数学上,有时候元素之间的关系比元素本身更重要、更值得我们关心。就好比某某人是谁不重要,重要的是他跟你有什么“关系”。

其次,有了非空集合和二元运算之后,还需要满足4条公理才能构成群结构。而这4条公理实际上是我们从对称性中抽象出来的,所以群是描述对称性的语言。所有与某个对象的对称性相关联的对称变换,在变换的复合这个运算下,都必然会满足4条公理。这4条公理刻画了对称性事物的特征,任何具有这4条公理特征的事物,都具有变换下的对称性。

最后,群是一种抽象的代数结构,它的定义与对称性变换所作用的对象没啥关系。你仔细看上面的定义就知道,这个定义并没有建立在类似于正三角形这样具体的对象之上,而是在一个抽象的集合上定义了一个满足了4条公理的运算,这个抽象的集合可以是对称性变换,也可以是其他抽象的数学对象,比如我们熟悉的整数,它在加法运算下就构成了一个群。所以,群可以脱离具体的对象而存在,我们可以抛开具体的对象而只研究对称变换本身许多不同事物具有同样或同类的对称性,而群论让我们不用管变换的对象,只研究变换 (例如旋转) 的普遍性质。

群这个概念的抽象过程跟自然数从具体的事物中抽象出来成为独立的数学概念是一样的。一开始人们数数都是跟具体的对象捆绑在一起的,比如一只羊、两头牛。后来我们就把数数从具体的捆绑对象中脱离出来,保留了抽象的独立的数字,并开始研究纯粹的数字所具有的模式、规律和性质等等,从而就诞生了数学。

群结构实际上反映的是运算本身的结构,因为有运算的存在,才使得集合中的元素产生了联结,从而形成结构。就好像我们经常听说网络拓扑结构有网状结构、星型结构和树形结构一样,因为节点与节点之间有某种特定的联结关系,所以才称为结构。群结构也是类似的,群元素之间在运算下有了联结关系,从而有了结构,所以我们也称群是一种数学结构,或者更准确地说是一种抽象的代数结构

3  群的一些例子


有了群的定义之后,我们来看一些具体的群的例子,以加深我们对群这种抽象代数结构的理解。

第一个例子:整数集合Z在加法运算“+”下构成一个群。其中,0是单位元,任意一个数的逆元就是它的相反数,比如2的逆元就是其相反数-2,因为2+(-2)=0。另外,整数关于加法显然具有封闭性和结合律。所以,整数集合Z在加法运算“+”下满足4条公理,并构成了一个群。

但是,非零整数集合(一般记为Z-{0})关于乘法运算“ⅹ”并不构成群,因为除了单位元1之外,其他整数均不存在逆元。比如2,它在整数集合和乘法运算下没有逆元,只有当我们拓展到有理数之后,它才有逆元1/2。因此非零有理数Q-{0}在乘法运算“ⅹ”下构成群

同样地,我们不难验证,其他各种数集在加法和乘法下是否构成群,具体如下表所示:

Image
表3.3.1

大写字母右上角加*号表示除了0之外的数集,比如Q*就表示Q-{0}。

从上面这些例子中我们还可以发现,减一个数和除一个数其实跟加一个数的逆元和乘一个数的逆元的运算结果是等价的,即减法和除法只是加法和乘法的逆运算,最基本的代数运算其实是加法和乘法

上面这些例子都是数集关于加法和乘法构成的群,这些群的元素有无穷多个,所以称为无限群。如果群的元素是有限个,那就是有限群。比如我们上面所说的正三角形对称变换构成的群,它是有6个元素的有限群。如果一个有限群的元素的个数为n,则称n为群的,一般可以记为|G|=n。

现在我们来看另外一个非常重要的有限群——整数集合同余类

取一个正整数  ,然后让它去除所有的整数,并把被除之后的所有整数按照余数进行分类,如果余数相同,那么就归入同一个集合,我们把这些由余数相同的整数构成的集合称为模n同余类

根据整数除法的表示方式,所有整数被n除之后的余数有n个,分别为  。如果余数是a,那么它的模n同余类可以表示为: 
这是一个由整数组成的集合,集合中的每个元素被n除之后的余数均为a。

如果我们把所有的模n同余类都放在一起构成一个集合,那么这个集合就是: 这是一个集合的集合它的每一个元素都是一个模n同余类我们把它称为模n同余类集合,并用  来记它。

例如,当n=2时,  ,其中[0]为全体偶数,而[1]为全体奇数。对于一年中的365天,按n=7能得出7个模7同余类,这些同余类就可以用周一、周二、  、周日来标记,每个同余类就代表一年365天中同一个星期号的那些日期,比如周一这个同余类就是一年365天中都是周一的那些日期的集合。

有了模n同余类集合  之后,我们就可以在这个集合上面定义一个二元运算——加法运算,用符号“+”来表示。这个运算对于任意的  ,其规则就定义为: 在模n同余的意义下,不难验证验证  关于“+”运算构成一个群,因为它们满足群结构的4条公理。其中,[0]就是这个群的单位元,也可以称为零元

这里有一点需要注意的是,当  的时候,  这个同余类还是不是  中的元素呢?比如,对于: 按照加法运算的定义,我们有: [3]+[4]=[7]。而实际上,[7]这个同余类跟[1]是同一个集合,原因如下: 第三个等号之所以成立,就是因为k取遍整数时,k+1也取遍整数 ,所以k取遍整数时,6k和6(k+1)表示的是同一个集合。

有了  的加法群之后,我们很自然地会仿照加法运算的定义,再另外定义一个乘法运算 “  ”,这个乘法运算不妨就定义为: 在这样定义的乘法运算下,  还能不能构成一个群呢?如果可以,那么显然[1]就是乘法群的单位元。当然,如果要成构成一个群,这里的  必须排除掉加法群的零元[0],记为  ,否则在做乘法运算碰到零元的时候就无法构成群了,因为零元在上面定义的乘法运算下没有逆元。

  在乘法运算 “  ”下能不能构成一个群呢?答案是:不一定。只有当n是素数的时候才可以,如果n不是素数,即n是合数,则不可能构成一个群。

继续以  为例,按照乘法运算 “  ”的定义,我们取一些元素来做运算,看看结果能不能满足群的要求,比如: 如果  关于乘法运算 “  ”构成群,那么说明[4]是它的单位元。但是,我们同时也有: 这说明[1]是单位元。所以就有了两个单位元,这是不可能的,因为我们上面已经说了,群的单位元是唯一的。因此,  关于乘法运算 “  ”不能构成一个群。

但是,如果n=p为素数,则  在乘法运算 “  ”下构成一个群。这个验证也很简单,封闭性和结合律是显然满足的,单位元也很明显,肯定就是[1]。关键就是要证明对于任何一个  ,都存在逆元,而这个证明我们要用到一个关于两个数互素的定理:
定理3.3.1    互素的充要条件
若正整数  和  互素,即它们的公因子为1,记为  ,则存在整数  和  ,使得:  成立。

由于p是素数,所以对于任意一个  (  ),都有  ,即a和p互素。应用上面的定理,我们可以找到两个整数u和v,使得: 即有:  第二个等号利用了整数乘法的交换律。这个结果表明:[ua]=[au]=[1] 。又根据乘法运算的定义,我们有: 因此,根据单位元和逆元的定义,我们找到了[a]的逆元[u] 。

所以,   在乘法运算 “  ”下构成一个群。

虽然当n为合数的时候,  在乘法运算 “  ”下不能构成一个群,但是它的一个子集却可以在乘法运算 “  ”下构成一个群,这个子集就是: 为了简单起见,这里我们把零元[0]等价地记为了[n]。因此,这个子集  中的元素就是那些与n互素的k的同余类。比如对于  ,从1到6这6个数中,与6互素的数只有1和5,因此,  。

根据  这个集合的元素构成,我们很自然地会问这样一个问题:这个群的元素有多少个?也就是它的阶是多少?显然,这个问题也可以转化成:在1到n这n个整数中,与n互素的数有多少个?

我们记  的阶为:  。这个函数  就是大名鼎鼎的欧拉函数,它表示的就是1到n这n个正整数中,与n互素的数的个数。比如有:  ,  。

关于欧拉函数的解析表达式,我们在这里不打算给出证明,感兴趣的同学可以自己推导一下,或者参考冯承天老师所写的《从一元一次方程到伽罗瓦》p39。

我们这里直接给出三个定理,第一个定理是算术基本定理:
定理3.3.2    算术基本定理
对于大于1的自然数n,一定可以唯一地表达为: 其中,  是素数,且  。

第二个定理是关于欧拉函数的一个性质:
定理3.3.3    欧拉函数的性质
若  ,则  。

根据算术基本定理和欧拉函数的性质,可以推导出欧拉函数的具体表达式:
定理3.3.4    欧拉函数
对于大于1的自然数n,有: 其中,  是n的各个不同的素因子。 

由此公式可以得到: 这与上面的结果是一致的。

4  根的对称性


回顾一下我们上面是如何导入对称性和导出群这个抽象代数结构的。我们是从几何图形——正三角形的对称变换,以及关于变换的复合这个乘法运算下,提炼出了对称性变换集合和乘法运算所满足的4个公理,并正式定义了群这个概念。从几何图形入手来导入对称性和群,显得比较直观,也很好理解。

然而,伽罗瓦当时是从多项式方程根的置换入手才创立了群论。当时他并没有命名为群,是后来人给起的名字。伽罗瓦对解方程的研究带来了一个全新的视角。对于方程有没有根式解的问题,一般的人可能会想,我们应该去找方程的系数所满足的条件,这是很自然的想法。但是,伽罗瓦说不对,我们应该去研究方程的根的对称性,以及它所满足的性质,或者说所具有的结构,而不是去研究方程的系数所满足的条件和陷入繁琐的演算。这是一个深刻的思想洞见!

伽罗瓦把方程的根式解问题转换到更抽象的领域去思考,最终以高屋建瓴的方式彻底地解决了方程根式可解性的大问题。当代数学大师、菲尔兹奖得主阿兰·孔涅对伽罗瓦的思想有一段精彩的评价:
从某种意义上来说,伽罗瓦所领悟的,或者说真正的现代数学的起点,就是必须有能力超越演算。也就是说,不要去进行演算,而是在思想里面进行演算!要明白这些演算的本质将会是什么,将会出现的困难是什么,等等,但是并不真正地去进行具体的演算,从而理解它的结果将会是什么形式的,该结果将会有什么对称性。因此,要超越这种外表形式;如果我们不加警惕的话,就很容易被困于其中。需要尝试从高处着手去摆脱困境,在对称性方面进行思考,等等。—— 阿兰  孔涅
伽罗瓦所说的对称性,也就是多项式方程根的对称性究竟是什么意思?很显然,这个对称性是一个更加抽象的概念,它不像我们上面所说的几何图形的对称性那么直观。

我们来看一个非常简单的二次方程: 
这个方程有两个根  ,我们不妨记为:  。根据韦达定理,它们之间满足如下两个代数等式(所谓代数等式就是只涉及加减乘除基本运算的等式): 在这两个等式中(它们显然也是对称多项式),除了方程的两个根  和  之外,其他的系数既可以看成是有理数,也可以看成是实数复数。因此,对于这两个等式,我们既可以称它们为有理数域(一般记为Q)上的代数等式,也可以称它们为实数域(一般记为R)复数域(一般记为C)上的代数等式。至于什么是域,我们这里暂时不给出完整的严谨定义,后面我们谈到扩域理论的时候再细讲,在这里你只需要知道一个域,比如,一个数域,就是对于加减乘除运算都封闭的数集。有理数,实数和复数在加减乘除运算下都封闭,所以它们都是域,而且是数域。

有了域上的代数等式这个概念之后,我们现在着手来定义多项式方程根的对称性。

我们仔细想想,对于上面那个二次方程,我们应该怎么来观察它的根的对称性呢?类比上述的正三角形几何图形的对称性,我们首先要有一个对象,然后观察这个对象在哪些变换下能够保持结构不变,即我们要找到能够描述方程根的对称性的对象、变换和结构等基本要素。

对于多项式方程而言,跟变换有关的显然就是它的根置换,所以我们要找的变换就是根的排列置换。然后我们可能会想,那个对象应该就是多项式方程本身吧!但是这也不太对,多项式方程本身的表达式只含有未知变量x,而没有含它的两个根  和  ,这样我们根本就没资格谈方程的根置换,因为多项式方程本身的表达并没有包含它的两个根  和  ,所以说它在根置换下保持不变这样的语句是毫无意义的。因此,我们要找的那个对象肯定不是多项式方程本身。

实际上,这个用于观察根的对称性的对象是:某个域上的、包含了根的所有代数等式。这句话的信息量非常大,尤其是“所有”这两个字。

有了这个对象之后,那个需要我们在根置换下保持这个对象不变的性质,显然就是代数等式是否依然成立,如果成立,那么就说这个对象在根置换下保持不变。

因此,什么是多项式方程根的对称性?怎么观察它的对称性?意思已经非常清晰了,我们观察某个域上的、包含了根的所有代数等式是否能够在根置换下保持不变(保持等式依然成立),如是,则说明这些根置换是这个域上的对称变换,多项式方程的根在这些根置换下具有对称性。

特别要注意,谈论多项式方程根的对称性,一定要指明是在某个域上,否则,脱离了具体的域谈根的对称性是毫无意义的。这个域在描述多项式方程根的对称性中所起的作用就好比参考系之于速度的作用。我们都知道,脱离了参考系谈论速度是无意义的,因为同一个物体在不同的参考系下会有不同的速度。但凡我们谈到速度,必先指明参考系。多项式方程根的对称性也一样,必先指明在哪个域。

以上述的二次方程为例,我们不妨就在有理数域Q上来观察它的根的对称性。由韦达定理给出的、根所满足的两个代数等式如下: 这两个代数等式显然在两个根的所有置换下保持不变(等式依然成立)。这两个根置换就是:  和  ,可以表示为: 这两个置换构成的集合我们记为  。

但是,我们所说的根的对称性,并不仅仅要求这两个代数等式在  的两个根置换下保持不变,而是要求有理数域Q上、包含了根的所有代数等式都能够在  的两个根置换下保持不变,这样的置换才能称为对称变换。比如,在有理数域Q上,包含这两个根的代数等式还有:  这些等式也能够在根置换  下保持不变。 当然,还有其他各种各样的、包含了这两个根的代数等式,但是,不管你能不能把所有的代数等式都写出来,我们都要求所有代数等式(在有理数域Q上)在根置换下能够保持等式不变,这样的置换我们才能称为对称变换,这样我们才能称多项式方程的根在有理数域Q上具有对称性。显然,   和  都能够保持所有的代数等式在有理数域Q上依然成立,它们都是对称变换。

因为  这个方程的两个根的具体数值我们是知道的(  ),所以有些同学可能会想到用下面这样的代数等式来检验根的对称性变换: 咋一看,这个等式在  这个置换下不再保持不变,所以你可能会说  不是对称变换。但是,别忘了,当我们说方程的根的对称性时,一定要指明在哪个域上。你上面这个代数等式并不是有理数域Q上的代数等式,因为右边包含了  ,它不是有理数。所以,如果我们不是在有理数域Q上,而是在实数域R上来观察根的对称性,  那么就只有  是对称变换, 而  不是。如果我们在有理数域Q上来观察根的对称性,那么  和  都能够保持所有的代数等式在有理数域Q上依然成立,它们都是对称变换。

而且,最关键的一点来了:  和  这两个对称变换,也就是  构成了一个群。这是很容易验证的,因为它们在乘法运算(变换的复合)下满足群的4条公理。这个群  描述了多项式方程  的根在有理数域Q上的对称

我们不妨再思考一下:方程  有两个根,根的置换(  )有两个元素  和   ,它们构成一个。也就是说,群  描述了二次方程的根的对称性。那么以此推广下去,是不是n次方程的对称群就一定是  呢?答案是:不一定

不妨再举一个例子。我们在方程  的基础上构造另一个多项式方程: 这个方程除了有  这两个根之外,还有另外两个根  ,不妨记    。我们也可以把这个方程的左边给乘开,得到一个四次方程: 这个方程的四个根除了满足韦达定理所给出的代数等式之外,它还同时满足下面这两个代数等式: 现在,我们就来考察四次方程四个根的置换(  ) ,看看它们是不是都能保持上述两个有理数域Q上的代数等式不变。很显然,当我们对换  和  ,并保持  和  不变的时候,上述两个代数等式已经不再成立: 所以这个置换并不是上面那个四次方程的根的对称变换,因为我们找到了两个代数等式,它们在这个置换下不再保持不变,而要成为根的对称变换,我们要求的是所有的代数等式都能在这个置换下保持不变。

实际上,在  的24个置换中,只有下面这8个置换才能使得有理数域Q上的、包含了根的所有代数等式都保持不变。 
同样地,对于四个根的置换  ,它在置换的复合这个“乘法”运算下也构成了一个群,因为它满足群的4条公理。一般地,对于n个根的置换群  ,我们称之为对称群  。

上面这8个保持所有代数等式不变的置换是  这个集合的一个子集。我们判断,它也在  的运算下构成群。

首先,封闭性是成立的。举例来说,假设置换A和B都能保持根的所有代数等式在作用前后不变。如果把B作用在一个成立的代数等式上,得到的仍然是一个成立的代数等式。如果再把A作用在上面,我们就又会得到一个成立的代数等式。但作用B之后再作用A,等价于直接作用AB。所以AB也可以保持根的代数等式不变,它也是一个对称变换。那么也就是说,对称所组成的集合具有封闭性

其次,结合律显然成立,因为两个置换的复合之后仍然是一个置换,置换复合的结合顺序不影响置换的结果。且单位元就是恒等置换。最后,任意一个置换的逆置换也存在。因为对于任意一个置换,我们总可以把它逆变回到初始位置,这个逆变换本身也是一个保持根的代数等式不变的置换。

所以,这8个置换是  的一个子集,并且它也能在置换的复合这个“乘法”运算下构成一个群,我们称这8个变换构成的群为  的一个子群

子群的概念是很直观、很容易理解的,它的正式定义如下:
定义 3.4.1     子群 
群  的非空子集合   称为  的一个子群,记作   ,如果在  所定义的乘法运算下, 本身也构成一个群.
显然,只有一个单位元的集合{e}和群G本身都是G的子群,它们是G的平凡子群,G的其他子群是G的真子群。例如,在上面那个正三角形对称变换构成的群S中,{I,U,V}是它的一个真子群,{I,P}、{I,Q}和{I,R}也都是它的真子群。

如果H是G的一个子群,那么H的单位元就是G的单位元,而且任意   在H中的逆元就是a在G中的逆元  。另外,若要验证子集H在G的乘法运算下是否能构成群,就需要判断此时H是否能满足群的4条公理。

我们从子群的概念中拉回来,继续看上面那个四次方程的例子,从中我们可以看出,能够保持有理数域Q上的、包含了根的所有代数等式不变的根置换只有上面那8个置换,而不是  的全部24个置换。

因此,对于n次多项式方程,它的n个根的对称性变换是  的一个子群,这个子群是否满足某种性质,或者说它是否具有某种结构,直接决定了方程是否根式可解。这个子群现在被称为伽罗瓦群,以纪念伽罗瓦本人。伽罗瓦群是伽罗瓦在解方程研究中最为关键的洞见之一。方程是否根式可解本质上是域的扩张问题,伽罗瓦成功地把域的扩张问题转化到对群的研究上来,通过研究方程的根的对称群,从而解决了方程是否根式可解的域扩张问题。伽罗瓦群这个概念是伽罗瓦理论的核心概念之一,它的严谨定义是通过扩域中固定了基域的自同构来定义的,我们会放在后面用单独一篇文章来细讲,这里就暂且打住。

5  结语


伽罗瓦从方程的根置换和根的对称性中抽象出了群这个概念,其本意是想用它来解决多项式方程根式解的问题。然而,伽罗瓦本人怎么都不会想到,他所创立的群论竟然直接开启了现代数学的大门,并且为现代物理学打下了一个坚实的数学基础。群论在各大数学分支中所起的桥梁作用,以及在物理学中的应用,远远超出了人们的想象。

我们可以简单举几个物理上的例子。

在狭义相对论中有一条基本原理叫相对性原理物理定律在所有惯性系中保持不变。它就是对称性原理的一个体现。如果我们把物理定律看作一个类似于几何图形的对象,则与物理定律的对称性相关联的变换就是不同惯性系的时空变换——洛伦兹变换。也就是说,物理定律在洛伦兹变换下保持不变,物理定律具有变换不变性,也就是对称性,或者称协变性。所有的洛伦兹变换在乘法运算(变换的复合)下构成了一个群,我们称之为洛伦兹群,这个群就描述了物理定律在时空变换下的对称性。如果我们把考察对象转移到四维时空中的其他物理量,比如四维距离四维速度等等,那么它们同样也具有洛伦兹变换下的对称性

德国伟大的女数学家艾米·诺特在20世纪初提出了一个震惊世界的数学定理——诺特定理,它被称为了现代物理学的灯塔。诺特定理说每一个连续的对称性都对应一个守恒量。她的证明过程就是从系统的拉格朗日量在连续对称变换下保持不变出发,最终找到了与每一类连续对称性对应的守恒量。比如:时间平移对称性对应了能量守恒,空间平移对称性对应了动量守恒,旋转对称性对应了角动量守恒。这些连续对称性变换在乘法运算下都构成了一个群,而且是一个连续群。诺特定理之所以这么伟大,就是因为它揭示了对称性和守恒量之间的深刻联系:一种对称性必然会导致一个守恒的物理量。这个发现完全刷新了人们对守恒定律的认知,并成为了现代物理学的指明灯。

Image

群论和对称性还在量子力学、粒子物理学和规范场等物理领域中发挥着重要的作用。

当然,物理上所用的群大多是连续群,而在伽罗瓦理论中所涉及的群主要是有限群。在解决多项式方程根式解的道路上,还有更多关于群的理论需要我们进一步学习,比如:一些常见的群族(循环群交换群等)、正规子群商群同态同构,以及最重要的可解群等等。这些内容我们在后续的文章中再详细展开,这篇文章就先到此为止!

参考资料:
[1].古今数学思想,美  莫里斯·克莱因 著,石生明 万伟勋 孙树本等 译
[2].从一元一次方程到伽罗瓦理论,冯承天 著
[3].迷人的对称,英  伊恩·斯图尔特 著,李思尘 张秉宇 译

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多