24 卷第 3 期 (总 141 期 ) · 27 ·
杨-米尔斯规范场理论的创立
杨建邺
本文从物理学史的角度回忆杨米尔斯理论的提
出过程,以及现代物理学家对这个理论的评价,最
后谈谈克莱因 1938 年的工作。因为篇幅的限制,不
能详谈其中的数学公式的推演。
1. 规范场概念的早期历史
20 世纪初,人们只认识到两种相互作用:引力
相互作用和电磁相互作用。爱因斯坦在广义相对论
中利用坐标不变性的处理得到了引力理论,韦尔
( Hermann Weyl, 1885~ 1955)受到了启发,想寻
找一个既能包括引力又能包括电磁相互作用的几何
理论,于是深入地研究了麦克斯韦方程组。
麦克斯韦方程组不仅仅可以计算由电荷或磁场
产生的电场,以及由电流产生的磁场,这个方程还
给出了电磁学里一个重要的守恒定律——电荷守恒。
根据诺特定律,电荷守恒应该对应一种对称性。韦
尔就想:与电荷守恒对应的是什么对称性呢? 1918
年前后,他发现电荷守恒对应的是一种涉及每个点
的局域对称性。即麦克斯韦方程组的又一个优美之
处是它保证电荷守恒的一种局域对称性,而且它是
通过电磁力的固有行为来达到这一点的。
电磁场具有局域对称性,即电磁场的每一点都
具有某种使麦克斯韦方程组保持不变的数学特性。
韦尔在研究这种局域对称性时,提出了一种新的不
变性,现在称为“规范不变性” 。韦尔进一步证明,
引力理论和电磁理论都具有这种不变性。
1929 年,韦尔在一篇决定性的文章里,他把规
范不变性确定为“相位因子”变换。这里关键的线
索是韦尔认识到量子力学中的“波函数” ( wave
function)的相位是一个新的局域变量。韦尔还正确
地指出:物理系统在这种变换下的不变性被称为
U(1)对称性。这是一种比较简单的局域对称性,又
因为空间任意两点的相位因子可以对换,因而又被
称为阿贝尔对称性( Abelian symmetry) 。正是这种
规范不变性(即电荷守恒)决定了全部电磁作用。
这样,一直处于被动角色的对称性,开始具有主动
性的品格。
杨振宁是从泡利 1941 年的文章里才得知韦尔
的理论, 得知韦尔这一非常重要的物理学思想——电
荷守恒决定了全部电磁作用。 泡利在他的 1941 年颇
有影响的论文中指出:只要系统具有 U(1)群的规范
对称性,就必然要求系统的粒子之间存在电磁相互
作用。韦尔的规范理论还有一个十分重要的结论:所
有规范相互作用必须通过规范粒子来传递。这些结
论对杨振宁有很大的吸引力,在回忆中他写道: “韦
尔的理论已成为规范理论中的一组美妙的旋律。当
我在做研究生,正在通过研读泡利的文章来学习场
论时,韦尔的想法对我有很大的吸引力。 ”
但是也正如杨振宁所说: “ 1929 年以后,大家
同意以规范理论的观点来看电磁现象是很漂亮的数
学观点,可是并没有引出任何新物理结果。 ”
韦尔的思想“并没有引出任何新物理结果” ,是
因为韦尔发表论文的时候,人们还没有正确地认识
原子核的组成,更不用说有强相互作用的概念,因
此韦尔理论新的应用时机尚未成熟。但是他为人们
留下了宝贵的遗产,那就是规范变换和局域对称性
思想。
杨振宁被韦尔美妙的理论吸引之后,就产生了
一个大胆而诱人的想法:把韦尔主要从电荷守恒定
律中发现和提出的规范不变性,推广到其他守恒定
律中去。当时守恒定律很多,推广到哪一个守恒定
律中去呢?经过认真思考和仔细研究,杨振宁认为
在粒子的强相互作用中的同位旋(isospin )守恒与
电荷守恒有相似之处,因为它们都反映了系统内部
的一种隐藏的对称性。同位旋是基本粒子的重要性
质之一,用来区分原子核里如质子、中子等基本粒
子的一个物理量。实验表明,原子核里的强相互作
用具有与电荷无关的特性,例如质子与质子、中子
与中子及质子与中子之间的强相互作用是相同的,
· 28 · 现代物理知识
这说明就强相互作用而言,质子与中子之间没有区
别。 因此, 德国物理学家海森伯 ( Werner Heisenberg,
1901~ 1976)于 1932 年提出,由于质子和中子如此
相似,我们可以把它描写为一种粒子,即把质子和
中子看成同一种粒子的两种不同状态。在同一组中
的粒子,质量很接近,宇称相同,但电荷不同,它
们都可以看作是同一粒子处于不同的态。如质子、
中子为两重态; π
+
、 π
0
、 π
-
为三重态等。为描述这
种两重态或多重态的性质,引进了一个称为“同位
旋”的新物理量,它的量子数用 I 表示。同位旋在
物理学中的主要意义在于,当粒子在强相互作用下
发生碰撞时,它们的同位旋守恒( isospin
conservation) 。这就是说,在强相互作用的过程中
总同位旋值保持不变;在弱相互作用和电磁作用过
程中,同位旋不守恒。这一法则有助于物理学家加
深他们对物理基本规律的理解。因此,杨振宁首先
试图将规范不变性推广到同位旋守恒定律中去,即
将同位旋局域化,并研究由此而产生的相互作用。
在 1982 年的文章里,杨振宁写道: “规范不变性决
定了全部电磁相互作用这个事实本身,给我的印象
更深。在芝加哥时,我曾试图把这种观念推广到同
位旋相互作用上去……走入了困境,不得不罢手。
然而,基本的动机仍然吸引着我,在随后几年里我
不时回到这个问题上来,可每次都在同一个地方卡
壳。当然,对每一个研究学问的人来说,都会有这
种共同的经验:想法是好的,可是老是不成功。多
数情况下,这种想法要么被放弃,要被束诸高阁。
但是,也有人坚持不懈,甚至走火入魔。有时,这
种走火入魔会取得好的结果。 ”
梁昌洪教授在他的《话说对称》一书里,作了
一个表:
电荷守恒 同位旋守恒
电荷(电磁场场源) 强作用的“荷”
B
B
F
x x
?
?
=?
??
μ
ν
μν
ν μ
?
守恒的电荷要产生电磁场 守恒的强作用“荷”要产
生杨-米尔斯场
阿贝尔理论 非阿贝尔理论非交换李群
杨振宁在“走火入魔”中,每一次的努力都在
同一个地方卡壳,卡壳的原因是头几步的计算很成
功,可是推广的时候,总是导出一个冗长丑陋的公
式,使得他不得不把这个想法搁置下来。虽累经失
败,杨振宁却一直不肯放弃。到 1954 年这种执着和
走火入魔,真的是“取得好的结果”了。
2. “走火入魔”和伟大的成果
一般人都知道,杨振宁与李政道一起于 1957
年获得诺贝尔物理学奖,这次获奖是因为他们“对
宇称定律的深入研究,它导致了有关亚原子粒子的
重大发现” 。 但杨振宁最重要的贡献不是宇称定律的
研究, 而是 1954 年前后对于 “规范场理论” 的研究。
正是这一研究,杨振宁在芝加哥大学的导师特勒
( Edward Teller, 1908~ 2003) 在 1982 年就说: “如
果不提及杨振宁和米尔斯关于把规范不变性推广到
同位旋及不可对易变量的那篇著名论文,我就无法
谈杨振宁的研究工作。归根结蒂,他们的这篇文章
已经成为几乎所有进一步讨论的基础。 ”
1993 年,声誉卓著的“美利坚哲学学会”将该
学会颁发的最高荣誉奖富兰克林奖章( Franklin
Medal)授予杨振宁,授奖原因是因为“杨振宁教授
是自爱因斯坦和狄拉克之后 20 世纪物理学出类拔
萃的设计师” ,表彰杨振宁和罗伯特·米尔斯合作所
取得的成就;并指出这一成就是“物理学中最重要
的事件” ,是“对物理学影响深远和奠基性的贡献” 。
1994 年,美国富兰克林学会将鲍尔奖金颁发给
杨振宁,文告中明确指出,这项奖授予杨振宁,是
因为他“提出了一个广义的场论,这个理论综合了
自然界的物理定律,为我们对宇宙中基本的力提供
了一种理解。作为 20 世纪理性的杰作之一,这个理
论解释了亚原子粒子的相互作用,深远地重新规划
最近 40 年物理学和现代几何学的发展。 这个理论模
型,已经排列在牛顿、麦克斯韦和爱因斯坦的工作
之列,并肯定会对未来几代人产生相类似的影响。 ”
上面提到的“一个广义的场论”和“这个理论
模型” ,指的就是杨振宁和米尔斯合作提出来的“非
阿贝尔规范场理论” ,或者称为“杨-米尔斯理论” 。
由鲍尔奖的文告中我们可以清楚地看出,科学界在
该理论提出近半个世纪后,终于认识到了它的终极
价值。在科学界的共识中,已经把杨振宁的这一贡
献和物理学历史上最伟大的几位科学家牛顿、麦克
斯韦和爱因斯坦的贡献,相提并论,等量齐观,那
么,杨振宁到底怎么“走火入魔”的呢?这段历史
受到人们极大的关注。
1952 年 12 月中旬,杨振宁收到布鲁克海文国
家实验室高能同步稳相加速器( Cosmotron)部主任
24 卷第 3 期 (总 141 期 ) · 29 ·
柯林斯(George B. Collins )的一封信,邀请他到他
们实验室作一年的访问学者; 1953 年夏天,杨振宁
全家搬到了布鲁克海文实验室。
这时实验室不断有新的粒子发现,杨振宁也参
与了其中的一些实验。正是这些实验唤起了潜伏在
杨振宁心中多年的思考,激励他追寻一个暂时还不
清晰的目标。 杨振宁说: “随着越来越多介子被发现,
以及对各种相互作用进行更深入的研究,我感到迫
切需要一种在写出各类相互作用时大家都应遵循的
原则。因此,在布鲁克海文我再一次回到把规范不
变性推广出去的念头上来。 ”
功夫不亏有心人。这一次是他和同一办公室的
米尔斯一起讨论他的这一长期感兴趣的老问题。罗
伯特·米尔斯那时是哥伦比亚大学克劳尔( Norman
Kroll, 1922~ 2004)教授的博士研究生,后来成为
俄亥俄州立大学的教授。这一次他们决定尝试在电
磁规范场强 F
μν
上加一个二次多项式,如果不行再
尝试加三项式等。没有想到的是在加上一个简单的
二项式之后,
][
νμ
μ
ν
ν
μ
μ
BB
x
B
x
B
F
ν
,+
?
?
?
?
?
=
结果没有再像以前那样出现越来越复杂的项, 相反,
以后的计算就“越算越简单,我们知道我们挖到了
宝贝! ! ! ”于是他们顺利写出了《同位旋守恒和一个
推广的规范不变性》及《同位旋守恒和同位旋规范
不变》两篇文章,分别发表在《物理学评论》 1954
年 95 和 96 卷上。
人们对杨振宁和米尔斯如何共同克服以前一直
不能克服的困难,抱有很大的兴趣。在 2005 年由特
霍夫特
①
主编出版的《杨-米尔斯理论 50 年》一书
中,杨振宁应特霍夫特的请求写了一篇短文,这篇
短文是杨振宁为 1947 年写的文章“规范不变性和
相互作用” 的一个注释。 在这篇短文里杨振宁写道:
“杰拉杜斯·特霍夫特希望我为非阿贝尔规
范理论的早期起源写一点东西。我寻找过去的文
件,发现了几页以前写的文章,我把它贡献给他
在编著的书中。
这几页文章写于 1947 年 3 月, 那时我还是芝加
哥大学研究生。像我那一代的研究生一样,我们很
熟悉泡利在 1933 年《物理手册》中的文章和 1941
年发表于《现代物理评论》上的文章,但是我们却
不太熟悉韦尔 1929 年的文章。
我那时非常专注于一个非常重要的问题。不幸
的是我所做的计算,在此后几年里一直没有得到今
天所得到的结果。这些计算总是得到越来越复杂的
结果,最后总是以失败告终。一直到 1953~ 1954
年当我和罗伯特·米尔斯重新回到这个问题,并且
把场强 F
μν
加上一个二次项的时候,一个美妙的理
论产生了。米尔斯和我在多年以后才明白,从数学
观点看这个二次项事实上非常自然。 ”
用群论的语言讲,杨振宁和米尔斯采取了一个
关键和绝妙的步骤——他们用群论里的 SU(2)群代
替了麦克斯韦方程组里的 U(1)群。我们知道,与麦
克斯韦方程组相关联的群是 U(1)群,它是阿贝尔群
( abelian group) ,即是可以交换的(例如,平面上
任意两个相继的旋转可以变换次序进行而不影响结
果) ;而与杨-米尔斯方程相关联的群是 SU(2)群,
它是不可交换的,即他们的理论是“非阿贝尔”规
范理论( non-abelian gauge theory) 。而且这种 SU(2)
规范理论很容易推广到其他非阿贝尔规范理论,因
此统称为非阿贝尔规范理论, 或杨-米尔斯规范理论
( Yang-Mills gauge theory) ,这是继麦克斯韦和爱
因斯坦之后,提出了一种新的场论。从此,规范场的
研究进入了一个崭新阶段。这时规范场的量子——
规范粒子,按照 SU(2)群应该有三个,其中一个带
正电,一个带负电,还有一个不带电;粒子场通过
交换这些规范粒子便引起新的相互作用。这是在爱
因斯坦利用广义协变原理(也是一种局域对称性原
理)得到引力作用之后,物理学家再一次纯粹利用
对称性原理给出具体相互作用规律。这是现代物理
学中的一次伟大跨越,用杨振宁的话就是“对称性
支配相互作用” ( symmetry dictates interaction) 。
杨-米尔斯理论的重要价值,派斯在他的《基本
粒子物理学史》 一书中说: “杨振宁和米尔斯在他们
杰出的两篇文章里,奠定了现代规范理论的基础。 ”
2006 年英国出版了一本书——《天地有大美——
现代科学之伟大方程》 ( It Must be Beautiful: Great
Equations of Modern Science) , 书中第七章是克莉丝
汀·萨顿( Christine Sutton)写的“隐对称性:杨-
米尔斯方程” , 她在文章开篇第一段就写道: “ 1953
年,……两个年轻人因共用长岛的布鲁克海文实验
室的一间办公室而相遇了。就像罕见的行星列阵那
· 30 · 现代物理知识
样,他们短暂地通过了时空的同一区域。这一时空
上的巧合诞生了一个方程,这个方程可构成物理学
圣杯—— ‘万物之理 ’——的基础。 ”
什么是“圣杯”?圣杯( Holy Grail)传说是基
督被钉在十字架上时用来盛接基督鲜血的杯子;
“寻找圣杯”一直就成为寻求与上帝的神秘结合;
而且只有最伟大的人物才能够寻到和直视圣杯,并
看见人类语言无法形容的神圣奥秘。
无独有偶,美国斯坦福大学数学系教授基
思·德夫林( Keith Devlin)在 2006 年写了一本更
有趣的书《千年难题——七个悬赏 1000000 美元的
数学问题》 ,其中 66 页的标题是“现代物理学的圣
杯” ,他指的也是杨-米尔斯理论。
把杨-米尔斯理论看成是“物理学的圣杯” ,可
见它的非同一般的重要性。但是也正如克莉丝汀所
说,在 20 世纪 50 年代,杨-米尔斯理论却似乎和现
实几乎没有什么瓜葛,直到 20 世纪 70 年代以后,
属于它的时代才到来了——它构成了获 1979 年、
1999 年和 2004 年三项诺贝尔物理学奖成果的理论
基础。
3 . 克莱因 1938 年的工作
一般探讨规范场理论的文章,不太关注到克莱
因的研究。杨振宁在《对称性与物理》一文曾经解
释过这一问题。
克莱因( Oskar Klein, 1894~1 977)是瑞典物
理学家, 在 20 世纪 20 年代量子力学诞生的岁月里,
他是一位重要的开拓者。 20 世纪 50 年代,克莱因
访问普林斯顿高等研究所以后,杨振宁认识了他,
以后两人关系很好。 1988 年,瑞典物理学家爱克斯
朋(G?sta Ekspong )建立“克莱因纪念讲座” ,并
且请杨振宁去做过开场的两次演讲。其中一次讲的
是《对称与物理学》 ( Symmetry and Physics) ,另一
次是《从贝特-于尔丹假说到杨-巴克斯特方程》
( From the Bethe-Hulthen Hypothesis to the Yang-
Baxter Equation) 。在《对称与物理学》的演讲中,
杨振宁多处谈到克莱因的研究。
克莱因在 1938 年华沙一次物理学会议上提出
一个场论,因为这个场论包含一个非线性项,有一
些近似非阿贝尔规范理论的非线性项。这件事在 20
世纪八九十年代被瑞典物理学家瑟西莉娅·加尔斯
科格( Cecilia Jarlskog) “发现” ,于是不少物理学家
开始发表文章,试图解释何以克莱因的文章以前没
有被人们注意到。杨振宁在演讲中理所当然地要提
到克莱因的这篇文章。他一方面肯定了克莱因的贡
献,另一方面也指出克莱因文章没有受到广泛关注
的原因所在。首先他指出克莱因是怎么样得到非线
性项的: “克莱茵是怎样得到这些项的呢?答案在
于,他从卡鲁扎-克莱因( Kaluza-Klein)理论出发,
该理论建立在广义相对论的基础上。 具有非线性项。 ”
卡鲁扎-克莱因理论是德国数学家西奥多·卡
鲁扎( Theodor Kaluza, 1885~ 1954)和克莱因提出
的, 这个理论最初只是应用于电磁力和引力的统一。
1921 年,卡鲁扎把广义相对论延伸至一个五维时
空,他由此得到好几组方程式,其中一个与爱因斯
坦引力场方程式等价,其他组方程式则与麦克斯韦
电磁场方程组等价。 1926 年,克莱因对卡鲁扎理论
做了一些发展。
正因为卡鲁扎-克莱因理论建立在广义相对论
基础上,必然导致他们不可能导致规范变换。杨振
宁指出: “爱因斯坦的广义相对论是对称被用来主动
地决定相互作用的第一个例子。 用今天的语言来说,
爱因斯坦把切丛( the tangent bundles)
②
用于他的对
称。切丛由于比其他丛更难以捉摸,因而难以用来
推广到其他丛。这就是薛定谔( E. Schr?dinger,
1887~ 1961) 、克莱因和其他许多人在本世纪 20 年
代和 30 年代立足于广义相对论的工作为什么没有
导致一般规范理论的缘由。 ”
正是因为克莱因的研究没有发现规范变换,所
以他的工作没有受到人们的关注。这才是问题关键
所在。
杨振宁对克莱因 1938 年论文的评价应该是令
人信服和中肯的。
(华中科技大学物理系 430074)
①特霍夫特( Gerardus′t Hooft, 1946~) ,因为规范场理
论的重整化于 1999 年获得诺贝尔物理学奖。
②“切丛”是微分几何中最重要的概念之一,与之对偶
的概念是余切丛。很多重要的几何性质都和切丛及余切从有
关。 它是研究微分几何的重要工具。
|
|