查看原文
其他

丘成桐:广义相对论与规范场论中经典理论的源始

丘成桐 数理人文 2020-08-19
作者简介:丘成桐,美国哈佛大学数学与物理学教授,美国科学院院士,中国科学院外籍院士,菲尔兹奖、克拉福德奖、沃尔夫奖、马塞尔·格罗斯曼奖得主。发展了强有力的偏微分方程技巧,使得微分几何学产生了深刻的变革,解决了卡拉比(Calabi)猜想、正质量猜想等众多难题,影响遍及理论物理和几乎所有核心数学分支。


译者简介:夏木青,香港专业数学科普译者。

本文译自丘成桐教授于 2019 年 7 月 9 日在台湾 NCTS 举办的 Workshop on “Mass in General Relativity”上的讲稿。译文刊登于《数理人文》杂志(公众号:math_hmat),未经许可,不得转载。


爱因斯坦的广义相对论旨在融合新近发展的狭义相对论和牛顿的引力理论。这项艰巨的工作完成于 1915 年。大多数物理学者都同意,这是人类有史以来科学上最具创意的工作。现试把它的部分内容和各位分享。


在相对论中,一个重要的元素是等效原理(equivalence principle)。这原理其来有绪,源远流长。


伽利略利用实验,说明了在万有引力的作用下,物体的加速度和其质量无关。


1907 年,爱因斯坦说:


“我们假定,引力场和对应参照系统的加速度在物理上是完全等价的。细小物体在引力的作用下运动,仅仅和它在时空中的初始位置和速度有关,而与它的组成无关。任何在自由落下的实验室内的局部实验,其结果和实验室在时空中的速度和位置无关。


由此,爱氏了解到他要创造的崭新引力论中,引力定律必须和观察者无关。他需要找到一个建构理论的框架,将他心中的想法和实际的观测结果连结起来。


既然引力等同于参照系统的加速度,而质点的加速度能够用它轨迹的曲率来描述,爱因斯坦思疑他的新引力论应该和某些空间的概念有关。他深知具有固定坐标系统的静态空间是不敷应用的。



1899 年 5 月爱因斯坦(右)在格罗斯曼(左)位于苏黎世近郊家中的花园(来源:希伯来大学)


爱氏不朽的工作得力于很多几何学者。他自己和格罗斯曼(Marcel Grossmann)都是伟大几何学和物理学家闵可夫斯基(Hermann Minkowski)的学生。他也和列维-奇维塔(Tullio Levi-Civita)、甚至希尔伯特(David Hilbert)和诺特(Emmy Noether)都有交流。


然而最重要的,爱氏开天辟地的工作,受益于十九世纪大数学家黎曼(Bernhard Riemann)对空间的看法。


在黎曼之前,人们知道的空间只有三类:欧几里德空间、球面空间、双曲空间。三者皆由一个单一的坐标系统描述。



这种认知和牛顿的时代差不了多少,人们相信宇宙是静止的。可是,黎曼的著名论文《几何的基本假设》(Ueber die Hypothesen, welche der Geometrie zu Grunde liegen)一下子把这种空间概念颠覆了。


他的空间和上述三类空间完全不同,黎曼空间的存在并不系于一个固定的坐标系统。他指出,当两个点非常接近时,我们不怎么感受到加速度,因此只有第一阶的效应,曲率并不显著。是以从极小距离而言,空间和欧氏空间并无差别。另一方面,引力的二阶效应该来自质点的加速度。正为此故,一当需要描述引力的动力学时,空间的曲率便登场了。


我们并不知道空间整体的模样。不过,空间应该非常一般,在不同的观察者的检视下,引力的物理不会有根本性的改变。观察者能够把他们得到的资讯互相传递。



黎曼(来源:Wiki)


黎曼提出利用不同的坐标系统去观察空间的基本属性,然而这些属性只有当它们和坐标的选取无关时才有意义。这种对空间的看法,本质上便是广义相对论中的等效原理,其重要性是不言而喻的。


在他引进的抽象空间之中,黎曼定义了曲率。在广义相对论中,引力场的强度便是通过曲率测定的,而物质的分布也由曲率的某部分确定。物质的分布随时间的推移而变动,曲率亦然。


时空的振荡透过曲率的变动呈现。有见于此,爱因斯坦得出引力波虽小但必然存在的结论。在他的方程式中,引力场和时空的几何浑成一体,不可分割。


令人惊叹的是,早于 1845 年,黎曼就在他的演辞中引入了对空间全新的看法,用以了解物理现象。他甚至指出,空间中至细微处和至广阔处必须用不同的手法来刻划。从现代物理学的观点看,黎曼在找寻量子空间的结构!黎曼曾想过用离散的空间来说明这问题。


黎曼的科学生涯由他二十五岁发表第一篇论文开始,到三十九岁时因肺病英年逝世结束。去世前三年,他每年都到意大利避寒,由此影响了好些意大利和瑞士的几何学者,其中包括克里斯托弗尔(Elwin Bruno Christoffel)、里奇(Gregorio Ricci Curbastro)、列维-奇维塔。



克里斯托弗尔(左)、里奇(中)、列维-奇维塔(右)(来源:Wiki)


在他们的努力下,黎曼的想法得以扩充,张量和连络严格地定义了,这都是在广义相对论和规范场论中不可或缺的概念。里奇引进了里奇曲率张量,证明了这张量能衍生一个满足守恆律的张量。所有这些工作都是从十九世纪中到末叶完成的,它们是广义相对论至为关键的工具。


1934 年,爱因斯坦发表一篇题为《广义相对论源始》(Einiges über die Entstehung der Allgemeinen Relativitätstheorie,收录于爱氏的文集 Mein Weltbild,Querido Verlag,Amsterdam,1934)的文章,回顾了广义相对论的发展。


第一步当然是狭义相对论。除爱氏本人外,这理论的奠基人包括洛伦兹(Hendrik Lorentz)和庞加莱(Henri Poincaré)。


狭义相对论的一大贡献是指出时间影响距离。但爱因斯坦知道狭义相对论中的超距作用和牛顿的引力理论中的超距作用是不协调的,因此必须作出修正。


开始时,物理学者并不知道黎曼的突破后,空间的概念已起了根本的变化。他们仍然致力于在三维空间的框架下,加上新近发表的狭义相对论,来修正牛顿的引力理论。这种想法耽误了爱因斯坦三年的光阴。


爱因斯坦在《广义相对论源始》一文中说:


“我对马赫(Ernst Mach)的看法当然很熟悉,他认为所谓惯性阻力的反作用不是别的,它乃是相对于宇宙中其他物体质量的加速度。


我们能做的,最简单的就是保留拉普拉斯的引力势,在泊松方程中加上一个对时间微分的项,使它能适合狭义相对论的要求。在引力场中,质点的运动定律也要依从狭义相对论。它的路径并不清晰,事关物体的惯性质量或和引力势有关。事实上,根据能量惯性原理,这是可以预期的。可是,这样的思路却推导出一个令人困惑的结果。


惯性质量和引力质量相等原则可以清晰地表达如下:在一个齐性的引力场中的所有运动,和在一个无引力场而均匀加速的坐标系下的运动并无二致。


假使这个原理(相等原理)是对的话,那便意味必须把相对原理扩充到相互进行非均速运动的坐标系统上去,这样引力场理论才会变得自然。从 1908 到 1911 年,我为此辛勤工作。”


闵可夫斯基是爱因斯坦在苏黎世时的数学老师。他在数学上的成就堪与希尔伯特和庞加莱比肩。闵可夫斯基曾说:“我班上有个散漫的学生,新近却做出了出色的工作,我为这工作找到了几何的解释。



闵可夫斯基(来源:Wiki)


闵可夫斯基跟从亥姆雷兹(Hermann von Helmholtz)、汤姆逊(J.J. Thomson)、赫兹(Heinrich Hertz)等人学习物理学。他坚信由于“数学和大自然与生俱来的和谐”,几何乃是开启物理玄秘的钥匙。他给时空的几何赋予物理涵义。


1908 年 9 月 21 日,在德国科龙举行的自然科学家和医生联盟的第十八次大会上,闵可夫斯基以《空间和时间》(Raum und Zeit)为题发表演讲。他说:


“诸位,本人当前要说明的对空间和时间的观念,乃建基于物理学上的实验,可谓牢不可破。这些观念颠覆了前人的看法。空间自身和时间自身,将要消弭于无形,而一种把两者合而为一的看法将取而代之。


饶有兴味的是,闵氏将他对时空的新概念很大一部分归功于 1906 年庞加莱的工作。在这项工作中,庞氏指出把时间由实轴换为虚轴后,洛伦兹变换变成了转动。


庞加莱(来源:Wiki)


纵使如此,庞加莱并不认为这种四维的表示方式具有多大的物理意义。即使到了 1908 年,他还说:“虽然有其他合适的方法来描述客观世界,但三维的语言看来还是比较恰当。


这和闵可夫斯基的看法南辕北辙,闵可夫斯基是这样说的:


“在一定意义下,空间和时间是一个四维的非欧流形。我们面对的,不仅仅是空间和时间的一种全新的概念,它是一条特定的自然定律。空间和时间是人类认识大自然的根本概念,它是如此重要,它应被称作所有自然定律的第一条。


在 1908 年的一篇论文中,闵可夫斯基构造了一个四维的空间,和黎曼一样,空间上有一个度量张量,用以给出狭义相对论的几何意义。狭义相对论中基本的对称群洛伦兹群,即是闵可夫斯基时空的同构群。


历史上破天荒的第一次,闵可夫斯基告诉我们,人类生活在一个四维的时空中。闵可夫斯基的工作给爱因斯坦最重要的启迪。1908 年,爱氏了解到,他要建构的新引力理论,必须建基在四维的空间上。


一般都相信,那年爱因斯坦最重要的工作,乃是一个虚拟的实验。这个实验说明了等效原理的重要性,以及必须引入新的几何来刻画引力。他了解到新空间的迫切性,牛顿引力理论中的静态空间不再适用了。


闵可夫斯基论文的重要性何在?它不仅在概念上造成突破,把三维空间换成四维时空,更甚者是只有在四维时空中,引力才能绰绰有余地呈现其动态性质!牛顿引力论是静态的,一个函数即足已描述所有和引力有关的现象。


闵氏时空给我们最重要的启示,就是引力乃一张量。张量是较晚出的概念,它由多个函数组成,并在变换之中体现等效原理。闵可夫斯基的张量完美地描述了狭义相对论,但爱因斯坦却想把牛顿力学和闵可夫斯基时空结合起来,在无限小的范围内,他的新时空理论和闵可夫斯基时空必须是吻合的。


于是,当两个质点非常接近时,它们遵守的引力定律,从零阶到第一阶都和闵可夫斯基时空上的定律一样。然而,如果把第二阶的引力效应也算进来,情况便截然不同了,这时曲率显出其重要性。


当时,物理学者对张量所知甚少,(即使在数学界,只有少数几何学家知晓何谓张量分析。)爱因斯坦从狭义相对论知道引力势跟点的位置和上面的切向量(速度向量) 有关,但对需要用哪些数学作为工具毫无头绪。于是他向老同学格罗斯曼请教,终于知道引力场应该用度量张量来描述。


这个张量在时空中变化,在每一点附近却可用闵氏时空的度量来作第一阶迫近。


格罗斯曼是位几何学者,在苏黎世的同窗岁月,他曾帮助爱因斯坦做几何作业。他在图书馆找到了张量这东西。可是,光靠引入度量张量还不够用来描述引力场。我们需要在弯曲的空间内微分张量,并且希望得出来的结果和坐标的选取无关,这是等效原理的要求。答案便是包括克里斯托弗尔和列维-奇维的连络理论。


在他上述广义相对论的回忆录中,爱因斯坦说这是他面对的第一个问题,原来早已被列维-奇维塔和里奇解决掉了。接下来的问题便是在新的架构中,如何推广牛顿的万有引力定律。牛顿的公式很简单,即是引力势的二次导数等于物质密度。


当时,无论爱因斯坦或格罗斯曼都不懂如何去微分度量张量,从而得到一个和坐标的选取无关的张量。格罗斯曼在爱因斯坦多次催促之后,终于在图书馆找到了里奇的工作。


原来里奇老早就懂得如何把黎曼曲率张量“压缩”成为一个对称的二阶张量。这个张量跟度量张量具有同样的自由度,而且可以视作度量张量的微分。爱因斯坦立时就意识到这张量必定是场方程的左手面,而右手面便是物质分布所做成的张量。(当空间是平坦时,这张量早为人熟悉。)爱因斯坦和格罗斯曼分别在 1912 和 1913 年两篇论文中发表了这方程式 Rij = Tij.


爱因斯坦利用牛顿的类似做法,尝试求解这方程。可是,他并不能得到与天文学观测相符的结果(如光的偏转、水星的近日点进动等),这令他十分气馁。


在接着的一年,他放弃了原来的简明的等效原理,尝试利用特殊坐标来解释这些天文现象。


他和列维-奇维塔频繁的书信往来也没多大用。


爱因斯坦之所以要引进度量张量,实在是不得不然。且听他夫子自道:


“我不久便发现在等效原理的要求下,不得不考虑非线性的变换,但这种变换对坐标的简单物理意义来说是不可能的,我们不能再要求坐标的差别即是理想尺度或时钟直接测量出来的结果。


我花了不少时探索坐标的物理意义,并为此困惑不已。我一直找不到出路。直到 1921 年,才终于由下面的考虑得到解脱:


必须找出惯性定律全新的提法,使在没有“真正的引力场”时,它即是伽利略的惯性定律(用惯性系统作坐标系)。伽利略提法的本质是,质点在没有外力的作用下,在四维空间中形成一直线,即是说一条最短线,或更确切地说,一条极值线。


这种想法假设了时空上有线素可供度量长度,即是度量的存在。在狭义相象论中,闵可夫斯基论证了这度量是拟欧几里德的,简言之,即线素“长度”的平方是坐标微分的某个二次函数。


而当坐标经过非线性的变换时,线素“长度”的平方还是坐标微分的齐次函数,可是这函数的系数不再是常数了,它们变成了坐标的某些函数。用数学的语言来说,物理的四维空间中有一个黎曼度量。


当除引力外就没有其他外力时,质点依从的运动定律,表现出来的就是在这个量度的类时极值线。在固定时间,度量的系数便是相对于所选坐标系的引力场。在这个框架下,等效原理便变得很自然了。


由此可见,上述的困惑以这样的方式消除:坐标的微分并不具有物理涵义,具有意义的是它们组成的黎曼度量。从此,广义相对论有了立足点。眼前有两个问题亟需解决。


    1. 狭义相对论中有关场的定律,在黎曼度量下应该如何处理?

    2. 如何决定黎曼度量的微分定律?


明显地,对第二个问题,答案需要从度量中找出二阶的微分不变量。很快人们便知道这不变量早已给黎曼找到了,它便是曲率张量。其实,早在广义相对论问世前两年,人们已找到了正确的场方程式,只是不知道它可以用到物理上去。”


爱因斯坦从 1913 到 1915 年苦思了两年。有趣的是,当没有质量时,爱因斯坦和格罗斯曼的方程是对的。事实上,爱因斯坦和希尔伯特写下正确的场方程后不久,1916 年史瓦西查德(Karl Schwarzschild)解了对一颗球形星体的爱因斯坦方程。



史瓦西查德(来源:Wiki)


史瓦西查德的解虽然并不包含物质,但已足以计算太阳引力导致的光的弯曲。由此可见,爱因斯坦和格罗斯曼如果在 1913 找到了这个球面对称的精确解,就足以解释这现象。很明显地,爱因斯坦的近似解和实际的数据不符,这使他很气馁。他情绪低落,放弃了等效原理,把希望放在特殊坐标上。他回顾道:


“我相信能在一般情况下,说明在任意坐标变换下不变的引力定律是与因果原理不相容的。这些错误的想法,害我苦苦用功,虚耗了两年光阴。到 1915 年才想通了,回到了黎曼曲率,成功地把理论和天文观察的结果联系起来。


既然得窥如此的奥秘,快乐当然不言而喻,而且任何资质良好的学子都不难掌握它。多年来带着强烈的渴望,在黑暗中艰辛探索,往复于希望和绝望之间,最后见到曙光。凡此种种,实在不足为外人道。”



希尔伯特(来源:Wiki)


让我们回到爱因斯坦广义相对论工作的最后阶段。1915 年春,他到哥廷根拜访数学大师大卫·希尔伯特。希尔伯特对几何学自然熟悉不过,况且他是现代几何不变量理论的开山祖师。


他身旁聚集了一大批杰出的数学家,包括下面的几位。


菲利克斯·克莱因(Felix Klein)是利用对称群来为几何学分类的先驱,希尔伯特的学生赫尔曼·魏尔(Hermann Weyl)创造了规范场论,还有艾米·诺特,她是历史上最伟大的女数学家。


克莱因(左)、诺特(中)、魏尔(右)(来源:Wiki)


从 1915 到 1918 年期间,诺特发展她的流论(theory of current),利用连续对称群推导运动的方程式。(在广义相对论中,连续对称群即是坐标变换形成的群。


爱因斯坦来的正是时候,希尔伯特恰恰在那年的十一月找到了希尔伯特作用量,并利用这作用量不费吹灰之力地导出正确的场方程式。听闻这消息,稍后又收到希尔伯特的名信片,背面写上了场方程式,爱因斯坦很快便找到他的方程式,并根据这方程式导出诸般天文现象,解决了他一直努力尝试解决的问题。


开始时,爱因斯坦对希尔伯特的捷足先登,心中颇为不爽。但过了不久,希尔伯特即说工作全归功于爱因斯坦,这样爱因斯坦才转忧为喜。这是石破天惊的工作,后继一代又一代的物理学家和数学家都应对爱因斯坦致上最崇高的敬意。然而,我也期望历史也不会遗忘那些帮助爱氏成就大业的几何学家。我在这里说的大部分取材于爱因斯坦自己的文字。很可惜在那篇文章中,爱因斯坦没有提及希尔伯特的贡献。


回顾一下,希尔伯特和爱因斯坦找到的正确的运动方程式,早在 1913 年就应该由格罗斯曼和爱因斯坦找到了。1913 年的方程式,左手含有里奇张量,而右手面是质量张量。右手面人们很熟悉,它满足守恆律,但左手面则否,是以两者不可能相等。


故此,左式应该以满足守恆律的某种曲率张量的量所代替。这个张量早由里奇根据比安奇恆等式(Bianchi identity)找到了

Rij - ½Rgij = Tij


假使爱因斯坦和格罗斯曼深信几何之美,就应该从其内蕴的和谐着手来补足方程的缺憾。这样就不用等到 1915 年才找到正确的方程式了。


广义相对论成功之余,留下了一项艰巨的任务,那就是如何去解释引力的种种自然现象。这项工作困难之处,在于场方程是个真正的非线性方程组,而且背后的时空也不停在演化。按照引力的物理状况,我们也看不清楚对这复杂的方程组,初始值或边界值应如何描述。


在这永不休止的时空中并不存在整体的对称。没有整体的时间,也没有类时的平移对称,这使重新定义牛顿力学中的重要物理量变得困难。要是存在类时的平移对称,那么便可以利用诺特的流论来定义质量及四维的线动量。不幸地,对广义相对论中常见的方程组来说,连续的对称群并不存在!


连续对称不存在的事实,使沿用的探索引力的概念如质量、线动量、角动量等难于定义。当两颗中子星相互作用时,我们需要知道两者的质量和整个系统的拘束能量(把物质和引力都算进去)。在广义相对论的引力理论中,不可能定义能量密度,这是问题的根源。


原因是假若这密度存在的话,那它只会跟引力势的一阶量即度量张量有关,可是我们总可以找到一个坐标系,使度量张量在既定点的一阶微分为零,这意味着能量密度只能是零。


爱因斯坦找到了方程的消息,在科学家的圈子中不胫而走。由于爱氏一直与几位数学家联系交流,因此就算方程还未完全确定,数学家已先雀跃不已。有几位杰出的数学家立即着手把引力和电磁论统一起来,他们的工作对理论物理学的影响至今未沫,只是物理学家不大提及而已。


卡当(来源:Wiki)


除上面说到的格罗斯曼、希尔伯特、诺特三位外,爱因斯坦还与列维-奇维塔和卡当(Élie Cartan)频繁地通信。1917 年,列维-奇维塔看到度量张量导致切向量平移的概念,而这概念本身就足以推导出很多有用的性质和概念,包括曲率。由于平移只和克里斯托弗尔符号(Christoffel symbols)有关,因此可以把克里斯托弗尔符号看成独立的变量。


受到这些进展的启发,一年后魏尔根据实数的非紧乘法群开创了可换的规范场论(Abelian gauge theory)。爱因斯坦虽然高度评价这理论,但却认为它在物理上是不成立的,因为平移不能保持长度。


纵使如此,量子力学问世之后,魏尔到用伦敦(Fritz London)等人的工作,把实数乘法群换成圆群,这样一来,长度便能够保持了,这套理论便可用到物理上去。麦克斯韦方程漂亮地成为魏尔规范场论的一部分。


1926 年又有了另一发展,卡当把列维-奇维塔的想法推广,使平移不仅适用于切向量,对于在纤维丛上的向量也能作平移。这样,魏尔的理论立即可以推广到不可交换的情况上去(杨振宁和米尔斯(Robert Mills)于 1954 年重新发现了这套理论,并用它来解释高能物理中的同位旋(isospin))。


从 1926 到 1945 年,不可换规范场论得到很大的发展,这要归功于惠特尼(Hassler Whitney)、斯蒂芬(Eduard Stiefel)、庞特利雅金(Lev Pontryagin)、陈省身和埃雷斯曼(Charles Ehresmann)。他们发展了示性类,赋予每个规范场某些整数上同调类。这些上同调类是规范场中最基本的整体不变量。它们在高能物理、凝聚态物理及有关领域中出现。


早在 1947 年,魏尔已经指出这些整数类将会是量子场论量子化的基本工具。他高瞻远瞩,人们在这领域的硏究果然收获甚丰。


魏尔致力于规范场论差不多同时,一位名为卡鲁扎(Theodor Kaluza)的数学家以深具创意的方法,把引力和电磁论统一起来了。


他把在圆对称下不变的五维纯粹引力,通过一种神奇的方法得到四维的引力以及电磁论。因此从五维的引力,可以得到在四维的物理。爱因斯坦惊讶之余,也对这项工作赞赏有加。可是不久,人们发现这理论导致某个纯量场的出现,而这个纯量场在自然界是不存在的,于是这套理论便给丢在一边。然而它是如是美丽,久不久人们便会把它拿出来重新检视。卡拉比-丘(Calabi-Yau)紧化便是这套理论的现代版本,其中的圆用一个容纳超对称的六维紧流形替代了。这种流形的有无并不显而易见,它的存在性是由本人在 1976 年证明的。这个空间的几何能够用来解释宇宙间粒子的相互作用。自 1984 年开始,有关这空间的数学和物理,人们做了大量的工作。


它可说是数学和理论物理最活跃的一个领域。


1950 年,国际数学家大会在佛哈召开,陈省身先生以“纤维丛的几何”(Differential geometry of fiber bundles)为题发表演说,详述了卡当和他是如何发展非可换规范场论的。这套理论比物理学者后来找到的完备得多。有关陈类的想法成了量子场论中量子化的基石。第一陈类的曲率表示导致卡拉比-丘空间,卡拉比-丘空间是弦论的基本建构组件。


陈省身(来源:Wiki)


上世纪七十年代,特·胡夫特(Gerard 't Hooft)成功地把规范场论量子化后,规范场论流行起来了。在这期间,人们需要理解一种叫瞬子(instanton)的规范场。它们是漂亮的几何物体,物理学者先找到一些,稍后阿蒂雅(Michael Atiyah)、德林费尔德(Vladimir Drinfeld)、希钦(Nigel Hitchin)和曼宁(Yuri Manin)合力把它们通通分了类。几何学者开始跟物理学者紧密合作。唐纳森(Simon Donaldson)、乌伦贝克(Karen Uhlenbeck)和本人对有关方程式给出大量的解,它们变成了数学上的重要工具。


几何中人们啧啧称美的属性,竟会呈现于大自然之中,实在令人惊叹不已。阿哈罗诺夫(Yakir Aharonov)和博姆(David Bohm)著名的实验证实了规范场论中的和乐现象(holonomic phenomena)。所谓和乐行为,即指我们拿着尺子,在弯曲的空间中行了一转,回来后角度的变化取决于空间的曲率。




延伸阅读

1. 丘成桐:我们真的活在十维时空吗?

2. 丘成桐:广义相对论中的数学——2015年费尔兹研究所讲辞


图书推荐

欢迎关注《数理人文》杂志微信版

© International Press of Boston

微信订阅号:math_hmat

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存