光和引力波专题 Ⅰ ——广义相对性原理、光速不变原理及引力论

Original 王雯宇许洋物理与工程 2021-03-24

本文作者：王雯宇老师

1 背景

2016年2月11日LIGO团队宣布成功探测到了引力波的现象，2017年的诺贝尔物理奖授予了对探测引力波作出重要贡献的雷纳·韦斯、巴里·巴里什和基普·S·索恩3人。在此之后2017年8月17日，LIGO和Virgo探测器又分别探测到了一个持续时间为100s左右的新引力波信号。在该引力波信号到达后大约1.7s，美国国家航空航天局(NASA)费米卫星搭载的伽玛暴监测器(GBM)、欧洲INTEGRAL和中国紫金山天文台等世界各地的多家天文台都探测到了一个暗弱的短时标电磁伽马射线暴。2017年10月16日多国天文学家同时宣布了这一消息，引起了世界的轰动，这也标志着以多种观测方式为特点的“多信使”天文学进入一个新时代[1]。引力波是广义相对论预言中的重要现象。在相对论创立100余年后，引力波的观测再次验证了爱因斯坦引力理论。在广义相对论中，引力波的速度是真空中的光速。为什么引力波速与真空电磁波速度相同？这并不是一个简单的问题。因为光速是由真空麦克斯韦方程组得到的，这是一个纯粹的电磁理论的结果。广义相对论中，引力波是时空度规的震荡，也就是通常所说的时空弯曲的涟漪，这是一个关于时空的理论。为什么时空度规的引力波要以真空电磁波的速度来传播？如果读者对广义相对论不是很熟悉的话，是很难说清楚这一点的。

现代物理的一个重要基础就是相对论理论，该理论又分为狭义相对论和广义相对论两部分。狭义相对论以相对性原理和光速不变原理为出发点，系统地描述了惯性系中的力学和电磁学现象。广义相对论处理的是引力存在时的经典力学系统。爱因斯坦提出了等效原理，即时空局域一点的引力场可用相应的局域非惯性参考系去描述，而各个局域惯性参考系的关系由爱因斯坦场方程联系起来，这样就将引力问题等同于时空的几何问题。黎曼几何恰当地描述了广义相对论。在高等物理教学中，狭义相对论通常是必修的重要课程，许多物理理论都需要用到狭义相对论的基本概念。广义相对论理论由于其物理效应相对其他理论来说，应用较少，通常放在扩展阅读中由学习者自由选择。很多不从事理论物理研究的学者对广义相对论了解较少，特别是狭义相对论和广义相对论之间的关系是什么，等效原理中光速是否还能保持不变等。很多物理学的扩展阅读并没有说清楚。因此做一个狭义相对论和广义相对论之间关系的简单介绍是必需的。

讨论引力波速和光速之间的关系其实也是一个前沿的科学问题。在平直时空电磁理论中，由于电磁介质的存在，电磁波的速度是可以低于真空中的光速的，比如玻璃中的光速就小于真空中的光速。因此要做到引力波的速度和光速不同是很容易的，那就是时空充满某种电磁介质，此时电磁信号的传播速度就与引力波速(真空光速)不同了。那么介质存在时电磁理论和引力理论的具体形式是什么？怎么区分引力波速和光速是需要做深入研究的。本文作者在文献[2]中就讨论了平直时空介质存在时的协变麦克斯韦方程组的形式。介质中的电磁波速低于真空中的光速，而且是相对论协变的。如果要处理引力波问题，则需要把该理论再做进一步的推广，把介质电磁理论推广到引力存在的情况。其实纯粹的引力理论也需要考虑是否有类似电磁理论中介质存在的情况，引力波速会不会也因此而改变，这是一个非常有意思的问题。

基于以上考虑，本专题试图尽量浅显地介绍广义相对论引力理论，特别是广义相对论和狭义相对论之间的关系。然后讨论介质存在时电磁和引力理论，最后再研究一下光速和引力波速不同的情况。论文分为两篇。第一篇主要讨论经典广义相对论引力的原理、理论及其检验。文中第2节讨论广义相对性原理、光速不变原理以及时空坐标的理解，第3节简介引力论的具体内容以及检验。第4节给出本篇的小结。第二篇主要讨论介质存在时的电磁理论与引力理论，重点讨论电磁波与引力波速度的异同和引力场方程以及弗雷德曼方程的修正。文中需要用到的黎曼几何知识也在第二篇附录中给出，正文将主要关注物理理论。

2 等效原理、广义相对性原理和光速不变原理

谈到引力，人们首先会想到的是牛顿万有引力理论。虽然与广义相对论一样都是描述引力，但是二者存在本质的区别：万有引力是绝对时空观下力的平方反比定律，简洁却有着清晰的理论预言；广义相对论则是一个关于度规的理论，其核心思想是四维时空引力几何化，即引力的作用等同于时空的弯曲。为什么爱因斯坦要把万有引力推广为广义相对论理论呢？这是因为狭义相对论很好地处理了电磁场、牛顿力学在不同惯性系之间的变换问题。惯性系电磁场、牛顿力学都可以修改为狭义相对论洛伦兹协变的形式。而仔细分析万有引力理论就可以知道，它是很难写成洛伦兹协变形式的。为此爱因斯坦就提出了等效原理，把引力几何化，成功地得到了洛伦兹协变引力理论。因此讨论广义相对论之前，必须说明广义相对论的等效原理，以及它与狭义相对论理论之间的关系。狭义相对论理论源自两个原理：相对性原理，即物理方程在不同的惯性系中形式不变；光速不变原理，即光在真空中的传播速度为一个常数。在等效原理的指导下，相对性原理和光速不变原理的具体内容都有所修正，这正是广义相对论理论的出发点。具体情况在下面两小节中做出说明。

2.1 等效原理与广义相对性原理

广义相对论是一个协变的引力理论，理论基础是等效原理。等效原理的表述为：物体的惯性质量和引力质量相等，惯性力与引力的动力学效应局域不可分辨。这实际上初步建立了引力与几何之间的桥梁，引力几何化的思想正源自于此。通常的例子就是，在一个加速下降的电梯里面，人无法区分地球的吸引与电梯的加速。为了理解它的物理内涵，我们可以考虑一个在地球引力势

(2.1)

中的自由下落的质点。其中，M是地球的质量，G是牛顿万有引力常数。根据牛顿力学，它的运动方程是

(2.2)

其中，g代表地球表面的重力加速度，假设其为一个常矢量；mI,mG分别表示惯性质量与引力质量。如果mI=mG，那么求解运动方程得到

(2.3)

这是一个非常简单的描述地球引力的例子(自由落体)，它表示在引力场中某个静止的观察者A看到的质点运动情况。然而，如果换到某个与质点共同自由下落的惯性系B(随动坐标系)，即对式(2.3)做非线性坐标变换：

(2.4)

这表示A参考系承受着的一个

的惯性力。现在式(2.3)在随动坐标系B下表述为

(2.5)

这是一个不受外力的质点的运动方程。我们发现在观察者A看来的引力相互作用，在惯性系B中则表现为不受任何相互作用，这说明我们可以通过坐标变换将引力的作用局域消除。注意，以上坐标变换只有在重力加速度g为一常数时才成立，这即是等效原理中“局域”的意思。当重力加速度g是时间与空间的函数时，则需要做一个更加复杂的非线性变换。

既然引力的效果可以被局域得消除，那就可以放弃“力”的观点，将动力学问题转化成运动学问题，这就是引力的几何化思想。根据式(2.5)可以看出，不受力的物体，在欧几里得空间中的自由运动是直线，这其实对应着欧几里得几何中的测地线，也即两点之间的短程线。根据相对论理论，现实的时空并不是满足欧几里得几何，而是由黎曼几何(要点见第二篇附录)来描述的，而且时间空间是一体的。物体在引力作用下的动力学方程就等价于黎曼几何中的测地线方程。因此，引力的问题就被引入到了时空几何的研究范畴中，黎曼几何中的测地线和曲率是广义相对论理论的重要概念。下面分析弯曲时空测地线的具体表达形式。

为了求得一般坐标系下的测地线方程，根据等效原理，首先要将引力消除，得到一个不受外力的自由运动方程

(2.6)

其中，τ是固有时(粒子静止参考系中粒子所处位置经历的时间)，

(2.7)

是固有速度(与坐标速度不同，后文详细说明)。注意一般坐标系中μ指标为零表示时间维度，其它数值(1,2,3)表示空间维度，此时的速度可以是三维速度，也可以是四维速度。对式(2.6)做一个坐标变换

(2.8)

结果为

(2.9)

在计算中我们采用了相同指标求和的约定(下同)。其中，

(2.10)

称为联络[3]，这是描述弯曲时空几何的一个重要概念。利用固有速度式(2.7)的定义，方程(2.9)的另外一种形式为

(2.11)

若坐标变换是线性的，则二阶偏导项为零，联络为零。因此联络代表着坐标变换的非线性性质。式(2.9)和式(2.11)就是黎曼几何的测地线方程，它描述了经过一般坐标变换后的引力场的运动方程。测地线方程也可以由拉格朗日量得到，取

(2.12)

作为拉格朗日量。其中，gμ ν是度规张量，刻画了时空弯曲的性质，其几何意义在第二篇附录中有较详细的说明，后文我们还要讨论其物理意义。由变分原理得到的欧拉-拉格朗日方程即是测地线方程(2.9)，具体过程也可以参看第二篇附录。另外需要注意的是，以上速度定义中的求导都是对粒子固有时间的导数，对于光子或者其他无质量粒子，无法定义固有时间，因此应该换成对另外的某个参数(比如随动坐标系中的时间坐标σ)的求导，相同的坐标变换也可以得到类似的运动方程

(2.13)

此时

(2.14)

联络的定义不变。

基于等效原理，我们就知道引力存在时，时空可以看作是弯曲的，引力作用下物体的运动是弯曲时空的测地线。相应地，物理理论就应该修改为以弯曲时空为背景的理论。那么具体的物理理论比如电磁理论、牛顿力学等应该做怎样的修改才能成为一个弯曲时空的理论？此时可以回到构建狭义相对论理论的逻辑历程。狭义相对论理论开始于相对性原理和光速不变原理。相对性原理表明物理规律在所有的惯性系中的形式都是一样的。等效原理表明，引力局域等效于非惯性系，非惯性系可以非线性变换为惯性系。那么相对性原理就可以做这样的推广：物理理论在任意的参考系形式都是不变的，即物理规律不仅在惯性系间的洛伦兹变换下是协变的，而且在任意坐标变换下都是协变的。这就是广义相对性原理。如何具体表达广义相对性原理呢？广义相对性原理要求的结果就是描述物理规律的方程必须是一个张量方程。就像狭义相对论中，物理量可以写成四维矢量或者张量形式一样，张量形式是不依赖于坐标系选择的。张量方程只要它在一个坐标系中成立，那它就在所有的坐标系中都成立。在狭义相对论中，根据洛伦兹变换性质定义了张量和旋量。洛伦兹变换是一种线性坐标变换。在广义相对论中，就可以做以下推广：在任意坐标变换下定义相关物理量的张量形式，由这种广义协变张量形式物理量重新构建物理方程。这样物理方程在任意坐标变换下都是协变的，也就自然满足广义相对性原理了。

事实上，广义相对性原理没有说明方程应该怎么写，它只表明方程应当是一个广义协变的张量方程。这里注意区分协变性与不变性。协变性实际上是对物理方程的形式要求，原则上任意一个不协变的方程都可以通过一些技巧把它写成协变的[4]。相比协变性，方程的不变性则对方程的内容施加了限制。在量子场论中，可以依据场在洛伦兹变换下的不变量写下相应的拉格朗日量，因此洛伦兹变换不变性的要求决定了拉氏量中各项的具体形式。依据等效原理与广义协变性，就可以建立起通过几何描述引力的一般方程。不止是引力，牛顿力学、电磁学都可以通过广义相对性原理表述成广义协变形式。在这之前，先应了解广义相对性原理给物理方程施加了哪些限制。

广义协变性最直接的要求即是方程中只允许出现张量。我们可以根据广义协变性定义一个一阶张量Aμ，它在广义坐标下的变换法则是

(2.15)

其中，x ′α是另外一个坐标系；A′α是在x ′α坐标系的张量，其中

(2.16)

表示某一坐标变换。满足这种变换法则的一阶张量Aμ称为逆变矢量。若一阶张量Aμ的变换法则为

(2.17)

则称Aμ为协变矢量。逆变矢量和协变矢量之间的通过度规相联系

(2.18)

二阶、三阶以及高阶张量也做类似定义。由这种方式定义的张量Aμ可以是长度、电磁场等物理量。这样定义的张量自然是变换协变的。物理方程中，由非线性变换造成的改变在于张量的导数项。比如张量Aμ的一阶导数项∂νAμ。广义坐标变换后，一阶张量的简单微分并不能给出一个二阶张量。我们需要对式(2.17)两边取微分

(2.19)

上式等号右边第一项的存在使得一阶张量的普通导数不是张量。这是因为广义坐标变换是一个任意的坐标变换，广义的坐标变换不能保证等号右边第一项为零。广义相对性原理的关键——不存在一个特殊的参考系，要求所有坐标系都是等权的。因此物理方程不能使用普通导数。把物理理论推广为引力存在时弯曲时空的情况，则需要将普通导数∂μ替换为协变导数。所谓协变导数就是的坐标变换为

(2.20)

根据黎曼几何，协变导数的具体形式为

(2.21)

当协变导数作用于一个矢量上时，将保证遵循一个二阶张量的变换规律变换。在本文中，我们将Aν的普通导数用逗号表示，即

Aν的协变导数则用分号表示，即

式(2.21)中就是上文提到联络。读者可以看到联络在弯曲空间理论中的重要性。需要指出的是，联络不仅是是弯曲时空理论中的重要概念，它也是规范场论中的规范场场强。由于不是本文讨论的内容，具体可以参考文献[5]。

有了协变导数，改写引力存在弯曲时空的物理定律就变得很简单。比如对于牛顿第二定律，

(2.22)

首先将其写为张量形式，

(2.23)

其中μ指标可以是三维空间指标1,2,3，也可以是四维时空坐标0,1,2,3。如果是四维时空，F 0是相对论四维力的零分量(低速情况即功率)，其中

(2.24)

是加速度。由于是一个矢量，dτ是固有时微元，因此速度是一个矢量。但是弯曲时空中duμ就不是一个矢量了，因此加速度不是一个广义协变的矢量。对方程(2.23)变形

(2.25)

将以上方程(2.25)与测地线方程(2.9)对比发现，力可以定义为

(2.26)

这就是联络与力Fμ之间的关系。非广义协变的加速度项改写为

(2.27)

该项减去方程(2.25)右边的项刚好就凑成了协变导数，即

(2.28)

这样得到广义协变的牛顿力学方程

(2.29)

这就是式(2.11)。也就是说，牛顿力学方程变成了弯曲时空的极短路径的运动方程。这正是等效原理的体现。再次强调，这里牛顿力学方程可以是三维的力学方程，也可以是四维时空的力学方程，只要引力几何化就可以，下节将更详细的说明此点。

经典电磁学用麦克斯韦方程组来描述。方程组是自然狭义相对论洛伦兹协变的，其协变形式为

其中，是电磁场张量；是电流。可以看到，方程都是对坐标的一阶导数，所以弯曲时空的电磁理论的推广很简单，就是把普通导数替换为协变导数即可。因此弯曲时空的真空麦克斯韦方程组形式成为

关于弯曲时空电磁理论的具体内容在第二篇论文中再做说明。

综上，将物理规律推广至引力存在弯曲时空理论的方法就是，把普通导数替换为协变导数，方程就具有了广义协变的形式。这就是广义相对性原理。

2.2 广义光速不变原理

上节描述了等效原理和广义相对性原理，根据这两个原理，原则上所有理论都可以写成弯曲空间的理论。是否广义相对论已经建立完成了呢？不是这样的。狭义相对论中，除相对性原理之外，还需要光速不变原理才能构建完整理论。光速不变原理要求不同惯性系中保持真空中光速不变。由此才能得到洛伦兹变换和狭义相对论时空观等理论。在广义理论中，相对性原理要求把理论写成一个弯曲时空广义协变的形式。而弯曲时空具体形式是什么，广义协变性并不能给出指导。也就是说，根据上节的方法，物理理论可以在任意的坐标变换下都可以写成协变形式。协变导数中需要用到的联络也没有明确的限制。

显然，如果要得到广义相对性理论，光速不变原理也要推广为广义形式。有读者会认为，四维时空张量的固有间隔ds2(后文详述该物理量定义。)是一个标量，广义相对性原理要求张量坐标变换不变，那不就可以得到光速不变的要求了么？其实不是这样的，上节说明的广义相对性原理时，我们一再强调弯曲时空可以三维的，也可以是四维的。即可以抛开时间一维，构建一个三维弯曲空间广义协变的理论，满足绝对时空观和广义相对性原理，而不满足光速不变原理。光速不变原理则要求必须构建一个时空一体的闵氏时空，由黎曼几何表达的物理理论。为了说明这一点，下面举一个绝对时空两维弯曲面广义理论的例子。

如图1(a)所示，一个质量为m的行星围绕中心天体作匀速圆周运动，轨道半径为ρ0，角速度为ω。行星在一个平面内运动，这就是一个二维系统。根据牛顿第二定律，在直角坐标系中其动力学方程可以写为

其解可以写为

行星轨迹是一个圆，它的速率为

这就是牛顿力学描述的平面圆周运动，加速度ω2ρ0归因于万有引力的作用，此时空间是平直的。

根据等效原理，平面上的匀速圆周运动就是一个二维弯曲面上的测地线，式(2.34)(2.35)可以写成弯曲空间中的运动方程。此时弯曲面的度规、联络的具体形式是什么呢？这暂时是不清楚的。如图1(b)所示，可以做一个坐标变换将直角坐标(x,y)转化至极坐标系(ρ,φ)，

在极坐标系行星的运动方程非常简单

也就是说，极坐标系中，行星做ρ为常数，φ匀速变化的运动，类似于平面内的匀速直线运动。注意这是一个绝对时空观描述的运动，时间是独立参量，与空间无关。此时(ρ,φ)坐标系的度规是什么也不清楚，但是由于已经知道了坐标变换式(2.40)和式(2.41)，根据式(2.10)可以计算联络，我们已经可以根据弯曲空间张量理论重新理解(x,y)空间的运动了。(ρ,φ)坐标系测地线方程为

此时万有引力几何化，空间是平直的。(x,y)空间运动的形式可以由坐标变换式(2.40)、(2.41)的逆变换

来得到。将极坐标系转化至笛卡尔坐标系中。此时测地线方程为

(2.48)

根据联络的定义式(2.10)和坐标的正逆变换，可以得到

将行星速率的表达式(2.38)、(2.39)以及联络分量的表达式代入至测地线方程(2.48)中，读者可以验证，运动方程就回到了

(2.52)

y的运动方程推导与此类似。这一方程与牛顿第二定律得到的动力学方程(2.34)形式相同，但是意义却完全不同。在方程(2.34)中，等号右边的项(-ω2x)是万有引力导致的加速度，空间是平直的，而式(2.52)左边ω2x是几何量，空间是弯曲的，引力的效果被弯曲空间效应所替代。(x,y)空间度规不再是一个常量矩阵，其具体形式是什么，这就牵涉到下节要研究的引力场方程，这里先不讨论。

以上二维弯曲面运动方程(2.52)就是测地线方程，亦即式(2.29)的三维表述形式。它是满足广义相对性原理的，这说明万有引力定律是可以写为弯曲空间中广义协变形式的。以上方程也都满足伽利略变换，因此一个无限大的速度在绝对时空观下是允许的。从这个例子可以看出，光速不变原理是不能抛弃的。光速不变要求时空一体，四维时空的固有间隔ds2不变，这样才能建立符合真实物理世界的相对论理论。由于时空弯曲，固有间隔ds2、时空度规和联络之间的关系很复杂，下面做具体的说明。

弯曲时空的的性质由每个时空度规来刻画。根据等效原理，局域一点都可以做一个坐标变换变为一个平直时空。局域平直时空光速不变导致的不变量就是四维时空固有间隔ds2，它表示两时空点之间的不变距离，在任何度规下都为一标量。ds2由度规张量确定，即

(2.53)

注意，基于以上广义光速不变原理的讨论，相对论理论中希腊字母如μ就必须取四维时空坐标0,1,2,3了。由于dxμdxν关于μ、ν指标对称，在本文中我们假设度规张量是对称的，即。度规张量非对称的情况，具体可以参考文献[7]。在四维时空中，对称的度规张量一般有10个分量，它们完全确定了时空的几何性质。度规张量有着非常丰富的物理内容，对度规张量各个分量的检验将直接验证引力的效果。下小节将说明度规分量的物理意义。

另外一个重要的量称为固有时，它与时空间隔的关系是

(2.54)

其中c代表真空中的光速，在本文中采取自然单位制，即c=1，这样简化之后有

ds=dτ.

(2.55)

式(2.53)也可以写为

(2.56)

两边同时除以dτ2，就得到一个恒等式

(2.57)

时空间隔与固有时是描述广义光速不变原理的重要物理量。同时，引入了度规之后就可以定义该时空中的面积、体积等几何量了。而这些几何量相对于闵科夫斯基时空的偏离正是引力场的效果。这一点使得对广义相对论的检验变得更加直观，因此有着清晰而丰富的物理内涵。

根据黎曼几何，可得到联络和度规的关系。如四维时空间隔dτ2不变，即

(2.58)

将上式用联络写开，根据黎曼几何

(2.59)

上式是由联络表示度规的方法。反过来，也可以用度规表示联络。为此把上式中的指标μ、ν、β循环排列，得到

将式(2.60)与式(2.61)相加并减去式(2.59)，经化简，得到

(2.62)

这就是四维时空由度规计算联络的公式，该联络称为克里斯多夫联络。注意在广义相对论中，联络的下指标是交换对称的。联络不对称(挠率不为零)的情况不属于本文讨论范围。

在某个确定度规弯曲空间中，度规与度规一阶二阶导数可以组成的张量为黎曼曲率张量，其形式为

(2.63)

该张量确定了时空弯曲的具体性质。另外还可以对黎曼张量进行指标缩并得到里奇张量和标量

这些量的几何定义都在第二篇附录中，这里就不详细说明了。在广义相对论引力理论中，里奇张量和标量有重要的应用。

在等效原理的指导下，本节推广了相对性原理和光速不变原理，由此就可以建立广义相对论了。后文的关于度规的广义相对论引力论就是以上原理的直接结果。但是仅在等效原理的指导下，已经可以理解很多引力物理的内涵了，特别是关于引力存在时坐标系和时间膨胀，尺子收缩等相对论时空观效应的理解，下面专门用一小节来进行说明。

2.3 坐标系与时空观

狭义相对论改变了我们对时间和空间的理解。不同惯性系之间的变换，时间和空间的测量都会发生改变，因此在相对论理论中，参考系以及参考系之间的变换尤为重要。物理学中，为了确定物体的运动，首先要选择一个参考系。第一步就是选定一个物体，认为它是静止的。然后以此为参照，在空间布满静止尺子测量每个点的空间坐标；在每个空间点放一个时钟，测量当地的时间坐标。绝对时空观认为时间和空间是相互独立的，所以时间空间的测量不会因参照物的改变而改变。相对论理论中，以上定义的参考系的意义就需要特别注意。参考系就是数学中常用的坐标系，物理学的时空坐标系有4个参数(t,x,y,z)，相对论理论中通常取xμ指标μ为(0,1,2,3)来表示。狭义相对论处理的惯性参考系，问题相比于非惯性系或者引力存在情况就简单很多。空间布满静止尺子测量显示的数值就是空间坐标，这个空间坐标就称之为固有距离或者固有长度。每一个地点时钟显示的时间就是当地的时间值，也就是固有时。当然，全空间的时钟是需要对齐的，这就是相对论中“对钟”的概念。在没有探测到引力波之前，人类对钟所使用的相互作用只有电磁相互作用。这种情况下，物理学上能够确定的是所谓的“双程光速”“单程光速”不变只能作为假设，因而狭义相对论的各种修改版本其实无法实际实验检验。当有了引力波探测之后，原则上人类又有了新的对钟手段，相对论如何修改是一个很大的课题，具体内容读者可以参考文献[8]、[9]。当对钟之后，每个地点的固有时就是当地的坐标时间。以上是惯性系的坐标的定义，读者也许会觉得有点多余。但是根据上文的等效原理就会知道，当引力存在时，问题就变得麻烦了。首先需要明确的就是，每个静止的尺子显示的不是空间坐标值，而是当地的固有距离；每个点的时钟显示的也不是时间坐标值，而是当地的固有时。这点有点难以理解，下面就以时间坐标和固有时之间的关系为例来专门作出说明。

广义相对论中，度规张量是描述时空几何的基本变量，是坐标的函数。根据式(2.53)，弯曲时空中的固有时微元为

(2.66)

这是一个不变量，也就是上节说明的光速不变原理的要求。平直时空中，度规等于1(当地静止时钟显示的)，坐标时间dt就和固有时间间隔dτ相等。引力存在时，度规不等于1，坐标时间隔dt就不等于固有时间间隔了。二者之比为

(2.67)

如果钟表在引力场中保持静止，即

dxi=0

那么式(2.67)变为

(2.68)

上式说明引力场影响了时间的测量，造成了时间的膨胀或者收缩的效应，坐标时间和当地固有时并不是相等的。现在的问题是，在当地静止的时钟显示的时间是那个时间？是坐标时间还是固有时间？根据上文参考系坐标定义的方法，有读者可能会认为，时钟显示的是坐标时间。这样理解是不正确的，其实静止时空不管是有没有引力的存在，显示的都是时钟运行的固有时间。那么引力不是造成了时间膨胀或者收缩，钟表怎么不能显示坐标时间呢？这是因为在引力场中坐标时dt是不可观测的，根据等效原理，在引力场中可以找到一个局域惯性系使得引力的效果消除。引力场造成了时间膨胀或者收缩，但是不能对钟的快慢有直接的影响。不管钟是机械钟，还是原子钟，它测量时间一定依赖于某个具体的物理机制，比如单摆或者原子震荡等。如图2所示，弹簧振子与一个钟表二者保持相对静止。引力场改变对所有物理过程的效应是一样的，如果它造成了一个弹簧谐振子振动周期的改变，相应时钟内部计时物理机制也发生了相同的改变，所以时钟测量的弹簧振子周期与惯性系时钟测量的结果是相同的。换一个参考系看，也是一样的。如果换成局域惯性系，则钟和弹簧振子在力的作用下上升。钟和弹簧振子相对静止，时钟显示的当然是弹簧振子固有周期。空间测量也存在类似的情况，这点的理解非常重要，也就是说引力存在时，时间坐标和空间坐标具体值只能由时钟和尺子显示值通过度规计算来得到。这并不意味着坐标没有意义，相反，这会带来重要的物理效果，即比较引力场中不同地点同一物理机制，比如光，就看到了引力造成的红移或者蓝移等时间改变效应。

理解由引力造成的相对论时空观效应的关键点在于区分坐标间隔和固有间隔，二者由度规张量联系起来。若沿着t轴时间演化dt，坐标间隔是dt，固有间隔是坐标间隔是全局的、不可直接测量的。固有间隔是物理的、可直接测量的。但是各地的时钟走时(固有间隔)并不是同步的，因此并没有全局的意义。对比同一物理过程，就可以看到这种效应造成的差别。对于引力场中的P1，P2两点，静止的钟测量的同一物理机制经历的固有时分别为dτ1和dτ2。它们与坐标时的关系为

由于dt1，dt2是全局的坐标时间，因此，两点经历的坐标时间间隔dt2与dt1是相等的，则

如果在引力场中对比两个不同地点，同一物理机制发出的固有振动周期相同的光波(两点发出的光传播到同一地点)，相应的频率之比为

这就是引力造成的红移或者蓝移的现象。后文将具体说明该现象的实验验证。

坐标系和固有时、固有距离之间的关系也可以解释相对论理论中经常会被提到一个问题：双生子佯谬。狭义相对论中，由于处理的是惯性系问题，两个相对运动的物体，互相看到对方都是时间膨胀了。比如一对双胞胎，弟弟留在了地球上，哥哥坐上宇宙飞船做高速旅行。若干年后，哥哥返回地球见到了弟弟。根据狭义相对论理论，从地球上弟弟的角度看，哥哥的时间膨胀了，也就是哥哥经历的时间短，因此比弟弟年轻。但是从哥哥的角度看，弟弟以相反的方向高速运动，应该是弟弟的时间膨胀了。到底谁的时间发生了改变？这就是著名的双生子佯谬。因为物理结果只能有一个，不可能因为参考系的改变而改变。这个情况其实比较复杂，因为我们不清楚哥哥具体的加速情况，我们举另外一个类似的例子来说明这个问题，同时借此来更加深入理解坐标时与固有时的关系。

如图3所示，两个人A、B在互相观察对方。其中A在地面上处于惯性系中；B站立在一个圆盘上，随着圆盘一起作相对于地面的旋转，角速度为ω。A与B距旋转中心C点的径向长度为ρ0。令A观测者为O坐标系，B观测者为O′坐标系。这个圆盘常被用来讲解广义相对论引力论，因此也被称为爱因斯坦转盘。首先，A处于惯性系，情况比较简单，相关运动学的效应都可以用狭义相对论来处理。O系中，B做匀速圆周运动，所以B受到一个向心力的作用。沿着旋转方向尺子会发生收缩；圆周的径向则没有收缩。如上文所述，由于B点测量到的是固有长度，从B测量的角度看，B所处的空间不再是平直的了，圆周周长Z与半径ρ之间的关系为

公式中的

就是当前情况下的洛伦兹因子。因此B的参考系就必须用非欧几何来描述了。依据狭义相对论运动学，此时A也会看到B的时间膨胀了，因为B相对于A运动的速度为

每转一周，A经历的时间是

A会看到相对于B静止的时钟显示经历的时间是自己经历时间除以洛伦兹因子即

(2.77)

旋转中心C点相对A点静止，C点时钟显示的时间与A点时间是同步的。所以在O惯性系看，以上结论都是正常的。

在O′系中的B看来，就会出现所谓的双生子佯谬，即B看到A相对于自己在做圆周运动，根据狭义相对论，A的时间应该是膨胀的。这就与O系中A看到现象相反了，那到底是哪个有问题呢？这里我们需要知道，B所处的O′系是一个非惯性系，依据等效原理，O′系和惯性系是等权的，B可以认为O′系并不是非惯性系，而是时空中存在着引力作用。正是引力作用造成了时空的弯曲，时空由黎曼几何描述。此时B看C点，发现C点时钟相对于B点运行的快。B的理解为，C点的弯曲时空的度规00分量大于自己当地的00分量。根据O惯性系的分析可知，径向ρ处时空度规的00分量为

因此C点时钟就走的快正是因为上文式(2.71)描述的引力造成的时空观效应。那B看到A的时间到底是膨胀还是收缩了。要说清楚这一点就必须进一步明确O系和O′系之间的坐标变换。如果两个坐标系都采用极坐标，仔细分析就会发现，相应的坐标变换可以取为

t=t′的原因在于C点的引力为零，A点的时间与C点时间同步。O′系B点坐标时间与C点同步，但是B点时钟显示的固有时间间隔小于当地的坐标时间间隔，这正是B钟慢的原因。可能有读者认为以上坐标变换不就是上小节所说明的绝对时空么？其实不是这样的，此时的坐标变换是时空一体的变换，变换要求四维时空长度ds2不变(不考虑垂直与盘面的轴向)，此即光速不变原理的要求。O系时空度规为

(2.82)

按照式(2.79)、(2.80)、(2.81)坐标变换之后，O′度规为

(2.83)

此时B应该怎么计算A经历的时间呢？在牛顿力学里，计算一个物体运动的时间很简单，就是物体运动轨迹的长度除以速率积分即可。按相对论理论，问题就变得复杂了。速度uμ定义为坐标对固有时间的变化率，轨迹长度除以速率计算的是固有时间。而这正是我们所需要的。也就是说，我们并不需要坐标变化微元除以dt的坐标速度(等于距离引力源无穷远处观测者测量到的速度)。因此B点计算A旋转一周经历的固有时间间隔为

(2.84)

其中

(2.85)

这正像狭义相对论中两个相对运动的惯性系一样，A、B互相看到对方的相对旋转角速度为ω。因此在O′参考系中B计算A的时间确实是比自己经历的固有时间间隔长，这点是毋庸置疑的。由此读者也会理解，在O惯性系中，A计算B旋转一周经历的固有时间间隔可以由坐标时间间隔2πρ0/vB除以洛伦兹因子得到；也可以完全按照运动方程直接计算B经历的固有时间间隔

(2.86)

可见双生子佯谬是不存在的，请读者仔细体会其中的物理规律。在理解了坐标系与固有时、固有距离之间区别与联系之后，下面开始具体的广义相对论引力理论的旅程。

3 相对论引力论及其检验

上节已经说明了等效原理，广义相对性原理和光速不变原理。原则上任何理论都可以写为广义协变的形式，时空一体则意味着广义光速不变。牛顿力学、经典电磁学都可以写为广义协变理论形式。在量子场论中也可以考虑一个量子过程在弯曲时空的修正[10]。这实际上是广义相对论理论的一半内容。而另一半，引力几何化自身，时空本身如何弯曲？即刻画弯曲时空的度规，曲率等几何量满足什么规律？等效原理并没有说明，而这才是引力论核心内容。本节将研究如何将引力几何化，得到最终的爱因斯坦引力场方程。引力论成功地将万有引力推广为相对论理论，它可以描述了引力和宇宙等。它所预言的光线偏折、水星近日点进动、引力红移以及引力波等也被逐一验证[11]。本节首先将导出爱因斯坦场方程，进而讨论它的几种重要的解，以及引力论的重要检验等。

3.1 引力场方程

首先要写出弯曲时空自身的物理理论来。弯曲时空由度规来刻画，因此广义相对论引力理论描写的是度规的动力学。引力场方程是一个度规的物理方程，这正是前文所说的等效原理的要求。麦克斯韦方程组的形式可以提示我们引力场方程的形式。麦克斯韦方程组左边是电磁场的动力学项，右边是场源项。度规的物理方程应该也是度规的动力学项等于引力源项。然而，引力的描述其实没有其他特别的物理要求，根据广义相对性原理和光速不变原理，做以下两个假设[12]：

(1) 方程是一个四维时空的张量方程；

(2) 方程是二阶微分方程，并且对二阶导数是线性的。

第一个假设很明显，不需要再做说明。第二个假设并没有坚实的根据，只是由于已知的物理定律最多也只包含二阶导数，所以我们希望引力的方程也是如此。当然，包含高阶导数的引力理论也有很多研究，主要代表有f(R)引力[13]，f(T)引力[14]等，这些理论超出了本文的讨论范围。根据黎曼几何，由度规张量，以及度规一阶、二阶导数构成的张量有黎曼张量，里奇张量，里奇标量，符号分别为

(3.87)

这些张量中最基础的黎曼张量，后面两个张量都是黎曼张量的指标缩并。通常，场论的构建方法就是把所有允许的项写下来，然后确定各项前面的系数即可。写完度规组成的张量，这等于写下来度规物理方程一边的形式。

度规物理方程另外一边的张量就是引力的源。物体的引力质量产生了引力。由于引力质量与惯性质量的等价，而惯性质量即能量密度，因此可以认为能量密度提供了引力。但是能量密度只是能量在空间中的分布，最多也只能写成标量形式。所以要写下完整的引力源项，就应该使用能量动量张量

能量密度只是Tμ ν的一个分量。能量动量张量Tμ ν可以依据诺特尔定理，由拉格朗日量的时空对称性得到，其具体形式可以参看后文的讨论。这是一个二阶张量，因此这也决定了度规的动力学项只能由黎曼张量缩并产生的里奇张量和标量来构成。这样，描述引力的方程所需要的项就齐全了。

广义相对性原理允许我们使用一个技巧，在测地坐标系确定系数。所谓测地坐标，即是在任意一点P，引入一组新坐标x′μ，使得经过坐标变换后的克里斯多夫联络为零。这意味着可以将局域一点的gμ ν坐标变换为平直时空下度规形式ημ ν，ημ ν为(本文的平直度规约定)

(3.89)

为了做到这一点，只需要经过坐标变换，使得

(3.90)

这其实是在这一点取度规场切空间。此点附近度规为

(3.91)

hμ ν是一个小量，它的一阶导数为零，即

hμ ν,α=0

(3.92)

因此在测地坐标下度规的一阶导数项都为零，只剩下二阶导数项，即

(3.93)

度规的一阶导数为零，克里斯多夫联络也为零，此时问题得到了大大简化。

现在可以尝试导出描述引力场的物理方程。如上文所述，黎曼张量是唯一可用gμ ν二阶导数的线性组合来构造的张量，方程左边必须是关于黎曼曲率张量的某种缩并形式。由于方程是二阶张量方程，因此方程左边关于黎曼曲率张量的组合只能是

(3.94)

其中，a、Λ是待定系数。而方程的右边是能量动量张量Tμ ν，引力场方程可以初步确定为

(3.95)

其中，κ决定了引力的强度。要确定方程中的待定系数，需要从物理上对方程做进一步的要求：

(1) 该理论低速时应该回到牛顿万有引力理论；

(2) 理论应该保持广义能量动量守恒。

这两个要求都是是自然的：既然现在要建立引力的相对论理论，物体速度远远小于光速时当然应当回到牛顿万有引力；平直时空中能量动量守恒，在相对论理论中保持守恒也是自然的。第二个要求是对引力源的要求。有了以上假设和要求，就可以确定引力场方程了。平直时空中物质的能量动量张量守恒的要求即

(3.96)

这可以看作是测地坐标系中局域时空点成立的方程。当引力场存在时，守恒定律需要推广为广义形式。根据广义相对性原理，只需要把测地坐标系中成立的守恒方程普通导数替换为协变导数即可，即

(3.97)

利用坐标变换式(3.90)，将式(3.95)转化到测地坐标下，形式为

(3.98)

上式中符号上的“撇”代表经过了坐标变换。将上式两边取四维散度，根据能量守式(3.96)，有

(3.99)

由于测地坐标里奇张量、标量的具体形式为

利用克里斯多夫联络的式(2.62)，可以得到

以及

其中，

(3.102)

是测地坐标下度规张量的迹。由以上公式可以得到测地坐标下的里奇张量

(3.103)

以及里奇标量

(3.104)

将以上两式代入至式(3.99)中，可以将其化简为

(3.105)

可以看出，能量守恒式(3.99)的条件导出待定系数

(3.106)

而另外一个系数Λ称为宇宙学常数，不能由此方式求出。这是一个非常小但不等于零的数，在很多广义相对论文献中都省略了。爱因斯坦最初得到的引力场方程中也省略了这一项。但是它对宇宙的演化至关重要，在此我们保留它。由此就得到描述引力场的物理方程，即爱因斯坦场方程

(3.107)

这一方程是描述引力(能量动量张量)与时空(曲率张量)相互作用的方程。当然引力强度κ具体值仍然没有确定，下一节依据上文所述的低速下回到牛顿万有引力的要求，就能完成最终的引力场方程。

3.2 牛顿近似

为了确定引力强度κ，将牛顿引力理论与广义相对论做对比来寻找其线索。牛顿引力理论是一个非相对论的弱场理论，所考虑的速度远小于光速。牛顿万有引力公式为

(3.108)

上式右边负号代表吸引力；m1、m2为两物体的质量(这里不再区分惯性质量与引力质量)。根据牛顿第二定律，得到牛顿引力理论的运动方程，即

(3.109)

其中，g就是重力加速度。据此定义牛顿引力势Φ，它和牛顿引力F的关系是

(3.110)

对一个连续的质量分布，引力势是

(3.111)

利用关系

可以将上式改写为

(3.112)

因此引力势作用下的运动方程为

(3.113)

现在证明，在低速、弱场、静态引力场以及空间缓变的情况下，广义相对论便回到了牛顿理论，即爱因斯坦场方程在经典的近似下，回到了式(3.112)，并且通过对比得到爱因斯坦场方程中的耦合常数κ。在广义相对论中，引力相互作用物体的运动方程是弯曲时空中的测地线，根据式(2.9)，空间坐标的运动形式为

(3.114)

在低速的情况下，有近似条件

(3.115)

这就是非相对论近似，也是牛顿理论处理问题的条件。测地线方程式(3.114)近似为

(3.116)

对比牛顿引力理论中的运动方程(3.112)，可得到联络与引力势的关系：

(3.117)

可以看到，在低速近似下联络的分量即重力加速度g。注意，牛顿近似联络分量主导意味着时空弯曲。而第2.2节所举的例子是绝对时空观二维空间弯曲面。二者是不同的，读者可以体会其细微差别。而对于一般情况，根据测地线方程，有

(3.118)

因此

可以解释为物体在引力场中所受到的四维引力。这是对牛顿引力的推广。

当引力不存在时，时空是平直的，引力存在时，时空是弯曲的。当引力场强度比较弱时，时空的弯曲程度也比较小，因此可以认为弱引力场下度规张量偏离闵科夫斯基度规ημ ν一个小量，这个小量记为hμ ν，hμν≪1。注意，弱场近似的hμ ν与上文测地坐标的hμ ν是不同的：前者是小量，导数不一定为零；后者也是一个小量，但是其一阶导数为零。度规张量可以写为

(3.119)

联络可以改写为

(3.120)

进而得到了引力势与度规张量的关系，

(3.121)

利用引力势的表达式(2.1)，可以得到弱场、低速近似下度规张量的00分量：

(3.122)

这表明引力场的存在影响了时间的测量，但只是当2GM/r一项与1可比拟时才会变得明显。注意这里用的是自然单位制，若用国际单位制，弱场条件即是指

(3.123)

对于地球和太阳来说，这一项都非常小，弱场近似都成立。比如太阳，质量为M=2×1030kg、半径为r=7×108m，在太阳表面计算上式

宇宙中其他类型的天体，比如中子星或黑洞，质量极大、体积极小，它们产生的引力效应非常强，属于强引力场。强引力场效应也是检验广义相对论的一个热点方向[15]。

当引力场不随时间变化时，度规张量对时间的导数为零，这时称为静态引力场。大部分天体所产生的引力场都是静态的，也存在随时间快速变化的引力场，牛顿引力理论不能准确描述它，必须用广义相对论。用公式表示静态引力场的条件，即

(3.124)

引力场是空间缓变的，即

(3.125)

把以上近似条件代入至爱因斯坦场方程(3.107)左边，而方程的右边能量动量张量Tμ ν在以上近似下只有00分量有贡献。该分量就是物质的质量密度ρ(x)。场方程的00分量方程为

(3.126)

利用上式来确定耦合常数κ。首先对爱因斯坦场方程(3.110)两边取迹，即用gμ ν作用，简单缩并(Λ=0)得到

(3.127)

是能量动量张量的迹。在近似条件下，

(3.128)

将上式代入至式(3.126)中，得

(3.129)

在以上静态、缓变、弱场的条件下，克里斯多夫联络为

(3.130)

将联络的各个分量显示地写出，有

因为hμ ν为一阶小量，联络也为一阶小量，里奇张量中两个联络相乘的项就是一个二阶小量。忽略这些二阶小量，将联络的表达式代入至里奇张量中，经过简单的计算，可以得到

(3.131)

上式中的算符，即三维拉普拉斯算子。代入至式(3.129)中，取g00=η00，得到

(3.132)

上式是在近似条件式(3.115)、(3.129)、(3.124)、(3.125)下爱因斯坦场方程形式。下面就是把上式与牛顿引力理论方程(3.112)比较，利用Φ与h00的关系，可得

(3.133)

可以得到系数κ的值

κ=-8π G

(3.134)

代入κ，爱因斯坦场方程为

(3.135)

当宇宙学常数Λ=0时，

(3.136)

这就是大家熟悉的爱因斯坦场方程。方程左边两项也被定义为爱因斯坦张量Gμ ν

(3.137)

它满足比安奇恒等式

(3.138)

这是广义相对论中的一个重要恒等式，对应的就是能量动量张量守恒。

广义相对论虽然是一个关于引力的理论，但通过引力的几何化将关于引力的问题转化为弯曲时空的测量问题，即广义相对论关注于弯曲时空的度规结构。一种度规形式即定义了一种时空结构，它对应于某种特定形式的引力场，因此在广义相对论的框架内，引力即是时空。广义相对论是研究引力的基本工具，而爱因斯坦场方程(3.136)则成为所有研究的出发点。

根据爱因斯坦场方程可知，物质决定了时空如何弯曲，而时空的弯曲将导致一系列非常有趣的物理结果，我们可以通过时空的弯曲效应来检验爱因斯坦场方程。根据目前的天文观测结果，所有的数据都支持场方程。下一节，我们介绍爱因斯坦场方程的第一个严格解，即施瓦兹解，以及它的应用。

3.3 施瓦兹度规、广义相对论的检验

上文在弱场、低速、缓变的情况下得到了引力场方程，这就是1915年爱因斯坦得到的引力理论。虽然它可以回到牛顿万有引力理论，但这并不能证明该理论是正确的。必须验证理论对万有引力理论的修正效应才能确定其正确性。最好方式就是找到太阳系附近引力场方程的严格解，然后取近似来确定万有引力的修正效应并进行观测验证。1916年，德国物理学家施瓦兹(Karl Schwarzschild)得到了爱因斯坦场方程的第一个严格解(施瓦兹解[16])。该解描述了静态、呈球对称的引力场，比较接近于太阳系附近的引力场，因此有着重要的应用。

太阳系由太阳、8大行星以及无数小行星组成，太阳的质量占据了太阳系质量的99.8%。忽略太阳的多级矩和自转效应就是施瓦兹解要求的求解条件。这一节讨论此条件下求解施瓦兹解的过程，然后可以由此检验广义相对论。

施瓦兹解求解过程就是根据引力场的静态、球对称分布对度规张量的限制，再利用爱因斯坦场方程就能得到度规张量的具体表达式。对于一个球对称的场，自然是采用球坐标(t,r,θ,φ)，度规张量有10个分量。首先，场的静态条件要求度规张量与时间无关，并且满足时间反演不变。这意味着，时空间隔中dtdr,dtdθ,dtdφ项前的系数必须为零。因此，时空间隔的形式必须为

(3.139)

其中，A(r,θ,φ)是关于坐标的函数；dl2是空间间隔。

场的球对称分布给出的限制是，在以r为半径的球面上的转动，时空间隔保持不变。这样，函数A(r,θ,φ)仅仅是坐标r的函数，记为A(r)。在一个二维球面上，两点之间的间隔是唯一的转动不变量，即

是不变量。由此可知，空间间隔的形式只能是

其中B(r)、C(r)是关于r的函数。于是，相应的时空间隔为

(3.140)

为了简化问题，引入坐标变换时空间隔变为

(3.141)

这样可以将时空间隔中的变量函数减少至两个。为了随后的计算方便，再令

(3.142)

这样，静态、球对称的近似要求下，省略符号上的一撇，度规张量的形式为

(3.143)

下面将通过解爱因斯坦场方程来确定N(r)、L(r)的具体形式。

真空中能量动量张量为零，因此根据关系式(3.127)，真空中的爱因斯坦场方程形式为

(3.144)

接下来，需要利用度规式(3.146)给出Rμ ν的各个分量，并代入上式进行求解。首先需要算出所有的克里斯多夫联络，然后再通过缩并算出Rμ ν。在当前的条件下，里奇张量中很多分量为零。非零的里奇张量为

其中，

代入至方程(3.144)中，得到3个微分方程

这组方程很容易解。式(3.145)加上式(3.146)可得

N′+L′=0

(3.148)

积分上式，得

N+L=C

(3.149)

其中，C是一积分常数。距离中心天体无限远时，引力场强度近似为零，度规张量应该回到平直时空的形式。即r →∞时，函数N(r)、L(r)必须同时趋近于零，因此积分常数C=0,

N=-L

(3.150)

将式(3.148)代入式(3.147)中，经化简，得到微分方程

(3.151)

这一方程的解为

(3.152)

其中，k为一积分常数。根据方程(3.150)，有

(3.153)

综上，我们通过解真空中的爱因斯坦场方程得到描述静态、球对称的引力场的度规形式为

(3.154)

为了得到k的值，需要借助牛顿极限。在弱场、低速近似的情况下，h00起着牛顿引力势的作用，即式(3.121)。一个球对称的质量分布，总质量为M，根据式(3.122)，有

(3.155)

从而得到

k=-2GM

(3.156)

将k代入空间间隔式(3.154)中，得到

(3.157)

这是一个描述静态、球对称引力场的真空解，即施瓦兹解。施瓦兹解是一个严格解，其实该解在很多类型的引力场下都是适用的。任何非转动、电中性的恒星的引力坍缩，其最后结果必定导致施瓦兹几何[12]。施瓦兹度规时空产生的物理效应，包括水星近日点的进动、光线偏折和引力红移，观测结果验证了施瓦兹解的预言，这就是广义相对论的实验验证。

3.3.1 水星近日点进动

牛顿万有引力理论对太阳系中行星运动的描述是非常准确的，比如理论准确地预言了海王星和冥王星存在。这两个行星的观测是牛顿万有引力理论的巨大成功。但是，万有引力的理论预言存在一个例外：行星近日点的运动与理论值有所偏离。对于一个可以看作质点的行星，万有引力理论所预言的轨道方程为

(3.158)

其中u=1/r，r为行星的半径，下文将说明l的意义。方程(3.158)的解为

(3.159)

这是一个椭圆轨道方程，ε是这个椭圆轨道的偏心率，太阳是其中一个焦点，近日点位于φ=φ0。当考虑了其他行星轨道的扰动与太阳四极矩等因素后，行星就会存在进动现象，即行星旋转的轨道面对称轴也在旋转。其最显著的观测效应就是近日点位置的变动。万有引力可以计算近日点进动的具体数值。观测表明[17]，行星实际进动的数值与万有引力的预言并不符合。这一偏离较为明显的例子是水星，水星的轨道偏离正圆的程度很大，在近日点距太阳4600万km，而远日点则有7000万km。如图4所示，水星围绕太阳做周期运动的轴在缓慢变化着，两个相邻近日点的角位移偏离了2π(转动一周的角位移)。观测表明水星近日点的偏转角为(5600.73±0.41)弧秒/百年，而由牛顿万有引力理论算出其他行星的扰动导致的偏转角为(5557.62±0.20)弧秒/百年，其中额外的(43.1±0.1)弧秒/百年的进动值是牛顿引力理论不能解决的。为了找到这额外的进动值，我们研究施瓦兹度规下的测地线方程，从中可以得到对行星轨道方程的修正。

施瓦兹度规式(3.157)对应的测地线方程是

(3.160)

其中，符号上的点号代表对固有时τ的导数。对于现在要处理的情况，可以假设行星的轨道在

的平面上，并且有

(3.164)

即轨道将始终保持在这一平面上。这是很明显的。

式(3.160)和式(3.163)可以直接积分。利用关系

可以将式(3.160)写为

(3.165)

积分上式，得到

(3.166)

同样，积分式(3.163)得到

(3.167)

其中，和l都是积分常数。为了找到这两个积分常数的物理含义，利用拉格朗日量式(2.12)计算一下施瓦兹度规下的欧拉-拉格朗日方程。根据拉格朗日量式(2.12)，时间t和角度φ的欧拉-拉格朗日方程为

注意以上方程右边，分别是与坐标xμ的第零分量以及第三分量共轭的动量p0与p3，即能量E与角动量L。而以上方程的左边皆为零，即

这是因为拉格朗日量式(2.12)中包含坐标的项只有度规张量gμ ν，施瓦兹度规式(3.157)与时间t和角度φ无关，即

(3.170)

度规与某一坐标的无关性是一类重要的问题，它涉及时空的对称性。比如在狭义相对论中，度规ημ ν=diag(1,-1,-1,-1)，与4个坐标都无关，因此在平直时空中能量动量守恒。度规的形式不同，时空的对称性就不同。这一点在后文会作出说明。

方程(3.168)、(3.169)说明，施瓦兹度规下的行星轨道运动中，运动的能量E与角动量L是守恒量。根据拉格朗日量式(2.12)，可以得到

比较式(3.166)、(3.167)与式(3.171)、(3.172)，可以得到积分常数与l的物理含义，它们分别是单位质量的能量和角动量，即

因此，测地线方程(3.160)、(3.163)实际上确定了行星的运动常数，行星的运动方程将由式(3.161)给出。做变量变换并利用

方程(3.161)成为

(3.175)

方程(3.175)非常难解，可以利用式(2.57)来将其化简。利用施瓦兹度规式(3.157)，代入至式(2.57)中，得到

(3.176)

再利用式(3.166)、(3.167)代入上式，经化简得

(3.177)

将上式代入至式(3.175)中，可以得到施瓦兹度规中行星运动的轨道方程为

(3.178)

把此式与牛顿引力理论相应的轨道方程(3.158)相比较，多出了-3GMu2一项，这一项代表着广义相对论的修正。估算一下这个量的大小，相比于式(3.178)第二项u，二者相差

由于水星质量很小，M约等于太阳质量，r=5.5×1010m，在国际单位制中

(3.179)

是一个远小于1的数。由于广义相对论的修正项-3GMu2比其他项小很多，因此利用逐级近似的方法求解微分方程(3.178)。这里直接给出微分方程(3.178)的近似解

(3.180)

上式表示一个进动的椭圆轨道。其中，ε与φ0是牛顿引力中行星椭圆轨道的偏心率和近日点位置。行星轨道的一个周期为

(3.181)

这表明两个相邻的近日点的角距离比2π多出

(3.182)

这个量给出每个公转周期近日点的角进动值。对于一个长半轴为a的椭圆，近日点的距离是a(1-ε)。对于椭圆轨道式(3.159)，在近日点处φ=φ0，有

(3.183)

得到

(3.184)

在国际单位制中，水星近日点的进动值为

(3.185)

代入水星的观测数据，这个角进动值为0.1035弧秒，即每一周期水星的近日点与上一个近日点相差了0.1035弧秒。因为水星的公转周期是0.24年，这一进动值相应于每百年43弧秒。表1给出了太阳系内行星进动的观测值(弧秒/百年)与广义相对论的预测值(弧秒/百年)[12]。其中，观测到的行星近日点进动值已经减去了其他行星的贡献以及岁差的影响。观测数据与广义相对论的预言符合得很好，因此行星进动预言值的修正是广义相对论的重要验证之一。

3.3.2 光线偏折

广义相对论另外一个重要检验是光线的引力偏折。太阳附近的光线轨道略微偏离了直线，这直接反映了太阳附近时空的弯曲。光子的静止质量为零，但是它的运动质量并不为零，所以运动的光子具有惯性质量[17]。这样，即使在牛顿引力理论中，等效原理也表明了引力场将影响光子的轨道。我们先用牛顿引力中的轨道方程(3.158)来估算一下。对于经过太阳附近的光子，速率

v=1

所以角动量

l≈Rv=R

R为太阳半径。代入至式(3.158)中，得

(3.186)

方程中

是一个非常小的量，代表引力场对轨道的影响。如果将其忽略，以上方程成为

(3.187)

它的解为

u=c0cosφ

(3.188)

其中，c0是积分常数，由初始光子的位置决定。如果将上式转化到直角坐标系，即作变换x=rcosφ，轨道方程成为

x=c0

(3.189)

这是一条直线的方程，它代表不受引力场作用的光子轨道。因为是一个小量，可以将方程(3.186)的解近似写为

(3.190)

当光线在远处时，即u=0，根据上式，有

(3.191)

光线在远处的方位角写为

(3.192)

满足

(3.193)

那么光线的偏折角即为2α，即

(3.194)

上式即牛顿引力理论预测的光线偏折。接下来，利用施瓦兹度规下的轨道方程(3.178)计算光线的偏折角度。

光子静止质量为零，处理运动方程时，可以认为式(3.173)、(3.174)中的固有时趋于零，因此在轨道方程(3.178)中有

这时二次方程(3.178)成为

(3.195)

接下来的步骤和处理牛顿引力下的光线偏折相仿。上式的解为

(3.196)

其中u0的定义如上。令在远处光线的方位角为当u=0时，有

(3.197)

保留一阶小量得到

(3.198)

光线在施瓦兹度规下的偏折为

(3.199)

广义相对论预言的光线偏折是牛顿引力预言的两倍。在1919年5月发生日全蚀时，爱丁顿(Eddington)和戴森(Dyson)的两只观测队首次观测到了经过太阳表面的光线偏折，角度分别是(1.98±0.12)″和(1.61±0.30)″，这一观测值与式(3.199)的预言值相符，是广义相对论第一个实验验证。在1919年之后，人们又在许多次日食期间做了类似的观测。但是由于观测的误差比较大，接下来的数次观测都没有做到更精确的检验。而比较精密的实验结果是通过射电望远镜得到的。表2给出了使用射电望远镜检验太阳附近光线偏折的结果[12]。

值得一提的是，射电望远镜的精确观测数据使得人类可以检验某些广义相对论的扩展理论[12]。

另外需要注意的是，一次方程(3.180)也对应着轨道方程，它会给出更多物理内容。虽然

若它们的比值保持有限是一个常数，令

其中参数b称为碰撞参量，它与光子的能量有关。方程(3.177)变为

(3.200)

上式给出了方位角变化和u之间的关系，即

(3.201)

在与中心天体最近的点处有

记这个点为

u=1/r0

从远处而来的光线，经由中心质量的弯曲后，再传播至远处，由上式可以得到其方位角变化

(3.202)

对于不同的碰撞参量b，上式给出不同的光线偏折。偏折的角度可以很小，也可以很大。对于致密天体，光线的偏折角度可以是2π，即绕天体转一圈，也可能是4π，即转两圈，甚至可以一直绕着天体转，形成一个光球。

对于一般天体来说，光线偏折效应很小，而对于宇宙当中的某个星系来说，这个效应就显得十分重要，因为星系有着大得多的质量。当遥远的光线或者电磁波经过某星系时，星系的引力场造成光线偏折的现象类似于凸透镜对光线的偏折，该现象也被称之为引力透镜现象。通过观察引力透镜现象，我们可以获得星系的质量等信息。

3.3.3 引力红移

以上讨论了施瓦兹度规下的径向测地方程，这些测地方程对应着太阳引力场内的轨道方程。理论的预测与实验的测量符合得很好。广义相对论的又一重要的实验验证就是上文已经提到过的引力红移效应，它是时间膨胀效应的直接体现。具体理论在2.3节已经做了说明，引力红移现象指的是在强引力场处向弱引力场处发射的光线会产生红移，反之则会产生蓝移。现在有了施瓦兹度规，我们就可以做实验来检验该度规的红移效应了。

对于在施瓦兹时空中不同径向距离r处的两只静止的钟来说，它们是不同步的，即不同r处有着不同的时间快慢。在没有引力场的情况下，一发射频率为ν的可见光光源，有关系

ν=1/T

(3.203)

其中T为周期。若将光源在施瓦兹时空中，它距质量中心的径向距离为r1，那么根据引力红移理论，这一点的固有时间间隔将比坐标时间间隔小，有

(3.204)

当r1越小，即光源处于更强引力场处时，固有时间膨胀的程度相比弱引力场处就越大。对于固有振动周期为T的光源，不同的引力场强使其频率改变。根据式(2.72)，向引力场强处发射的光，频率会逐渐变大，光谱线向蓝光移动，即蓝移。反之，由太阳发出的一束频率为ν的可见光，在抵达地球时，它的频率会变短，即红移。

接下来进行定量比较。处于施瓦兹时空的两点，距离中心质量的径向距离分别为r1和r2，两处固有时之比为

(3.205)

因此，从r1发射频率为ν1的可见光，在抵达r2时，二者频率之比为

(3.206)

定义频率的相对偏差

则

(3.207)

通过检验接收光源处频率的相对偏差，便可以检验引力场中的时间膨胀。对于地球表面，可以作如下近似

(3.208)

式中，Δr是高度差；g是地球表面的重力加速度。在国际单位制中，上式还要除以光速的平方。若Δr在1km的量级上，估算可得地球表面时间膨胀的效应大概在10-13的量级。要想检验如此小的时间膨胀效应，普通钟表的精度是不够的，必须使用原子钟或者核种。实验上首次对10m量级的时间膨胀的检验是由核钟来完成的。在1960年，Pound和Rebka把一个γ射线源放置于地面上，并用一个放置于塔顶的吸收器来探测γ射线，塔顶距离射线源的高度是22.6m。对于Δr=-22.6m，式(3.211)所预言的相对频移是

(3.209)

这样一个量级在核钟的精度内，实验结果在1%的实验误差之内与预期值相符。

人类可以探测到恒星表面的原子辐射光产生的引力红移现象。太阳表面原子的振动频率，与远处同样的原子振动频率相比，相对频移为

(3.210)

Brault和Snider进行的巧妙实验检验了这一预测的准确性。表3给出了一些检验引力红移实验的具体结果，这些实验表明时间膨胀式(3.205)的正确性，虽然这不是对广义相对论的直接证据，但时间膨胀是弯曲时空的效应。实验数据与理论预测再一次符合得极好[12]。

广义相对论还有一个重要检验是引力波。引力波的探测自从20世纪60年代开始，直到2015年LIGO探测器首次探测到黑洞合并的引力波信号，证实了引力波的存在。通过探测不同频段的引力波，可以揭示强引力系统的物理过程。本专题的第二篇论文将主要讨论引力波波速与真空中光速的关系。

另外，从施瓦兹度规式(3.157)可以看到，引力场非常强处，r →2GM

(3.211)

这对应于时空中非常奇特的区域，该区域光子也逃不出来。因此r≤2GM的区域被称为黑洞，r=2GM的面也被称为黑洞的视界面。黑洞相关物理不是本文的重点，这里就不做过多讨论了。

4 结语

本篇论文首先讨论了在等效原理指导下，相对性原理和光速不变原理的具体内容，然后以此为基础阐述了广义相对论理论中坐标系和时空观的理解。第三部分简述了广义相对论引力论的基本理论建立过程、检验以及应用等内容。正如文中所强调的，广义相对论是关于度规的理论，它将引力效果通过时空的测量方式表示出来，我们因此得以避免质量分布的复杂情况以及其他理论[注]有另外的不使用时空度规来描述引力的理论，可参看文献[18]，理论中存在很多待定参数。的参数等。爱因斯坦场方程描述了时空几何与物质场的联系，前沿引力研究如黑洞热力学、宇宙学及其应用等都是对此场方程的进一步探索，这是当前理论物理的热点方向，进展也日新月异。鉴于本篇论文目的主要是综述经典引力论，因此这里就不详述相关研究进展了。有了经典引力论的基础，下一篇中我们就来处理前言中所讨论的重要问题，光速与引力波速度的关系。

参考文献

[1] LI X, HU Y M. GRB/GW association: Long-short GRB candidates, time-lag, measuring gravitational wave velocity and testing Einstein’s equivalence principle[J]. Astrophysical Journal, 2016, 827(1): 75.

[2] 王雯宇, 许洋. 运动介质洛伦兹协变电磁理论[J]. 物理与工程, 2018(2), 13-25.

WANG W Y, XU Y. Lorentz covariant form of electromagnetism in the movingmedia[J]. Physics and Engineering, 2018, 28(2): 13-25.(in Chinese)

[3] WEINBERG S. Gravitation and cosmology: Principles and applications[M]. 1 edition. MIT: John Wiley and Sons, (1972).

[4] 王雯宇, 王丝雨，许洋. 大学物理和场论中的协变性浅谈[J]. 物理与工程, 2017(1), 30-36.

WANG W Y, WANG S Y, XU Y. On the teaching of covariance in college physics and field theory[J]. Physics and Engineering, 2017, 27(1): 30-36. (in Chinese)

[5] 戴元本. 规范场论[M]. 北京：科学出版社,2005.

[6] C韦斯坦霍尔斯. 数学物理中的微分形式[M]. 北京: 北京航空航天大学出版社，1989.

[7] GOENNER H. On the history of unified field theories. Part Ⅱ.(ca.1930-ca. 1965)[J]. Living Reviews in Relativity, 2014, 17(1): 5.

[8] 张元仲. 爱因斯坦建立狭义相对论的关键一步——同时性的定义[J]. 物理与工程，2015, 25(4): 3-8.

ZHANG Y Z. A key step in the development of the special relativity by Einstein—Definition of simultaneity[J]. Physics and Engineering, 2015, 25(4): 3-8. (in Chinese)

[9] EDWARDS F W. Special relativity in anisotropic space[J]. American Journal of Physics, 1963, 31(7): 482-489.

[10] 刘辽, 黄超光. 弯曲时空量子场论与量子宇宙学[M]. 北京：科学出版社.

[11] ASMODELLE Estelle. Tests of general relativity: A review[J]. arXiv:1705.04397[gr-qc].

[12] H C瓦尼安. 引力与时空[M]. 2nd. 北京: 科学出版社, 2007.

[13] FELICE A D, TSUJIKAWA S. f(R) theories[J]. Living Reviews in Relativity, 2012, 13(1): 3.

[14] FARRUGIA G， SAID J L. Stability of the flat FLRW metric in f(T) gravity[J]. Phys.rev.d, 2016, 94(12).

[15] VEGETTI S, DESPALI G. Constraining sterile neutrino cosmologies with strong gravitational lensing observations at redshift z 0.2[J]. arXiv:1801.01505[astro-ph.CO].

[16] SCHWARZSCHILD K. On the gravitational field of a mass point according to Einstein’s theory[J]. arXiv:physics/9905030[physics.hist-ph].

[17] 俞允强. 广义相对论引论[M]. 2版. 北京: 北京大学出版社, 1997.

[18] CAPOZZIELLO S, LAURENTIS M D. Extended theories of gravity[J]. Physics Reports, 509(2011): 167-321.

基金项目: 国家自然科学基金(11775012)。

作者简介: 王雯宇，男，北京工业大学应用数理学院副教授，主要从事理论物理的研究和教学工作，研究方向为高能物理，超出标准模型新物理，wywang@mail.itp.ac.cn。

引文格式: 王雯宇，许洋. 光和引力波专题Ⅰ——广义相对性原理、光速不变原理及引力论[J]. 物理与工程，2019，29(1)：53-73.

END

更多精彩文章请点击下面“蓝字”标题查看：

《物理与工程》期刊是专注于物理教育教学研究的学术期刊，是中国科技核心期刊，1981年创刊，欢迎踊跃投稿，期刊投审稿采编平台：

http://gkwl.cbpt.cnki.net

欢迎关注

《物理与工程》微信公众号

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

中央批准朱军同志职务调整

三联，刺痛了多少中国人

戴上这手表，不止优雅，蛇年好运连连来

古琴养身：为什么弹古琴的女人会更有气质？99%的人都不知道！