查看原文
其他

相对论量子力学 | 贤说八道

曹则贤 返朴 2019-12-28

点击上方蓝字“返朴”关注我们,查看更多历史文章

相对论和量子力学是近代物理的两大支柱,但这种说法容易引起误解。相对论是一种原理,一种哲学,一种我们构建物理理论时必须遵循的原则,而量子力学是一种实用的理论,它们不在一个层面上。相对论是光和连续统的孩子,而量子理论是物质和分立性的孩子(维尔切克语)。其实,相对论和量子力学的主角都是光(光子)和电子。1925-1927年之间当量子力学理论得以确立的时候,相对论已是相当成熟的理论。如何把相对性原理应用于量子力学波动方程的构造,是当时许多物理学家思考的问题。相对论量子力学的构造,可从洛伦兹群表示开始,任何庞加莱协变表述的量子力学都是相对论量子力学。若直接将替代 和   应用于相对论能量-动量关系 ,得到的是克莱因-戈登方程,但它描述的是无自旋粒子的行为。1928年狄拉克另辟蹊径,硬将能量-动量关系   开平方得到了作为动量线性函数的哈密顿量,从而得到了狄拉克方程  。狄拉克方程解释了电子的自旋是相对论性质,且导致了反电子的概念。反粒子的概念后来扩展到了其它粒子,并进一步地有反物质的概念。自旋是相对论性质,是相对论量子力学方程的结构特性。相对论同量子力学的结合,哪怕是针对无结构的点粒子,都将我们引向大自然意想不到的奇迹。正电子发现后,类似 e++e-→2γ 的湮灭过程将相对论里的质能关系ΔE=Δmc2表现得淋漓尽致。湮灭提供了另一种发光机制。最重要的是,电子的湮灭,以及质子的湮灭,使得人们相信粒子都是倏逝的,粒子数是不守恒的。相对论和量子力学的完全协调要依靠量子场论。依据量子场论的思想,人们相继构造了量子电动力学和量子色动力学,通向基本粒子世界的理论大门打开了。


撰文 | 曹则贤(中国科学院物理研究所研究员)


1

相对论与量子力学的结合


有一种说法,相对论和量子力学是近代物理的两大支柱。这种言论,有把相对论和量子力学放在同等地位的嫌疑。笔者以为量子力学是实用层面的理论,而相对性是一种原理、一种哲学或者信条,是构造物理理论时需要遵循的原则,故有相对论动力学、相对论热力学和相对论量子力学之说。


到1925-1927年期间关于电子的量子力学得以建立时,相对论已经是一门相当成熟的理论了,广义相对论的引力场方程也已面世十年之久。让量子力学波动方程满足相对性原理,即具有洛伦兹变换不变的形式,是许多人脑海中自然而然的想法。注意,那些量子力学的奠基人,若不同时是相对论的奠基人,至少也是非常熟悉相对论的人,爱因斯坦、普朗克、薛定谔、泡利、狄拉克、玻恩、劳厄、福克等人,莫不如是。


1926年出现的薛定谔方程, ,哪怕是对于自由粒子情形, ,也不是洛伦兹变换下不变的。它的左侧只含关于时间的一阶微分,而右侧是关于空间坐标的二阶微分。此外,此时电子具有内禀自旋已是实验确立了的事实,而薛定谔方程不涉及电子自旋。1927年出现的泡利方程  ,哈密顿量  ,描述电子与电磁场之间的相互作用,其中 (Φ,A) 是电磁势,σ 是 2×2 的泡利矩阵 (见下文) 。泡利方程要求波函数是两分量的,即 ,称为旋量 (spinor) 。两分量波函数描述电子这样的自旋为1/2的粒子,但自旋的性质是手动加进去的。


构造相对论量子力学需要满足的条件是,1) 波动方程中时间、空间坐标要有相同的地位,且方程形式是洛伦兹变换不变的。为此,研究者要习惯使用四维时空中的位置  和四维动量,记号,谨记方程是包含关于时间和空间相同阶微分的方程;2)要以一种自然的方式纳入自旋。如同薛定谔方程自然地给出了原子中电子的三个量子数  ,自旋这个量子数也要自然而然地从方程中跳出来。对于后一个问题,一种方案是对薛定谔方程进行改造,要求波函数为 ψ(x,t,σ) ,其中 σ 是粒子的自旋分量。


有一种方案是从狭义相对论出发来构造波动方程。狭义相对论的一个基本结论是粒子的能量-动量关系 (就是色散关系或者能带理论,E=E(p) 或者E=E(k) )   。直接将能量对应哈密顿算符, ,动量对应动量算符, ,就构造了一个相对论波动方程。注意, 写成微分算符形式就是拉普拉斯符号 2。这样得到的方程是所谓的克莱因-戈登方程,但克莱因-戈登方程描述的是自旋为零的粒子而不是电子。


一个容易些想到的方案是将关系式 直接硬开根号,得到   形式的哈密顿量,但这无助于得到相对论波动方程。根号很难处理,不优雅,无法加外电磁场。其实, 形式的哈密顿量不只是有等号两边都不具有不变性的问题,或者什么由展开根号带来的问题, 笔者以为它最大的问题是缺乏正当的物理意义。然而,从 得到某种只包含对空间坐标一阶导数项的哈密顿量是个特别诱人的方案,某种意义上说甚至是唯一的方案。1928年,26岁的英国物理学家狄拉克独辟蹊径,得到了这样的哈密顿量,建立起了描述电子的相对论量子力学方程。


2

克莱因-戈登方程


克莱因-戈登方程的形式为 。如果使用自然单位制( c=1;ℏ =1)(1),且使用狭义相对论的平直时空度规 ημν ,则可改写为  。若欲包括电磁作用,可直观地做替换  ,采用四维动量和四维电磁矢量势表示,此时克莱因-戈登方程可直接写成  的形式,这是标量电动力学(scalar electrodynamics)的基础。还可以把电磁场作用下的方程写成规范协变的形式。若要求波函数有如下的规范变换 ,其中 θ(x,t)是相角,则只需要把微分算符 替换为  ,要求电磁场按照 方式变换,相应的克莱因-戈登方程变为   的形式。类似地,在广义相对论关注的弯曲时空中,即包括引力效应,可直接把度规换成弯曲空间的度规,微分 换成协变微分 ▽μ ,即可得弯曲时空中的克莱因-戈登方程  ,或者写成   等形式。此是后话,读者可在学完广义相对论后回头再体会一番。 


克莱因-戈登方程被许多人重复发现,原因是只要简单地将哈密顿算符   和动量算符  分别替换能量-动量关系中的能量和动量就能得到。薛定谔于1925年在得到薛定谔方程之前就得到过它,因为这个方程不能正确解释氢原子光谱的精细结构就放弃了(见于薛定谔笔记本里的记载)。克莱因(Oscar Klein,1894-1977)和戈登(Walter Gordon,1893-1939)于1926年提议用这个方程描述相对论电子。但是人们逐渐发现克莱因-戈登方程描述相对论电子会遭遇一些问题。其一是负能量解问题,后来的狄拉克方程也会遇到这个问题,但两者各有不同。另一个是波函数的诠释问题。克莱因-戈登方程的守恒量为   ,但不是正定的(positive definite),克莱因-戈登方程的波函数不能同薛定谔方程的波函数那样被诠释为几率幅。后来,克莱因-戈登方程波函数的模平方被诠释成了电荷密度,可为正、零或者负。


克莱因-戈登方程不构成任何单粒子理论的基础,它后来被诠释为自旋为零的粒子的场方程。在量子场论中,所有量子场的每一个分量都要求满足克莱因-戈登方程。据信2012年发现了的自旋为零的粒子—希格斯玻色子,是克莱因-戈登方程描述的唯一基本粒子。克莱因-戈登方程的另一个适用对象是pi-介子这样的复合粒子。克莱因-戈登方程的另一个提出者福克(Vladimir Fock,1898-1974)还研究了克莱因-戈登方程的规范理论。


3

狄拉克方程


1928年,后来宣称自己喜欢摆弄方程的狄拉克得到了关于时间和空间坐标一阶微分形式的相对论量子力学方程。这其中关键的一步,是从相对论能量-动量关系 E2=p2c2+(mc2)2 得到线性的能量-动量关系,然后做替换 。为此,要做因式分解 x2+y2=(αx+βy),这相当于要求 αβ+βα=0 ,α22=1 。αβ+βα=0 这样的反对称条件是非常强的限制。一个合理的选择是 α,β 应为矩阵。狭义相对论考虑的是四维时空,故可为 α,β 选择 4×4 矩阵。狄拉克为此构造了 α1,α2,α3 和 β 四个 4×4 矩阵,得到了电子的哈密顿量为   。常规的狄拉克方程会写成其中  , i=1, 2, 3 ,σ0 是 2×2 单位矩阵,乃为著名的泡利矩阵,鉴于 γμ 都是 4×4 矩阵,则此处的波函数 Ψ 是4分量的。这样的相对论量子力学方程,物理上是有意义的吗?


3.1 自旋是相对论效应▲▲▲

非相对论量子力学中,自旋的考量是手动加进去的。相对论同量子力学的结合,则让人们认识到自旋是一种相对论性质。考察狭义相对论的闵可夫斯基空间,其中的距离由洛伦兹度规定义,即对于矢量 x=(x0,x1,x2,x3) ,其模平方为 。所谓的洛伦兹变换 A ,就是保洛伦兹度规的变换,要求保证 |Ax|2=|x|成立(严格地说应是保 (Ax,Ay)=(x,y) 成立)。群同构方面的知识告诉我们这个空间有其它的表示方式。考察洛伦兹群同 群之间的同构关系,每个矢量 x=(x0,x1,x2,x3) 可以表示成一个 2×2 自伴随矩阵  ,有  ,即这个矩阵的矩阵值再现了闵可夫斯基空间的洛伦兹度规。这个 2×2 自伴随矩阵构成了一个四维矢量空间,其四个正交基为 则有   泡利矩阵 σ1,σ2,σ出现在闵可夫斯基空间的洛伦兹度规的表示中,这让人们隐约感觉到自旋与狭义相对论有关。


狄拉克的电子哈密顿量为 。根据经典力学和量子力学的信条,一个物理量同哈密顿量之间的量子对易式为零,则该物理量为守恒量。考察一个自由电子的角动量算符 。可计算其任一分量同哈密顿量之间的对易式,得 ;可见   ,结论是自由电子的角动量不守恒。这是怎么会事,一个自由的电子怎么可能角动量不守恒呢?


若假设电子具有大小为 ℏ/2 的内禀角动量, 自旋角动量矢量为 ,则电子的总角动量为 J=L+S 。考察 S 的任意分量随时间的变化,发现  。这样,我们得到了  ,即算符 J=L+S 是守恒的。也就是说,若我们认定一个自由的电子其角动量应该是守恒的,那它就应该除了轨道角动量 以外,还有个自旋角动量 这就是人们常说的电子具有内禀角动量 ,或者说电子是自旋 ℏ/2 的粒子。狄拉克方程自然而然要求电子具有 ℏ/2 的自旋。


3.2. 正电子的预言与发现▲▲▲

狄拉克方程 中的波函数是四分量的。解狄拉克方程,会发现有负能量解(旋量,spinor),能量本征值为  。在经典力学中,负能量解或者其它不合理的解可以随手扔掉,但是在量子力学的语境中这样做是不可以的。量子力学方程所有的解都是一个完备空间里的矢量。有必要为负能解找到一个让人能够接受的诠释。


1929年狄拉克认为空间的真空态可看作是负能态电子充满的海。一个负能态的电子跃迁到正能量状态,会在负能态海中留下一个空穴。负能态电子激发后留下的空穴在电磁场下的行为类似是带正电的。空穴的概念是拿重原子的电离过程作类比得来的。因为那时候已知的带正电荷的粒子只有质子,狄拉克认为质子就是负能态电子海的空穴,但这遭到了奥本海默的反对。如果质子是电子负能海里的空穴的话,那氢原子会迅速自我毁灭。此外,狄拉克方程里只有一个质量,但是电子和质子质量完全不同,相差1836倍。1931年,狄拉克修正了此前的诠释,认为存在反电子(anti-electron),其与电子的质量相同但电荷相反,和电子接近会湮灭。这个念头十分荒唐,但好物理学只怕懂物理的物理学家荒唐得不够。


狄拉克在1931年抛出了存在正电子的念头,1932年8月2日安德森(Carl David Anderson,1905-1991)就宣称他发现了正电子,并因此获得了1936年的诺贝尔物理学奖。安德森研究宇宙射线,他在一张拍摄到的气泡室照片上发现了同时出现的、方向相反但弯曲程度差不多的粒子径迹。磁场下带电粒子轨迹的曲率半径由粒子的荷质比 q/m 所决定,反向的、半径大约相同的轨迹意味着粒子具有相反的电荷和相同的质量。此后,安德森又用由放射性核衰变而来的γ射线照射物质,也产生了电子-正电子对,从而获得了存在与电子质量相等、电荷相反之粒子的确凿证据。安德森1932年的宇宙射线经过气泡室后可观察到正电子的实验照片不易直观地得出存在正电子的结论,这里笔者选用γ射线产生电子-正电子对的过程,以便读者见识到更有说服力的直观证据。图1的照片中可见一个‘个’字形的线条,这里是γ射线-原子核碰撞的发生处,中间的那根线差不多是直直地延伸出去的,这是作反冲运动的原子核留下的径迹。在碰撞的发生处出现了两个螺旋,两个螺旋向相反方向展开,且弯曲程度差不多,表明确实是由具有差不多大小但相反之荷质比的带电粒子造成的,这算是证明了确实存在正电子。据信斯科贝尔钦(Dmitri Vladimirovich Skobeltsyn,1892-1990)1929年用云室探测宇宙线中的γ射线时就注意到了有和电子弯折方向相反的粒子,但只是被当作某种未知的带正电的粒子而已。赵忠尧先生(1902-1998)1929年在研究γ射线被铅散射的过程时,也记录到了产生电子-正电子对的过程。因为没有狄拉克的疯狂思想,这些实验结果的重大意义没有被破解。安德森的观测结果生逢其时。

 

图1. 美国Lawrence-Berkeley 国家实验室拍摄的一张γ光子经原子核散射产生电子-正电子对的过程。入射的高能γ光子是不可见的。中间划过大半个画面的一条线是原子核反冲留下的径迹,两个螺线是电子和正电子在磁场下反向旋转所留下的径迹。尖劈状的两条线是由更高能量γ光子产生的电子-正电子对径迹的一部分。


3.3 正电子发现的意义▲▲▲

正电子的发现是狄拉克方程正确性的一个证据,确立了存在反粒子的事实。反粒子的概念后来被扩展到所有粒子,比如有反质子、反光子、反中子等等。质子和电子的情形一样,反质子与质子的质量相同但电荷相反,反质子的电荷为负。中子不带电,反中子与中子的质量相同且也不带电荷,它们的区别在于别的量子数上。中子的重子数(baryon number)为1,反中子的重子数为-1。反质子和反中子分别于1955年和1956年被发现。至于光子,光子无质量、无电荷,如何反?理论认为光子是它自身的反粒子。由反粒子进一步引出了反物质(antimatter)的概念—由一个正电子和反质子组成的原子就是一个反氢原子。目前,人们已经能在实验室里制备出反氢原子,寿命超过了1000秒。反粒子概念的提出,开启了人类认识基本粒子的大门,有兴趣的读者可以多修习一些粒子物理的内容。


正电子的发现,以及正电子-电子湮灭过程,比如 e++e-→2γ ,将狭义相对论得出的质能关系放到了极限意义上去理解。从原子核的裂变过程,或者原子发射光子的过程,人们得出的质能关系为 ΔE=Δmc2 ,即过程中获得的额外能量 ΔE与过程造成的质量亏损(deficit)Δm 之间有量化的关系 ΔE=Δmc2 。笔者以为,等到确立了类似 e++e-→2γ 这样的过程,人们才可以确切地说质量可以完全转化为能量,或者说质量为 m 的静止粒子携带能量 mc2 。当然,电子-正电子湮灭的产物不只有光子,根据能量的不同,这个湮灭过程还可以产生别的粒子,如中微子、 粒子对、希格斯玻色子,等等。这让通过高能电子-正电子碰撞获得新粒子成为可能。顺便说一句,e++e-→2γ 这样的湮灭过程提供了原子中电子跃迁之外的另一种发光机理。


从前人们熟悉光的吸收这个自然过程,因此认为光子是倏逝的(evanescent)。电子-正电子湮灭过程让人们认识到电子这样的基本粒子也是倏逝的。等到1932年费米建议质子也是可以摧毁的,则所有构成物质的粒子都是倏逝的。粒子不是永恒的,可以产生和湮灭,这为量子场论的诞生准备了心理基础。


反粒子的发现,也带来了更多的困惑。同样一组方程描述的粒子,为什么电子那么多而正电子却那么少甚至要借助专门的过程制备?为什么电子寿命很长而正电子是短寿的?当然了,短寿命更是反物质的特征。氢原子几乎是永恒的,而由正电子和反质子组成的反氢原子,人们千辛万苦才将其寿命维持到1000秒的水平。这些问题,目前尚没有令人信服的答案。 


3.4狄拉克方程的曲线坐标形式▲▲▲

狄拉克方程可以用Vierbein(2)场和引力自旋联络推广到弯曲时空。Vierbein 定义局域的静止参考框架,可以让常数狄拉克矩阵作用到每一个时空点上。所谓的Vierbein这样理解,在相对论的tetrad(局域定义的四个线性独立的矢量场)表示中,一个tetrad 基可取为  ,在任意时空点上张开四维的切空间,其中的就是Vierbein。注意, ,所以可由关系是  来理解Vierbein。利用Vierbein,弯曲时空中的狄拉克方程可表为  的形式,其中 Dμ 是费密子场的协变导数  ,而 是自旋联络的分量。这些内容,读者在熟悉广义相对论后回过头来会有更深刻的理解。


4

相对论量子力学方程的一般构造


构造(狭义)相对论量子力学的一般途径可以从对称性考虑着手。任何庞加莱协变表述的量子力学都是相对论量子力学。在保持时间方向不变的洛伦兹变换下,时空变换为 (x,t)→∧(x,t),相应地,波函数变换形式为  , 其中 D∧ 是洛伦兹群的一个表示, 为一  (2s+1)×(2s+1) 的方阵,而波函数 Ψσ 有 (2s+1) 个分量。从洛伦兹群的表示出发,可以构造针对任何自旋粒子的相对论波动方程。这样,构造相对论量子力学的任务也随之变成研究洛伦兹群的表示问题了。


前述的克莱因-戈登方程和狄拉克方程都是洛伦兹不变的,其解分别作为洛伦兹标量(对应(0,0)表示)或者二旋量(bispinor) (对应 )在洛伦兹群下进行变换。以此观点,则电磁场方程也可看作是相对论波动方程,其解根据洛伦兹群的  表示变换。


5

量子场论


狄拉克方程和克莱因-戈登方程,若只当作是单粒子的相对论量子力学方程,有许多待协调的地方。克莱因-戈登方程有仿照薛定谔方程定义的几率密度非正定(在相对论场论中被诠释为电荷)的问题。狄拉克方程预言了反粒子,侥幸解释了负能量的问题和电子的自旋,但是无自旋的粒子也有反粒子,比如 W+ π+ 粒子都有反粒子。存在反粒子是相对论和量子力学结合的结果。狄拉克的空穴图像对解释这个事实无能为力,因为无自旋的粒子不遵循不相容原理,这些粒子的负能级即便被占据了也不能阻碍别的粒子继续占据它。此外,狄拉克方程预言了反电子的存在,而电子-反电子相遇会发生湮灭,由此看来很难说狄拉克方程是单电子的量子力学方程。从这些视角返过头去看看麦克斯韦理论,麦克斯韦理论也该算是关于光子产生和湮灭的理论。这些不易协调的地方,都呼唤一种新的理论,其将粒子的湮灭和产生当作基本过程处理。相对论和量子力学的完全协调就需要这样的一门崭新理论—量子场论。在量子场论中,狄拉克方程的负能解和反粒子伴随的问题都有了自然的解释。在量子场论中,狄拉克方程的正能解乘上湮灭电子的算符,故正能量是湮灭电子过程得到的能量,而负能量解乘上正电子产生算符,负能量是产生正电子产生过程需要借用的能量。


量子场论的提出,在二十世纪四十年代之后结出了硕果。依据量子场论的思想,人们相继构造了量子电动力学和量子色动力学。那是一条通向更多发现的路。


本文取自曹则贤著《相对论-少年版》,科学出版社,2019


注释

(1)俄罗斯科学家Yuri Manin说:“为什么c=1呢, 因为它就等于1。” 

(2)相对论关切的是4维的时空,为一赝黎曼空间。四字就经常出现。此处出现的Vierbein,德语,四条腿,和Tetrad, 拉丁语,四重,都是冲着四维时空而来的概念。


参考文献

[1] P. A. M. Dirac, The quantum theory of the electron, Proceedings of the Royal Society A. 117 (778), 610–624(1928). 

[2] Armin Wachter, Relativistic quantum mechanics, Springer 2011

[3] Walter Greiner, Relativistic Quantum Mechanics:Wave Equations (3rd ed.), Springer Verlag (2000).

[4] P. A. M. Dirac, Quantised Singularities in the Quantum Field,Proceedings of the Royal Society A 133 (821), 60–72(1931).

[5] Frank Wilczek, Quantum field theory, Reviews of Modern Physics 71(2), S85-S95(1999).

特 别 提 示

1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。

2. 『返朴』开通了按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。


版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。



相关阅读

1  为什么说静止质量和运动质量的说法是错的——兼论相对论4-矢量形式表述 | 贤说八道

2  相对论质能关系的由来 | 贤说八道

3  整体相对论 | 贤说八道

4  相对论英雄谱 | 贤说八道

5  数理史上的绝妙证明:电子自旋是相对论性质 | 贤说八道


近期热门

1  嫌高考物理难?你就不怕娃儿成废柴?| 贤说八道

2  如何理解数学?从纠正对数学的偏见开始——得数学者得天下

3  科研路上多坎坷?三代女科学家现身说法!

4  一座物理诺奖矿是如何变成高考烂题的?| 贤说八道

5  文小刚:物理学的新革命——凝聚态物理中的近代数学 | 众妙之门


长按二维码关注「返朴」,查看更多历史文章

点“在看”,分享给朋友吧!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存