掌控所有运动规律的原理:最小作用量原理
The following article is from 中科院物理所 Author Afiq Hatta
点击上方蓝字“返朴”进入主页,可关注查阅往期文章
翻译 | Nothing
审校 | Zhenni
拉格朗日量(Lagrangians,简称为拉氏量)是一种数学表达式,它包含了一个物理系统中几乎所有我们关注的信息。拉氏量通常具有对称性,这意味着当我们以某种特定方式转动或移动它们时,它们并不会发生改变。对称性和拉氏量非常重要,因为我们可以利用它们构造守恒量。
守恒量是在整个物理系统演化过程中保持不变的可观测物理量。
物理学家喜欢寻找守恒量,因为它们不仅具有深刻的哲学意义,还在解方程过程中非常有用。当你知道有些量保持不变时,用它们可以简化方程的求解。
旋转这样 “平滑”的对称性是连续对称性。诺特定理表明,对于每一个连续对称性,我们都可以构造一个守恒量。例如,如果一个系统具有旋转对称性,我们就可以得到角动量守恒。
更令人惊讶的是,诺特定理可以证明能量守恒是时间平移对称性的结果,时间平移不变性意味着拉氏量本身不显含时间。
换句话说,如果物理系统所处的背景不随时间改变,那么该系统的总能量将不随时间改变。
By Konrad Jacobs, Erlangen — CC BY-SA 2.0 de
对称性的概念在力学、经典和现代物理学中随处可见。例如,在量子物理学中,量子力学系统的对称性可以与量子角动量守恒对应。在电子理论中,电子的电荷和自旋守恒源于电子所遵循的对称性。
用数学如何详细描述对称性起的作用?首先,需要解释最小作用量原理,以及如果我们知道了拉氏量,我们如何用它来计算场的行为。
作用量和拉氏量
假设有一个粒子或场,在两个预先确定的时间点 t1 和 t2 之间演化。如果它是一个粒子,我们可以通过绘制一条在空间中延伸的路径来描绘粒子的演化过程,从时间 t1 开始,到时间 t2 结束。如果它是一个场,我们可以想象一个热力图随着时间慢慢演化。
通过这些粒子和场的行为,我们能知道些什么?我们怎么才能知道粒子将走什么路径?在物理学中,我们从一个可以描述物理系统的模型开始,其中典型的一种是拉氏量。拉氏量是一个数学量,它通常写成动能和势能之差,拉氏量在任何时间点都可以给出一个具体的数。我们之所以喜欢用拉氏量是因为它独立于观察者,不随参考系的改变而改变。
观察者是正立的还是倒立的,或者以接近光速的速度移动,这些都不重要。通常,物理量的数值会因坐标选择的不同而不同;然而,拉氏量不随坐标的选择而改变,无论对于哪个观测者,它的取值都是一样的。和参考系无关的这种性质是非常有用的,因为它让我们可以进行清清楚楚的计算。
为了理解到底发生了什么,我们需要构造一个称为作用量(action)的量。例如,如果已知一个拉氏量,我们可以计算拉氏量在两个时间点之间的积分:
积分意味着将拉氏量在多个时间点上的值进行相加。从 t1 到 t2 之间的总积分被称为作用量。它通常用大写字母 S 表示。拉氏量前面的竖直曲线 ∫ 表示积分。
上面的表达式是作用量的数学定义。拉氏量通常是位置和位置的一阶导数的函数。希腊字母 φ 表示粒子在空间中的位置;第二项 ∂φ 是粒子位置的一阶导数,表示粒子位置随时间的变化率。
拉氏量在几何上看起来是怎么样的?我们可以用一些插图来说明,通过这些插图可以了解关于它的一般概念。如果拉氏量只包含自由空间中的动能,对于不同于直线的路径,往往会得到更大的作用量。该图显示了粒子在时间 t1 和 t2 之间采取不同路径对应的作用量大小。正如您所看到的,最复杂的路径作用量最大。作用量最小的路径就是直线路径。
如何得出物理规律?
在我们眼中,拉氏量是数学对象,我们只把作用量看作是物理的。这有一个哲学上的原因。结果表明,不同的拉氏量可以产生相同的作用量。所以,在某些情况下,存在两个拉氏量,但只有一个作用量的情况。这意味着我们可以通过两个不同的拉氏量,得出相同的物理定律。
为什么会这样?原因是,当我们对某些被称为“全微分”(total derivative)的数学表达式进行积分时,积分结果是零。
在下面的公式中,我们有一个作用量,被写成一个特定的拉氏量和一个全微分项。但是,我们可以把积分拆分成两个不同的部分。一旦我们把它分开,我们就消掉了全微分项,因为当我们积分时它变成了零。
这是一件令人兴奋的事情!这意味着,存在两个不同的拉氏量,在一个不那么严格的限制下,可以认为它们是“等价”的。我们不需要让它们完全等价就能得出相同的物理现象。如果拉氏量仅在“全微分”项上存在差异,则它们可以被看作是相互等价的。例如,在下图中,函数 f 、 g 和 h 都与全微分项有关,它们三个产生相同的作用量。(我已经用不同的颜色写出了这三个函数来表达这个观点。)
数学上,我们可以用下面的表达式来表达拉氏量之间“等价”,尽管它们之间相差一个全微分项。在下面的表达式中,函数 f 是可微函数。
如果对函数可以使用“变化率”的概念,那么这个函数就是可微的。如果函数值在某些地方发生跳跃、出现尖锐的拐点或没有良定义,那么就有可能不能使用“变化率”的概念,这种情况下,只有许多严格的数学条件被满足时,“变化率”的概念才变得可以接受。所有可微函数的集合为 C¹ 。关于微分和积分等运算是否具有良定义的研究称为数学分析,是一个令人着迷的研究领域。
欧拉-拉格朗日公式
“最小作用量原理”告诉我们,场或粒子的行为正是使作用量取极小值的行为。所以如果我们知道这个作用量,我们可以通过一些数学运算,求出使这个作用量取极小值时场的行为。有一个被称为变分法的数学分支,研究的是“函数的变化率”。(译者注:变分法告诉我们,场或粒子的行为可以用欧拉-拉格朗日方程导出。)
粒子版的欧拉-拉格朗日方程如下所示。方程左边,我们首先取拉氏量对速度的偏导数,然后继续对其求时间的导数。方程右边,我们对拉氏量在空间中进行求导。然后让方程的左边等于右边,就可以得到一个令作用量取最小值的路径。
场论版的欧拉-拉格朗日方程和粒子版的很相似,方程如下所示:
它可以给出场在时空中的演化方式。
以下为译者注:
守恒量
前面我们介绍可以用对称性导出守恒量,接下来我们将介绍如何做到这一点。诺特定理告诉我们,每个对称性对应一个守恒量。
如果物理系统具有时间平移不变性,也就是说拉氏量不显含时间,那么可以得到表达式:
等式左侧的括号里就是能量,它随时间的导数是零恰恰表明它不随时间改变。
如果物理系统具有空间平移不变性,也就是说拉氏量不显含空间坐标,那么可以得到表达式:
等式左侧括号内正是动量,它不随时间改变,这就是动量守恒。
本文经授权转载自微信公众号“中科院物理所”。
原文链接:
https://www.cantorsparadise.com/noethers-theorem-and-the-principle-of-least-action-c84b789c51b6相关阅读
2 为什么说静止质量和运动质量的说法是错的——兼论相对论4-矢量形式表述 | 贤说八道
近期推荐
1 颜宁学生畅谈:读博想放弃怎么办?毕业后的路怎么选?| 女科学家去哪了
2 “男女完全一致”不叫公平,职场宝妈要勇敢争取权益 | 女科学家去哪了
4 黑体辐射公式的多种推导及其在近代物理构建中的意义(一) | 贤说八道
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
↓↓返朴书单,点击购买↓↓
长按下方图片关注「返朴」,查看更多历史文章