查看原文
其他

论 Heaviside 算子法的合理性

The following article is from 和乐数学 Author 林开亮

作者 | 林开亮、王兢

摘要: 本文可视为《求解常系数线性微分方程和差分方程的代数方法》[1]的续篇。文[1]通过分析解非齐次常系数线性微分方程的Heaviside算子法的代数本质,提出了一种纯代数的求解方法,即将问题归结为多项式同余方程,进而用更简便的秦九韶“求一术”直接求解。本文说明,Heaviside算子法的本质可理解为,以一种超越的手法(借助形式幂级数)求解多项式同余方程(见算法3)。

关键词: 求一术; 算子法; 微分方程; 同余方程; 形式幂级数.

(在公众号中回复 算子 可下载本文PDF文档)

回顾

如[1]所述,我们可将常系数线性微分/差分方程的求解,归结为一个多项式同余方程,而后者可以用秦九韶的“求一术”来求解。作为回顾,我们仍然选取彭罗斯(Rogers Penrose)在其数学物理通俗名著《通往实在之路》[2 pp. 493–494]中给出的例子。

问题1. 求微分方程

一个特解

解. 通过引入微分算子

方程 可以写成

于是对 式两边施以算子

并注意到 阶以上的导数都等于 , 就有

这个巧妙的方法称为算子法(operational calculus method),归功于英国自学成才的数学家、物理学家、电气工程师亥维赛(Oliver Heaviside,1850–1925)。

Oliver Heaviside

亥维赛当初提出这个方法,一度遭到数学家的拒绝,因为它不太严格。比如,上述解法中其实隐含地使用了以下算子等式(参见(4)式)

如果将 替换为一个模长小于1的复数 ,那么上式毫无问题(这无非就是几何级数公式);可是现在 是一个算子,右边的无穷级数的含义是要考虑的。 亥维赛本人当然了解这些,不过他对严格化的问题并不感兴趣。从他的下述辩护可以看出,物理学家或工程师与数学家有不同的价值观(引自网页[1]):

有两种数学, 严格的(Rigorous)与物理的(Physical). 前一种数学很狭窄(Narrow), 后一种数学大胆而宽阔(Bold and Broad). 若非要停下来表述严格的证明,大多数的物理化数学进展(physico-mathematical inquiries)也将停下来。难道只是因为我不完全理解消化的机制,我就要绝食吗?

后来,数学家用其他途径将Heaviside算子法严格化,其中最典型的一种方案是用Laplace变换(有点难)。

在[1]中,我们指出,其实上述Heaviside解法之核心在于,在(5)所给出的一连串等式中,我们真正需要的,是其中第三个

其中的算子多项式 恰好满足多项式同余方程

这个关键性质,使得(6)所给出函数恰好满足(3)。我们验证如下:

从这个观察出发,我们可以得到求解右边是 次多项式 (从而可以被 零化)的常系数线性微分方程

的特解的一个算法,叙述如下:

算法1. 给定微分方程 ,其中 是微分算子 的复(实)系数多项式, 次复(实)系数多项式, 是未知函数。则可按以下步骤求出 的一个特解

  • 用秦九韶“求一术”求出多项式同余方程

的一个解

  • 并化简,即得 的一个特解。

为完整起见,我们再将[1]中介绍的求解多项式同余方程

秦九韶“求一术”完善如下:

算法 2 给定同余方程 ,其中 是域 上的多项式,且 不是常数, 是未知多项式。则可按以下步骤求解方程 。首先写出

然后对第一列的两个多项式用带余除法(用次数高的多项式除以次数低的),设得到的商为 ,则次数高的那一行减去次数低的那一行对应元素的 倍;于是新得到的矩阵的第一列两个元素替换为第一次带余除法的除式与余式,重复之前的操作(第一列两个元素辗转相除决定出各个行变换),直到第一列某个数变成常数 (算法结束),此时有下述结论:

  • 同余方程 有解当且仅当 ;

  • 时,用 右边的多项式除以 ,就给出方程 的一个解

该算法可以通过推广[1]的证明得到, 并且从中可以看出: 当且仅当 互素, 从而这是同余方程 可解的充要条件。而当 时, 与 同列的那个多项式是 的最大公因子。

例 1. 用秦九韶“求一术”求解同余方程

解:

[文字解释:对矩阵 的第一列的两个元素做带余除法,有 ,从而对矩阵 做初等行变换:第二行()减去第一行()的 倍,于是得到第二个矩阵。]

现在第一列已经出现了非零常数 ,于是方程有解

注意,例1给出的结果与(7)式吻合。这就给出了一种新的途径直接得到(6),从而回避了连等式(5)中第二行所涉及的无穷级数(4)。

从某种意义上说,我们在[1]中的观点,是以秦九韶的立场来看Heaviside,剥掉其不严格的分析皮相,直取其代数灵魂。这对习惯了代数(或数论)的读者来说是容易理解的,不过它没有说明Heaviside算子法为什么行得通——因为它本质上是以秦九韶朴素的代数取代了Heaviside绚丽的分析。

接下来我们设想,如果Heaviside本人看到我们的上述处理,他可能会如何重新解释他的工作。可以想见,他不大可能容忍我们将他那自然而天才的想法(见(5)式)直接抹去,那是要化作永恒的灵光一闪。

我的思想被一道闪电击中,愿望便在那一闪中得到满足。

但丁(A. Dante, 1265–1321), 《乐园》第33章

对Heaviside工作的重新解释

基于我们前面的理解,Heaviside算子法之所以成功,在于它以一种神奇的方式求解了多项式同余方程(9)

例如,在问题1中,Heaviside算子法最核心的地方在于,求出了同余方程(11),即

其绝妙之处在于,Heaviside是用一种超越(相对于代数)的手法求出来的(参见(4)式):

问题在于,上述做法现在看来仍然是形式的,我们还要说明它的合理性。而解决问题的关键,恰恰就在"形式"二字:我们要将(12)式中的幂级数

理解为形式幂级数(formal power series)。

为突出这里的幂级数是形式幂级数(以区别于通常的函数幂级数),我们将通常表示变量的 换成表示"未定元"的 (根据 Bourbaki 的历史注记,在1882年,德国数学家 Kronecker 就完全清楚了"未定元" 只是其代数的一个基元而不是分析意义下的变量。 此前 GaussGalois 也有此认识。),正如我们在以形式的观点考察多项式时所做的那样。我们通常将域 上的多项式全体记为 ,而将 上的形式幂级数全体记为 ,其中的元素形如

一样, 中的形式幂级数也有加法、乘法,并满足通常的运算法则(如分配律),用代数的术语来说,它们都是(ring)。加法的定义是显然的,而乘法的定义如同多项式那样,即通过分配律相乘再合并同次项得到。

按照这个定义,不难验证,在 中成立以下等式:

由此不难推出,在 中,也有

这就是(13)式的等价表述。

根据(16)式,我们可以推出(12)式的结论:在多项式环 中成立

原因如下:

是形式幂级数

的前 项截断(头部), 是其余项(尾部)。我们有

代入(16)式,有

根据分配律就有

注意到

代入上式就有

注意到这实际上是多项式环 中的等式,并且由此立即得到(17)式。

在上面的分析中,我们用到了 的显示表达式,即(16),但其实这是完全可以避免的。本质上,我们只需要用到尾部 具有形式 的定性事实(其中 )。从而有

由于现在 ,上式是 中成立的等式,为得到 中的一个等式,我们只需要将等式两边同时取前7项截断(注意等式左边是一个6次多项式)。这就得到

其中 的常数项。由此得到 中的一个等式,从而得到(17)式。

推广上述分析就可以证明了第一节所介绍的亥维赛算子法的合理性。作为秦九韶“求一术”的对比,我们也将这个结论提炼成一个算法。

算法 3 (“形式幂级数”法解同余方程). 给定同余方程

其中 是非常数的多项式且 是未知多项式。则可按以下步骤求出方程的一个解。

  • 根据定义用“待定系数法”求出 中的逆 的前 项,记为 ,即
  • ,则 的一个解。

是形式幂级数 可逆的充要条件。因此算法中的条件 保证了多项式 中可逆。而且,其逆可以用待定系数法求出,这只需要解一连串的一元一次方程。

证明:根据定义我们有

注意 ,代入上式并展开就有

移项就有

的次数为 ,则等式左边是一个次数不超过 次的多项式,对上式两边同时取前 项截断,就得到

其中 的前 项截断。进而根据多项式同余的定义,我们有

如果用上述“形式幂级数法”代替算法1中的秦九韶“求一术”(即算法2),那么新得到的算法就可以解释 Heaviside 算子法的合理性了。不过,在求解时,我们并不需要用到形式幂级数逆的完整表达式

而只需要算出其前 项截断

而这本质上只需要依次求解6个一元一次方程,得出各个系数。

可以想见,作为工程师的Heaviside不会认同我们将他的天才方法解释为求解一系列的一元一次方程。他根本就是利用了逆的整个表达式,如(19)。那么他是如何得到诸如此类的形式幂级数表达式的呢?也许,一个合乎情理的解释是:Heaviside没有区分形式幂级数等式(19)与函数幂级数等式

其中 暂且视为一个模长小于1的数。

那么问题来了:Heaviside不作区分是不是合理的呢?更具体地说,是不是一个函数幂级数等式(如(20))自然就蕴含了一个相应的形式幂级数等式(如(19))?

令人惊讶的是,回答是肯定的。而且,颇让人意外的是,这个事实曾被广泛应用,但我没能找到一个正式的表述。这里我们引用MIT数学教授Richard Stanley 在其名著《计数组合学》第一卷[3, p.6]中的说法:

例 1.15 对一个一般原理(general principle)给出了一个简单的示例。不正式地说(informally speaking), 这个一般原理断言:如果我们有一个关于幂级数的等式,当它作为函数(从而变量是模长充分小的复数)时成立,那么当这个等式作为形式幂级数的等式仍然成立,只要等式中用到的运算对形式幂级数都有定义。对我们来说,此处给出这个原理的一个精确形式(precise form)将是不必要的一般化(pandetic),因为读者在任何特殊情形下检验我们对幂级数的操作的形式有效性方面将不会有困难。我们将用贯穿本节的几个例子诠释这个观点(contention)。

Stanley这里提到的例1.15是(15)式的下述推广:

Stanley接下来提到的诸多例子中,有两个值得了解。

例 2. 中成立以下等式

其函数化身是我们熟悉的指数函数等式

例 3. 套用二项展开式,我们可以对复参数 定义复数域 上的形式幂级数

其中 . 注意当 是自然数时, 是多项式。特别地,对 . 而对 ,有

幂函数等式

可以给出形式幂级数等式

注意,在(24)中令 就得到

这只是(15)式的一个变形。

利用形式幂级数(23)的一个推广,原则上我们可以给出多项式同余方程(18)

的一个公式解。为此,我们只要利用下述定义。

对满足 (实际上,只要 ,以及复数 ,令

值得注意的是,当 时,(26)对任意域 上的满足条件 的幂级数 都有定义,并且此时公式简化为

据此,我们可以给出同余方程(18)的一个公式解。

若同余方程(18)中的多项式 满足 ,不失一般性,可以假设 ,从而 可以写成这样的形式

其中 且显然有 ,于是根据定义(26),就有

结合算法3,我们可以给出以下结论:

定理 1. 是常数项等于 的多项式,则同余方程 (18)

的一个解 可以通过取多项式:

项截断得到

这意味着,具体计算时, 的展开式中只要取次数小于 的项。

例 4. 求解多项式同余方程

根据定理 ,现在 ,从而

其中 表示次数大于或等于 的项。 于是同余方程 的一个解为

平行于问题1,利用上述结果我们可以求出微分方程

的一个特解,其中 是任意一个5次多项式,比如 。为此,只要令

其实我们有更简单的方法求(30)的一个特解。

只要注意到 ,从而若令 ,则 只需 满足方程

对于一个5次多项式 ,以上方程显然有解

从而方程(30)有解

这与之前得到的解(31)一致。

不难看出,类似的技巧可用于求下述方程

(其中 是常数, 是多项式)的一个特解。

多元版本:PDE的Heaviside算子法

陈清祥教授等在2007年应用类似的想法[4, p.21]研究过一类特殊的偏微分方程(形如, 其中是Laplace算子的一元多项式,满足),我们指出,其实可以应用多元形式幂级数将关于求解常微分方程特解的幂级数方法推广到偏微分方程。

注意到多元函数也有Taylor展开,这就建议我们推演PDE(Partial Differential Equations, 偏微分方程)的Heaviside算子法。作为ODE(Ordinary Differential Equations, 常微分方程)(8)的多元类比,我们考虑PDE

其中都是元多项式, 是待求的多元函数。例如在非常典型的情况 可以是Laplace算子(), 波动算子()或热算子()。不过,我们所考虑的要满足一个性质

以确保与对应的多元形式幂级数可逆。

现在我们将算法3的多元版本叙述如下:

算法 4是域上的元多项式,且满足,则中可逆,且它在中的逆可以如下给出:令

并且,对任意的正整数,对取前项截断得到的多项式

具有性质

其中表示次数大于或等于的项。

证明:只有(37)式需要证明。 令

则在中成立

的次数为,则 的次数不超过,将上式两边投影到次数不超过的多项式子空间,就有中成立的等式

其中的投影,显然的各项取自

而该表达式中的每一项次数都大于或等于(因为的每一项的次数大于或等于)。于是就有

根据算法4,可以得到求解 PDE (32)的下述定理:

定理 2 给定 PDE (32)

其中满足次实系数多项式. 则 的一个特解可以如下给出:

其中给出. 在 的假定下,可以表示为

其中中除了常数项的其它部分。

证明:在(37)式中令, 并作用在上,就有

注意的次数为,从而一定被次数大于或等于的微分多项式零化,于是,从而上式化简为

这表明满足方程(32).

现在若在,则

注意的每一项次数都不小于,从而论证如前。

注:以上证明的后半段(见等式(40))给出定理2的一个不依赖于形式幂级数的独立证明(这个证明源于[4])。此外,如前,具体计算(36)时,只需求出各个展开式中次数小于的项。

正如ODE(8)的情况,这个方法可以推广到右边的“源”为指数函数乘以多项式的形式,此时我们只需应用\emph{指数平移定理}([1]引理2)的下述多元版本:

引理 1元多项式,维实向量,则对中的任意光滑函数

其中中的内积。

此时,在变量替换下,方程

可以化简为

为多项式且时,这可由定理2解决。

整数同余方程的幂级数解法

现在对于多项式同余方程(18)

我们有两种解法,一种是秦九韶“求一术”(算法2),一种是形式幂级数解法(算法3)。回想起秦九韶“求一术”原本是求解整数同余方程

自然地,我们要问,对这类整数同余方程,是否也有平行于算法3的解法呢?回答是肯定的,不过正如我们在算法3中为求解多项式环 中的同余方程(18)需要深入到更广阔的形式幂级数环 ,为了在整数环 中求解形如

的同余方程,我们也需要进入一个更广阔的天地,那就是 -进整数(-adic integers)的世界。在历史上,德国数学家亨泽尔(Kurt Hensel, 1861–1941)正是通过与形式幂级数类比(这是一个伟大类比中的一部分,推而广之,是 Langlands纲领),在1897年引入了 -进整数。粗略地说,一个 -进整数与形式幂级数(14)类似:

其中

注意到若取有限和,就得到正整数。所有的 -进整数构成一个环,记为 。注意,其中的加法与乘法比形式幂级数要复杂一些,因为涉及"进位"。然而,一个平行于(15)的基本关系式在 中仍然成立:

据此可以说明,同余方程

的一个解是 。 事实上,我们只需要取截断就有:

推而演之,我们有一套平行于形式幂级数的理论。特别地,也有算法3与定理1的平行结果。鉴于笔者也是门外汉,我们就不详细展开。对 -进数有兴趣的读者,可阅读专门的著作。

我们乐于跟读者分享日本数学家加藤和也、黑川信重、斋藤毅在《 数论1:Fermat的梦想》[5 pp.58–59]中对这个奇妙的 -进数世界的感知(恐怕你难得在数学书中读到如此富有诗意的文字,三位作者莫非是"来自星星的你"?):

-进数最初由亨泽尔在1900年左右引进。在数学的历史长河中,一个数就是指一个实数,只是在不久以前我们才意识到存在一个-进数的世界。 这就好比一个只是在白天仰望天空的人突然看到了星光闪耀的夜空。-进数与实数的数学风景截然不同。 就好比是夜空的一颗星星,-进数散发出“素数 的光辉”。我们白天无法看到它,是因为太阳——或者说实数——喷发着“实数的光亮”。正如夜空中有数不尽的点点繁星,对每个素数,都有一个-进数的星球。 每颗星星之于太阳,就正如每个-进数世界之于实数世界。正如在夜晚我们可以对遥远天空中的物体看得更清楚,透过-进数,我们开始看到广袤深邃的数学宇宙。}

据说,德国数学家Helmut Hasse (1898–1979)正是在逛书店时偶然发现了亨泽尔的一本数论书,为其中所介绍 -进数而着迷,从而决定追随亨泽尔学习,最终成为一位大数学家。特别值得一提的是,1920年10月,22岁的Hasse发现了著名的“局部–整体原则”(local–global principle),这成为他次年提交的博士论文主题。今年恰好是Hasse原理诞辰100周年。

Kurt Hensel
Helmut Hasse

形式幂级数的世界

也许,比 -进数的世界更好理解的,是形式幂级数的世界。但即便是在这个更加熟悉的世界,也极少有人能够在其中游刃有余。一个显著的例外,是100年前英年早逝的印度数学家 Ramanujan(1887–1920)

Ramanujan

他的合作者、英国数学家 G. H. Hardy曾写道[6]:

最令人惊奇的是,他[Ramanujan]对于代数公式、无穷级数变换的洞察力。在这方面,我敢说我从未遇到与他旗鼓相当的人,我只能将Euler或Jacobi与他媲美......

Hardy还说:“Ramanujan是他那个时代中最伟大的形式主义者(formalist)。”也许 Heaviside 可以视为 Ramanujan的先驱。Ramanujan 被誉为“The man who knew infinity”(这是关于他的一部传记的书名,中文版《知无涯者》),我们可以追问:百年以后,“The men who followed Ramanujan” 都有谁?

这颗“勇敢的心”是不是让你想到了什么?

结语

无论如何,这都是一件很奇妙的事情,形式幂级数的世界与函数幂级数的世界之间好像有一面魔镜。更奇妙的是,大多数人可能都没有意识到,自己一直待在 的世界里,而从未注意到镜中还有 的世界。

P.S. 想起一件小事,从前用的高等代数教材,有一章标题叫 -矩阵,也许改成 -矩阵会与第一章的多项式观念更统一。

致谢

感谢美国密西西比大学丁玖教授指引文献[4] 并启发作者(尤其是定理 1 与定理 2 的推导可以避开形式幂级数),感谢华东师范大学刘治国教授分享他对 Richard Stanley 所提及关于形式幂级数与函数幂级数的一般原理的评论,感谢首都师范大学李克正教授、南京大学朱富海教授、北京市朝阳区教育研究中心张浩博士、天津大学刘云朋教授、中国矿业大学张汉雄教授、中国传媒大学陈见柯教授、东南大学丘成桐中心张超博士、上海交通大学李吉有教授、渭南师范学院赵教练教授、复旦大学邵美悦教授、西北农林科技大学杨变霞教授对初稿提出宝贵建议。邵美悦教授提醒作者从观念上简化了对算法3的分析与证明,特别地,他强调对幂级数取截断可以视为一个从幂级数环到给一个多项式子空间的投影算子。李克正教授与张超博士对算法3给出了基于完备局部环理论的理解,张浩博士则对它给出了一个基于商环、同态等抽象代数基本概念的证明。

感谢MIT数学教授 Richard Stanley 就我所关心的那个一般原理的文献给出详尽答复,这里与读者分享如下(他给的文章网址此处换成超链接):

我很高兴听说你对生成函数感兴趣。你是否已经读过第9页的讨论? 那里对这这一原理给出了两个辩护(justifications)。这就是理解它所需要的一切。在 97页第三段给出了一些参考文献。也许你尤其感兴趣的是 Bender 的[1.5], 可在Bender[2]找到。

作者之一感谢浙江工商大学洪海波教授与他反复讨论下述相关问题:对特征 的环中的幂零元 (即满足 ),如何定义其指数函数 ,又如何求 的逆。从某种意义上说,本文就是对这类问题的一个回应。(相信读者已看出如何回答他的问题。)

感谢西北农林科技大学张京同学为我们加工编辑来自电影《勇敢的心》与《嫌疑人X的献身》的图片。

感谢审稿人对初稿提出诸多有益的建议,感谢编辑老师极耐烦而高效地在线编辑修订初稿。

注:本文最初是两位作者为“第一届和乐杯数学科普大赛”而专门准备。初稿完成后,作者曾请诸好友批评指正。有热心朋友推荐给去年新创办的在线期刊 《数学研究及评论》[3] ,此文得以迅速发表,见林开亮,王兢,论 Heaviside 算子法的合理性[4],数学研究及评论,1 (2020) Art. 4.

  1. 林开亮、王兢,求解常系数线性微分方程和差分方程的代数方法, 好玩的数学,2019–12–20.
  2. Rogers Penrose, The Road to Reality. NewYork: Vintage Books, 2004.
  3. Richard P. Stanley, Enumerative Combinatorics: Volume 1. (2nd ed.) Cambridge University Press, 2012. 第一版有中译本《计数组合学(第一卷)》。
  4. Chen, C., Lee, S., Huang, C. (2007). Derivation of Particular Solutions Using Chebyshev Polynomial Based Functions. International Journal of Computational Methods, 4(1), 15-32.
  5. G. H. Hardy, 印度数学家Ramanujan[5]
  6. Kazuya Kato, Nobushige Kurokawa, Takeshi Saito, Number Theory 1: Fermat's Dream. American Mathematical bSoc., 2000. 有中译本。

文中链接

[1]

亥维赛的辩护: https://todayinsci.com/H/Heaviside_Oliver/HeavisideOliver-Quotations.htm

[2]

Bender: https://pdfs.semanticscholar.org/6840/97c608b7f9d5f23e592ed92e8862a9173906.pdf

[3]

《数学研究及评论》: https://www.prior-sci-pub.com/mrr.html

[4]

论 Heaviside 算子法的合理性: https://www.prior-sci-pub.com/mrr2020iss1/art4.pdf

[5]

印度数学家Ramanujan: https://mp.weixin.qq.com/s/TfKVIQlo5PPxsnk6oGAbHw

传播数学,普及大众

长按识别二维码关注我们

欢迎把我们推荐给你身边的朋友


▼点击阅读原文发现更多好玩的数学。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存