其他
为导师起草书稿,却意外收获博士论文……
加星标,才能不错过每日推送!方法见文末动图
部分研究生不大会自己找题目做研究,而是“等米下锅”。美国南密西西比大学数学系教授丁玖回忆了自己求学和论文选题、写作的特别经历。
新冠疫情爆发前,我回国学术访问、与教授们交流时,他们提到,部分研究生不大会自己找题目做研究,而是像课堂考试等发试卷那样,等导师指定一个研究论题。“嗟来之食”总没有自助餐吃得舒畅。我们都知道,农家自由放养的草鸡味美汁鲜,远非集体圈养的肉鸡可比。盖因肉鸡饭来张口,食谱单调;而草鸡到处觅食,营养丰富。草鸡的市场价钱,也因此比肉鸡贵许多。我小时候住在父母的学校教工宿舍,下雨前最爱在操场上,用大扫帚拍捉矮飞的蜻蜓来喂鸡,因为它们给我们下蛋吃呢。就像念书时,视野不应囿于教科书的方寸纸页,选择学位论文研究课题时,也最好能处处注意,主动出击。就我而言,博士论文的选题虽然出于偶然得之,事先可能连导师李天岩(1945-2020)教授也没想到,却是“到处留心皆学问”的结果。其实,我赴美后写的第一篇研究文章,是得益于我南大老同学魏木生博士的先驱性工作,而与导师涉足的几个领域无关。虽然它未被放入我的博士论文,其诞生机缘却与后来的学位论文有异曲同工之处。
为准确起见,本文将引进一些数学概念。我将用初等或几何语言,以及比喻类比,来描述概念,即便读者不全懂数学内涵也无妨。性急的读者不必望而生畏而减少继续读下去的劲头,希望所讲故事的戏剧性和启发性燃起他们更大的阅读火苗。
“找米下锅”
我的大学同学魏木生,在七七级江苏高考中数学全省第一——正题及附加题皆为满分,本科毕业后公费去了美国布朗大学留学,1986年获博士学位。他的博士论文是关于散射波计算,这需要考虑最小二乘问题。但此时矩阵不再是满秩的,而是“亏秩”的,即矩阵之秩小于矩阵的行和列数。他在文献中找不到现成的亏秩问题摄动理论可供参考。有次在学术会议上,魏木生遇到数值代数大人物、美国科学院与工程院双院士、斯坦福大学计算机科学系的高露博(Gene Howard Golub,1932-2007)教授,便向他求教。对方的回答让他相当惊讶:还没有人认真研究过此类问题。于是魏木生决定,自己动手打下这个新领域的第一根桩。1989年,他关于亏秩矩阵最小二乘摄动理论的首篇论文刊登于期刊《线性代数及其应用》(Linear Algebra and Its Applications)。
1986-87学年,魏木生在明尼苏达大学数学及其应用研究所做博士后。1987年秋,魏木生来我读博的密歇根州立大学数学系,继续他的博士后研究。李天岩教授在六七个申请者中挑选了他,因为柯朗数学科学研究所的大数学家拉克斯(Peter Lax, 1926-)教授写了一封有力的推荐信。能让拉克斯提笔写信的人,当然绝非等闲之辈。的确,魏木生之所以得此殊荣,是因为他在博士论文中,推翻了拉克斯散射波理论专著的一个观点。整整一学年,我们两个老同学经常偕家人驱车去购物,共同度过了许多愉快的时光。就在那个秋学季,我拜读了魏木生写的几篇文章,觉得非常有意思。
魏木生博士的开创性工作,本质上是通过估计亏秩最小二乘问题摄动解的误差上界,论证了一般最小二乘解的“上半连续性”。自然界许多现象都是连续的,比如水是连续流动的。“解的连续性”大概是说,当所解问题的数据稍有变化时,解的变化也不大。为了能够应用矩阵论中著名的“奇异值分解定理”,他不得不使用以一百年前德国数学家弗罗贝尼乌斯(Ferdinand Georg Frobenius,1849-1917)名字命名的一种矩阵范数。这个范数是把m行、n列矩阵的所有元素排成有mn个分量的向量,再计算出该向量的欧几里得范数(即所有分量平方求和,再开平方根)。读毕全文,一股强烈感受很快涌上我的心头:文章结论自然漂亮,数学分析也很精辟,但使用这个范数,总不及最小二乘问题本身定义所采用的向量欧几里得范数来得自然。于是我主动出击,集中精力苦苦思索,不久就有了头绪,只用欧几里得范数,获得了一个较为简洁的摄动界。
因为这是我来美后写成的第一篇文章,完稿时我颇有点小激动。我的硕士论文从未投稿以求发表,一方面因为当时太太怀孕,我当然要尽点责任,加上后来又忙于出国留学,无暇整理;另一方面我早已对那个工作不再看重,盖因来美后发现,国际上基于三角剖分的单纯不动点算法研究已趋沉寂,不像七十年代到八十年代初那么红火。而基于微分拓扑思想的现代同伦算法,生命力却一直旺盛。我几个师兄弟的博士论文,都与这个方法密切相关。我后来也将同伦延拓法的思想用于最优化的研究。
兴奋之余,我将文章初稿寄给了当时远在日本京都大学数理解析研究所担任讲座教授的导师李天岩,请他提建议。李天岩教授很快回函,在三页长信中对我文章的主要定理发表了具体意见,并在有关读书研究的方法论上,给予了启迪心智的评述。平时不大当面表扬学生的他,这次却满腔热情地鼓励了我,因为在做学问这件事上,我没有“等米下锅”,而是“找米下锅”。按照他的观点,这是一个研究生“应尽的义务”。
师者传道
我们先回顾一下,他是怎么“走运”地写出了天下第一篇用现代同伦延拓法计算布劳威尔不动点的文章。这个以荷兰数学家命名的拓扑学大定理,在最简单的一维情形,就是初等微积分中的介值定理,其几何性质人人都懂:连接一条直线两侧之点的任意连续曲线必与直线相交。布劳威尔不动点定理在二维的情形就是:闭圆盘上任意一个连续自映射(即值域包含于定义域)必有不动点,即该点被映到自己。李天岩1968年毕业于台湾新竹清华大学,当兵一年后,去了美国马里兰大学数学系读博,师从约克教授。毕业前一年的1973年,他修了凯洛格教授的课《非线性方程组数值解》。课中,教授讲述了加州大学伯克利分校数学系赫希(Morris Hirsch,1933-)教授十年前发表的布劳威尔不动点定理新证明。
这个简洁反证法的思路是:假设不动点不存在,则导致与拓扑学某定理相矛盾。这后一定理是说,不存在将闭圆盘映到其圆周边界的光滑映射,使得圆周上的所有点保持不动。这些拓扑学上有趣的深刻定理,可以解释为什么人头顶上有处不长头发的旋窝。李天岩听到如此新颖的证明,喜欢思考的他顿生一计:可用该思路计算定理保证存在的不动点。因为闭圆盘是个二维区域,而圆周仅是一维曲线,对于赫希考虑的将圆盘映到圆周的映射,定义域比值域多了一维,故存在“逆像”曲线,它起始于圆周上一点而终止于原先映射的不动点集合。只要能在数值上跟随这条“同伦曲线”,不动点就可以算出来。主动而独立的思维,牵引出这么奇妙的新算法!创造性的思想,是那些靠死记硬背定义、定理、证明的读书者难以想象的奇迹。但是对喜欢追根求源、寻找原始思想的探索者,这却是最自然的水到渠成。
当李天岩告诉了约克他的想法后,后者全力支持他干下去,尽管他手中还有其他研究项目,眼光深远的导师知道该课题的价值。经过两个月编程计算,李天岩的算法思想终于实现——薄薄的一页打印纸,记录了历史上第一个现代同伦算法的数值结果。将在克莱姆森大学召开的不动点算法及其应用会议的筹委会,一听说他们用微分拓扑思想构造了新的同伦不动点算法,而不是沿着耶鲁大学经济学教授斯卡夫(Herbert Scarf,1930-2015) 1967年开辟的基于单纯剖分和组合技巧的单纯不动点算法的路线走,马上提供了两张机票,邀请他们赴会宣读论文。后来,斯卡夫在会议论文集序言中,对凯洛格-李-约克文章的新思路赞不绝口。从此,现代同伦延拓法进入了计算数学的大舞台。
“凭着一股牛劲”
但是李天岩却全然不知,美国氢弹之父、波兰裔杰出数学家乌拉姆(Stanislaw Ulam,1909-1984),在他1960年出版的一本篇幅只有一百五十页的小书《数学问题集》(A Collection of Mathematical Problems)中,已经提出这个方法,用来计算不变密度函数。文章写好后,李天岩才听说这就是十几年前已有的乌拉姆方法。并且乌拉姆在书中猜测,只要不变密度函数存在,算法就收敛。“乌拉姆猜想”催生了在物理及工程中有重要应用价值的“计算遍历理论”学科问世。李天岩文章与乌拉姆方法的“历史性巧合”,也导致文章题目改动,加上了“乌拉姆猜想的一个解答”。这篇计算遍历理论领域的里程碑之作最终是《弗罗贝尼乌斯-佩隆算子的有限逼近——乌拉姆猜想的一个解答》。
多年后,李天岩教授对我回忆他这篇大作的出炉经过,十分感慨地说道:“如果我当时事先知道,这个算法的收敛性,连和冯·诺伊曼一个级别的数学家乌拉姆也未给出证明的话,可能不大敢啃这块骨头。”但是,年轻时的李天岩,是个“初生牛犊不怕虎”的猛士。按照自己的说法,他“凭着一股牛劲,凡事坚持到底,绝不轻易放弃。”他认为,大人物解决不了的问题,并不能说明小人物也解决不了,大人物思考问题的途径也不一定是解决问题的唯一途径。在学问的道路上,只要有独立的精神、自由的思想,只要比别人多花了一分钟思考,就能够将看似困难的问题搞个水落石出。
1987年初夏前,我在通过两门外语(英文和中文都不算外语)考试后,一边继续修课,一边积极跟上一个崭新领域——线性规划内点算法。它与我在南大读硕士的最优化方向相关,起始于印度人卡玛卡(Narendra Karmarkar,1956-)于1984年发表的一篇开创性论文。这个领域当时在国际优化界已开始热浪滚滚,跟进的研究者趋之若鹜。许多人甚至预测卡玛卡在上世纪结束前将会获得诺贝尔经济学奖,就像最早提出线性规划有效计算方法的苏联数学家康托诺维奇(Leonid Kantorovich,1912-1986)当年那样。不过这个预测没有变成现实。李教授考虑到我的老本行是数学规划,建议我跟上内点算法快速发展的步伐。他的一些素有学术往来的朋友,如日本最优化理论著名学者小岛政和(Masakazo Kojima,1944-)教授,常寄来这方面的文章预印本。斯坦福大学运筹学博士叶荫宇等几个华人学者,也开始崭露头角。我力图多了解这些最新的研究成果,慢慢靠近学术前沿,并完成了几篇关于线性相补问题内点算法的文章。其中与导师合作的第一篇,有幸在1991年发表于美国工业与应用数学会那年新办的《SIAM最优化杂志》(SIAM Journal on Optimization)创刊号上。我曾打算将这些内容整理成我的博士论文,但后来的结局却是始料未及的。
西海岸之旅
趁我去北加州开会之机,我们全家计划在六月份游览一次美洲大陆西海岸,这是我来美后第一回长途旅游。
从密歇根州到旧金山市的那个月,我们全家在沿途不少地方留下了足迹。我和许多南大老同学、老熟人再次相聚。在旅途的第一站伊利诺伊大学厄巴纳-香槟分校,我与大学同窗胡著信不期而遇,整晚聊天;还和与我同机赴美读博士的南大化学系七八级学生李巧英重逢。然后我家老小去了堪萨斯城,得到了韩国师兄李弘九一家的热情招待,李弘九在密苏里大学堪萨斯分校任教。抵达摩门教大本营盐湖城后,在犹他大学读博士的尹光炎同学开车带我们一睹盐湖风光。如今他和我昔日同窗中的另两名“江苏高考状元”,已开始饱览“夕阳无限好”的退休景色。
到了旧金山湾区,我见到了已在斯坦福大学统计系获得博士学位的张砚凝同学。出生于北京、大学成绩优秀并且热爱长跑的他,当年考上中国科学院计算中心研究生并留洋深造。我来美读书后收到的第一封在美老同学来信,就是他热情洋溢的“欢迎明信片”,他也在第二封信中对我给新生女儿取名“易之”大加赞赏:“不愧了你的文学功底”。后来,事业有成的张砚凝,长跑热情没有降温,参加过好几次马拉松,包括著名的波士顿国际马拉松比赛。
我也与南大七八级的数学才子戴建岗再次相会。他正在斯坦福大学数学系撰写博士论文(他现任康奈尔大学运筹学与信息工程学院讲座教授,同时任职香港中文大学(深圳)数据科学学院院长)。之前的三月初,他专门去了旧金山国际机场替我接机,将我母亲和女儿送到飞往底特律的登机口。我们在美丽的斯坦福校园漫步,游览这所世界名校。家母在校园中央的著名大教堂前留了影。这是斯坦福夫人为纪念1885年与她共同创建学校的铁路大王丈夫而建立的。四分之一世纪后的2013年感恩节前,我去看望已在那里工作的女儿。在万里无云的蓝天下,我们两人在这座美丽教堂前留下合照,让八十五岁高龄的家母再次目睹壮观的斯坦福建筑。
书稿中的闪光
回到密歇根后,我很快进入状态,开始起草导师交代的书稿。该书的基本框架已具雏形,只需添加作为预备知识的基础部分,并统一书面表达和语言符号。我马不停蹄地伏案工作了两个月。这也是我重新梳理知识、锻炼学术写作的过程,给我日后自己写书提供了极好的练笔机会。更重要的是,在撰写关于绝对连续不变测度计算的乌拉姆方法那一章的某个瞬间,我无意中灵光一闪,为一项新研究创造了契机。
李教授计划出版的这本中文著作,主要讲的是在遍历理论中有广泛应用的一类正算子——弗罗贝尼乌斯-佩隆算子,它是把非负函数映成非负函数的线性算子,并保持积分不变,前一个性质就是“正算子”的定义。算子的名称借用了两个德国数学家名字,实际上与他们风马牛不相及。只是因为这个无穷维算子继承了非负矩阵的若干好性质,并由于先是1907年的佩隆(Oskar Perron,1880-1975)、然后是1912年的弗罗贝尼乌斯,建立了非负矩阵的一般理论,以至于乌拉姆在《数学问题集》中把他们的名字借了过来,给该算子命名。这种“张冠李戴”的现象,在数学史中并不鲜见,比如解非线性方程组的牛顿法并非由牛顿正式提出,他只是用它逼近了一个多项式方程的根。牛顿法收敛性理论的系统研究,归功于二十世纪俄罗斯数学家康拓诺维奇。微积分中求不定型极限的洛必达法则,更是个“欺世盗名”的结果。被洛必达(Guillaume de l'Hôpital,1661-1704)放在他1696年书中的这个法则,实际上由瑞士数学家约翰伯努利(Johann Bernoulli,1667-1748)发现。不变密度函数是弗罗贝尼乌斯-佩隆算子的不动点。李教授书稿的前面几章,讲的都是算子不动点的存在性定理和性质,最后一章才涉及它们的计算,标题为“弗罗贝尼乌斯-佩隆算子的有限逼近”,内容为乌拉姆方法以及李天岩关于乌拉姆猜想、对于洛速达-约克区间映射族收敛性的漂亮证明。
当我快要写完这章,整个书稿就要大功告成之时,脑袋里突然冒出一个疑问。从计算数学角度看,用逐片常数函数逼近一般函数是最简单粗糙的做法。为什么不能采用逐片线性甚至逐片二次函数来逼近呢?常识告诉我们,如用水平线来近似悬链线,精度远低于用连接曲线上两点的线段逼近它。于是我好奇心大盛,马上拿起纸笔,画图演算起来。三十多年来,我一直致力于计算遍历理论的研究,而这趟千里之行,就从此处开始。它与我之前的内点算法研究毫不相干,分属相距十万八千里的两个天地。由于我既在美国掌握了纯数学分支遍历理论的基本知识,又早有南大老本行计算数学专业打下的良好基础,我的思路比较清晰,进展也相当顺利。我注意到乌拉姆方法既是保正性、保积分的一种保结构算法,又属于传统的投影算法范畴。于是我就沿着这两个方向来推广它。很快,我就构造出两类基于逐片线性或逐片二次多项式的新算法。第一类依赖于迦辽金投影原理,另一类因使用了有限维的马尔科夫算子而保结构,我将之命名为马尔科夫有限逼近法。以俄罗斯数学家名字冠名的马尔科夫算子,比弗罗贝尼乌斯-佩隆算子范围更广,它定义为保持非负函数积分不变的正算子。对于乌拉姆方法能收敛的洛速达-约克类区间映射,我证明了新算法的收敛性。为证实高阶数值方法收敛更快,我用系里的太阳-工作站电脑(指计算机公司Sun Microsystems推出的工作站——编者注),输入自己编制的Fortran程序,进行计算比较。数值试验结果显示它们比乌拉姆方法收敛快得多,差距之大就像吕布的赤兔马同吕布本人赛跑。后来,两位华人教授从理论上研究了逐片线性马尔科夫有限逼近法的收敛速率,加上我和李教授于1998年发表的后续文章,最终建立了此类算法的收敛速率理论和误差估计。
1989年八月底,我完成了李天岩教授中文专著的初稿。作为副产品,也拿出两篇研究文章。连我也感惊奇的是,这本书我连草稿都没打,每章每节基本上是根据李教授课程讲义的概述,先在腹中酝酿一番,然后一气呵成地写下,这大大节省了写作时间。在两个月内,我不仅起草了一本中文书,还做了一些有意义的研究。当我把书稿交给导师,并献上了论文初稿时,他先是惊讶,看完后觉得满意。从此,我再也没有过问那本书稿的命运。遗憾的是,李天岩教授一直忙于多项式方程组数值解方面的宏伟研究计划,基本上已离开混沌动力系统和遍历理论这个早年让他扬名天下的领域,因而从未有暇修改完成这本著作,殊为可惜。而我则相反,从导师课程中学习遍历理论培养出的兴趣,加上这段写作、研究的独特经历,让我离开了内点算法,投身于计算遍历理论,多年来乐此不倦,并与中国科学院计算数学与科学工程计算研究所的周爱辉博士合作,在2006年通过清华大学出版社出版了研究生中文教材《确定性系统的统计性质》。它对应的英文版则在2008年底由该出版社和德国的施普林格出版社联合出版。
毕业和工作
找工作的难易度,和经济形势甚至社会环境的好坏线性相关。1957年,苏联的卫星上了天,把美国吓了一大跳,以为自己的科技水平落到对方后头去了。高层领导一声号令,美国的大学马上开始膨胀,导致六十年代的新科博士俏得很,个个都能谋到一份大学教书的好差事。结果是,他们当中的一部分,由于先天不足或后天懈怠,在竞争激烈的学术环境中败下阵来,待遇每况愈下,尤其在研究型大学。密歇根州立大学的教授中也有这样的人,在老教授中的比例不算太低。我记得有一次,导师远远指着一名学术地位不太高的教授的办公室,对弟子开玩笑说:当我还在高中读书的时候,他就是教授了,但他现在的薪水差不多只是我的一半。当李教授1974年拿到博士学位时,美国博士的好日子已经过去,很多人找不到饭碗。他能幸运地谋到一份大学教职,而许多像他这样的中国台湾博士只好打道回府。不过后来不少人由于台湾经济腾飞而赚了大钱。他又告诉过我们,他的第一个博士研究生、来自台湾的朱天照,1982年拿到学位时,情况又一次倒转,校园面试机会多得应接不暇。最终朱博士选择了北卡罗来纳州立大学。他的研究表现十分出色,六年后就破格荣升到正教授了。
然而没想到的是,我1990年毕业,正巧赶上美国大学教职行情最严峻的新一轮周期!好在我找到了正式助理教授位置,但那是后话了。
写于2024年3月24日星期日美国哈蒂斯堡夏日山庄
注:本文根据2016年由商务印书馆出版的《亲历美国教育:三十年的体验与思考》第六章《博士论文》修改而成。
致谢:感谢朱慧坚博士提出两处修改意见,增加了叙述的准确性。
本文受科普中国·星空计划项目扶持
出品:中国科协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
相关阅读
近期推荐
1 打鸡血、喝尿、针刺麻醉,我亲历过这些医疗荒唐事 | 熊卫民访谈
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。
长按下方图片关注「返朴」,查看更多历史文章