查看原文
其他

纯粹数学走出象牙塔:丘成桐和三维科技有何关系?

2015-10-19 顾险峰 赛先生


编者按:近日,国际著名微分几何大师丘成桐院士创立的 Geometric Informatics Tecchnology (GIT)公司成功获得了中国知名投资机构信中利7500万元人民币融资,完美地诠释了“知识就是力量”这句古老的格言。《赛先生》特邀丘院士的学生、GIT的共同创立者和研发主管顾险峰教授撰文,剖析纯粹数学对高科技产业的促进和颠覆作用。


顾险峰/文

纯粹数学给人的印象一直是艰涩深奥、远离尘嚣。学术上徐缓拖沓的进展令关键猜想的突破动辄耗费数百年。现代数学更是高度抽象、孤芳自赏,令人不知所云,因而不为外界关心。与之相反,科技领域的发展狂飙奔袭,一日千里,使日常生活和社会结构都发生了天翻地覆的变化。纯粹数学,特别是现代数学,如果对科技领域存在影响,似乎也是润物细无声的渗透,而非直截了当的应用,但却有可能是触及灵魂的颠覆。在这里,笔者针对过去二十年间三项重大的科技突破(GPU、数控机床、三维扫描),谈下现代几何对于它们的直接应用,甚至某些颠覆性的观点。

GPU和阿蒂亚-辛格指标定理


公元两千年左右,图形处理器GPU(Graphics Processing Unit )的出现和推广标志着计算机硬件的革命。与CPU类似,GPU是专为执行复杂的数学和几何计算而设计的,这些计算是图形渲染所必需的。目前GPU的数值计算能力远远超过CPU,从而极大地推动了高性能计算、电子游戏,动漫动画和深度学习等领域的发展。在GPU发明之前,实时动画渲染只能依赖于专用的工作站,如SGI等等,其昂贵的价格严重抑制了游戏工业的发展。GPU的发明使得硬件成本戏剧性的下跌,实时游戏变得唾手可得,游戏工业蓬勃发展。


图1:纹理贴图技术的解释


GPU的兴起使得三维游戏中的一项技术纹理贴图变得至关重要。如图1所示,在游戏工业中,光滑曲面的形状被表示成三维的多面体网格(a),曲面的颜色纹理被表示成二维的图像(c)(d)。纹理贴图技术就是将二维图像严丝合缝地贴到三维曲面上(e)(f);或者等价地,将三维曲面展平到二维平面上,同时采用尽量减少畸变的展开方式(b)。在工业界,通常采用黎曼映照或调和映照,因为这种映射保持局部形状,畸变较小。纹理贴图的效果显现在(e)和(f)中,不同的纹理图像得到不同的渲染效果。构建一个精细的三维形状(a)的代价高昂,改变纹理图像(c)(d)相对廉价,因而游戏的更新换代一般只替换纹理图像。


在GPU发明之前,纹理贴图只能由软件实现,GPU出现之后,纹理贴图可以由硬件支持,当时曲面参数化的算法只能处理简单拓扑曲面——拓扑圆盘,例如人脸曲面。对于拓扑复杂的曲面,比如拓扑球面、轮胎曲面,传统方法无能为力,只能将曲面分解成拓扑圆盘,分别处理每一片然后粘合。这种方法破坏了曲面的整体性,粘合支离破碎的曲面片降低了纹理贴图的全局光滑性。设计发展强有力的整体曲面参数化方法,使得纹理贴图适用于所有的曲面成为突破当时动漫游戏界瓶颈的出路。


图2:基于局部参数化的纹理贴图效果


2002年暑期,还在哈佛大学读博士的我在圣安东尼奥参加了计算机图形学年会SIGGRAPH,从会议上得知法国计算机科学家利用保角变换实现了曲面局部参数化方法,但是全局方法当时无人知晓。陈省身先生最为著名的成就之一就是将局部微分几何推广成为全局微分几何。作为陈省身学派的弟子,我敏锐地意识到:应该存在全局方法。


回到哈佛后,我连夜编程,实现了基于黎曼映照的局部参数化方法。第二天清晨,当我将国际象棋的棋盘格纹理图像贴在三维人脸曲面上(见图2),展示给丘成桐院士看时,丘院士异常激动,连声叫到:“这真的是黎曼映照,真的是黎曼映照!”我连忙问:“如何将这种方法推广到拓扑复杂曲面?如何实现全局方法?”丘院士思索片刻,斩钉截铁地说:“要用Hodge指标定理!”丘先生立刻在办公室的黑板上写下了黎曼流形上的热流方程:“调和微分可以看成是流形上光滑得不得了的切矢量场,光滑得无法再光滑就是调和。可以在保持上同调类不变的情况下,由热流得到。”我们热烈地讨论了几个小时,丘先生深入浅出,举重若轻,将数学理论透彻讲解;我则心潮澎湃,血脉偾张,摩拳擦掌,跃跃欲试。方向指明之后,我立刻全身心地投入到了全局参数化的研究之中,废寝忘食,通宵达旦。


丘先生讲解的是纯粹数学理论,需要用到曲面的微分结构和黎曼度量张量。但是在计算机的数据结构中,曲面不再光滑可导,传统的度量张量也无法定义;在那个年代,也没有曲面同伦群和上同调群的拓扑算法;数值求解偏微分方程的有限元方法只限于平直空间的区域,弯曲的流形上的偏微分方程数值解法没有成熟的理论或算法。但我在丘大师的点播下,概念明晰、直觉深刻、热情高涨、勇往直前。在长达数月的探索中,我几经波折,愈挫愈奋,多少次山穷水尽疑无路,柳暗花明又一村!终于,在波士顿金色的秋阳下,我的屏幕上出现了人类历史上从未出现的画面(图3),高亏格黎曼面上的全纯微分!近两百年来,黎曼面上的全纯微分这一概念只存在于纯粹数学家的脑海里,他们用自己深刻的思想去感受欣赏,用心灵去抚摸摩挲。虽然全纯微分客观存在,但是大自然中没有她们的倩影,虽然她们美妙不可方物,但却虚无缥缈,不可捉摸。刹那间,她们被我们永久地捕获了,不再神秘虚幻,朴实诚挚地为人类实践服务着。那时我觉得自己成为了世界上最幸福的人,因为我是人类历史上第一个用肉眼看到全纯微分的人!


以全纯微分为基础,丘成桐院士和我将全局参数化这一瓶颈彻底打破。丘先生提议将这一算法命名为顾-丘算法。这一算法能够将复杂拓扑曲面整体参数化,使曲面保持完整,不会被肢解,图4展示了一些基于顾-丘算法的纹理贴图效果。彼时,德国、法国、美国和以色列的科学家都在竞相追随这一全局参数化方法,我们一时引领了潮流。


图3:曲面上的全纯微分群的基底



图4:应用顾-丘算法得到的纹理贴图效果


理论上,顾-丘算法是根植于著名的阿蒂亚-辛格指标定理。该定理是上世纪60年代发展起来的连接分析和拓扑的桥梁,其内在含义是说,流形上椭圆偏微分算子的解被流形的拓扑所决定:于紧的可定向的流形上的线性椭圆微分算子,其解析指标等于拓扑指标。传统的黎曼-罗赫定理(Riemann-Roch Theorem)、希兹布鲁赫符号差定理(Hirzebruch's Signature Theorem)、高斯-博内-陈定理(Gauss-Bonnet-Chern Theorem)、Hodge分解定理(Hodge Decomposition Theorem)都是它的特殊情况。我们考察带度量的可定向曲面,则曲面必为黎曼面。黎曼面上的全纯微分(holomorphic differential)成群,黎曼-罗赫定理断言此群的复维数等于曲面的亏格。同时,全纯微分群和曲面上所有调和微分的群同构,每一个de Rham上同调类中,存在唯一的调和微分。由此,我们可以用组合算法求出曲面同调群,然后解几何偏微分方程解出调和微分、全纯微分(图3),全局参数化可由全纯微分导出。


数控机床和拓扑障碍理论(陈类)


数控机床技术在过去几十年间迅猛发展,对于高强度的机械部件加工,例如发动机,数控机床依然是无法被3D打印机所取代的。机械加工领域不同于游戏工业,曲面都是由所谓样条曲面(Splines)来表示的。样条曲面的位置是参数的分片多项式函数,光滑地自动拼接在一起,形状由控制网格(control net)所控制。这种表示对于曲面的光滑性(可导性)要求较高。因为在加工过程中,切削铣车的速度,力度(加速度)需要计算出来并且精确监控,因此样条曲面应该至少处处二阶可导,曲率连续。汽车、飞机、船舶、机械的绝大多数设计都是基于样条曲面的,在具有复杂拓扑的曲面上构造处处二阶光滑的样条曲面,一直是具有根本重要性的中心问题。


在过去的数十年间,机械制造工业、汽车、航空工业都取得了巨大的成功,但是这个中心问题一直悬而未决,定义在曲面上的样条总存在光滑性变差的奇异点。学者们和工程师们为了构造流形上的光滑样条函数费尽心血,但是结果一直差强人意。传统样条是用于逼近一维曲线,通过张量积可以为二维曲面建模。后来,学者们在平面区域的三角剖分上建立了样条曲面。这些样条曲面都是基于代数中的极形式(polar form),具有参数仿射不变性:如果我们保持控制网格不变,将参数进行仿射变换,在新的参数下用旧的控制网格构造样条曲面,则新的样条曲面和旧的样条曲面相重合。那么,能否将样条曲面的构造由平面三角剖分扩展到曲面的三角剖分?似乎距离目标只有一步之遥。


图5:流形样条


丘院士团队从理论上揭示了这一步之遥实质上是天堑。传统样条的参数仿射不变性等价于样条曲面的构造是基于仿射不变量的,传统样条的极形式实际上是隶属于仿射几何的范畴。如果流形允许一个仿射结构,(一族图册,使得局部坐标变换都是仿射变换)那么流形上就可以定义仿射几何,经典的样条构造可以直接推广到这种流形上。所以,问题归结为一般曲面上仿射结构的存在性。如果流形上存在仿射结构,我们可以考虑曲面的切丛,其上存在一个联络,其诱导曲率处处为零,即陈省身示性类为零,曲面若封闭则亏格必为1。换言之,封闭的亏格非1的曲面上不存在仿射结构,因而传统样条理论无法直接推广到曲面上。


给定底流形,给定纤维,底流形上的矢量丛可以被构造出来。所有的矢量丛可以依据同伦关系进行分类。陈省身示性类理论将矢量丛的同伦类和底流形上最高阶的上同调类建立对应关系,即所谓陈类。陈类非零,则矢量丛非平庸,不存在处处非零的全局截面。在我们目前情形下,陈类非零,则仿射结构不存在。陈类揭示了仿射结构全局存在性的拓扑障碍。这意味着,传统的样条构造方式,样条理论,本身具有不可弥补的缺陷。无论后人多么努力,传统样条到流形上的自然推广都将是徒劳的。


笔者曾经当面问过经典样条理论的奠基者们,为什么当初忽视了理论根基的稳固,而匆忙建立了庞大的汽车工业。他们的基本观点是当初机械工业发展水平不够发达,所能加工的形状非常简单,样条曲面上奇异点的问题并不突出;同时,他们的专业背景多属计算数学,那个年代拓扑障碍理论并未发展成熟,绝大多数人根本没有意识到数十年后可能出现的技术危机。目前,机械制造工业早已成型,绝无可能因为理论的缺陷而将一切生产线推倒重来。未来的发展,必然限于局部的修补。以自然的方式从根本上消除样条曲面上的奇异点只能是一种奢望。目前,人们研究的重点转向如何有效地控制奇异点的个数和位置,如图5中的黄色点就是曲率无法定义的奇异点。奇异点可以用Ricci曲率流的方法加以有效控制。


三维扫描和超弦理论


三维扫描技术在过去十年间如火如荼,高速度、高精度地获取三维人脸数据目前是轻而易举的,由此衍生了大量的三维数据处理问题。例如,如何让计算机能够自动识别三维人脸上的表情就是一个饶有兴味的问题。如图6所示,假设我们采集了多人多表情的三维人脸数据,如果我们能够找到一种方法来度量任意两张三维脸之间的距离,我们姑且称之为两张脸之间的几何距离,那么我们就可以将这些人脸依据彼此间的几何距离来聚类。如图7所示,每个点代表一张带有表情的脸,这些点之间的平面欧式距离大致等于相应的几何距离,我们自然得到三个点簇,三个聚类对应三种表情。在这种依据几何距离进行聚类的模式识别算法中,最为重要的是三维人脸间几何距离的制定和选取。


图6:九个人带有三种表情:悲伤、高兴和惊讶



图7:聚类结果


曲面间几何距离的定义方式有很多种,这里我们采纳比较自然的一种。首先,我们将三维人脸曲面通过黎曼映照映射到平面圆盘上,黎曼映照保持角度,但是面积元会发生畸变,畸变系数被称为是共形因子。原来曲面上的黎曼度量信息完全被保持在共形因子里。由此,每张脸在平面圆盘上对应了一个共形因子函数。我们将共形因子函数视为概率密度函数,每张脸对应圆盘上的一个概率分布。圆盘上的所有概率分布构成一个无穷维的流形——Wasserstein空间,Wasserstein 空间中存在一个黎曼度量——Wasserstein距离。任意两张人脸之间的距离可以由Wasserstein距离来定义。Wasserstein距离的计算等价于解一个非常著名的非线性方程:实的蒙日-安培方程。


大概在1997年春季,我曾到麻省理工学院人工智能实验室学习Horn教授的《机器视觉》课程。Horn教授是计算机视觉创始人David Marr的弟子,以“Shape from Shading”闻名于世。Horn教授提出了一个新颖的曲面表示方法:扩展高斯图(Extended Gauss Map),就是将曲面每点的高斯曲率记录在此点的法向量处。从扩展高斯图反解初始曲面恰恰等价于解蒙日-安培方程。我向丘先生求教,丘先生把自己早年关于蒙日-安培方程的论文交给我,并告诉我说,这个问题是古老的闵科夫斯基问题,俄罗斯学派有离散的理论。经过头悬梁、锥刺股的数月苦读,我发现闵科夫斯基用构造法解决了封闭曲面的重建问题,他的学生亚历山大夫解决了开放曲面的重建问题,但是亚历山大夫的证明是基于代数拓扑方法,换言之,是一种抽象的存在性证明。从亚历山大夫的证明中,我们无法找到构造性算法。而丘先生的方法更高屋建瓴,气势恢弘。


丘先生的方法是用来证明卡拉比猜想的:存在这样一个宇宙,那里质量为零,但是引力非零。这种宇宙被称为是卡拉比-丘流形。卡拉比-丘流形违反人类直觉,令人匪夷所思,但却是超弦理论的基石。依据超弦理论的基本观点,宇宙是十维的,每一点除去四维时空还有一个六维的纤维空间,这一纤维具有独特的物理特性:质量为零,引力非零,恰恰就是卡拉比-丘空间。超弦理论将广义相对论和量子力学统一起来,卡拉比-丘空间的拓扑决定了宇宙常数和基本物理定律。卡拉比-丘空间存在性的证明依赖于求解复的蒙日-安培方程。当时虽丘大师亲授武林秘笈给我,但可叹那时我内力不够,无法参悟玄妙奥义,功亏一篑。十数年后,丘先生和我再度联手,与罗峰教授和孙剑教授共同解决了亚历山大夫定理的构造性证明,同时给出求解离散蒙日-安培方程的变分方法,发展了离散最优传输理论。我们借用经典计算几何中的加权Delaunay三角剖分和凸优化的方法来求解蒙日-安培方程,图8显示了从复杂几何曲面到平面圆盘的保面元映射,这一映射是基于离散最优传输理论。这种方法可以用来计算Wasserstein距离,实现曲面聚类。


图8:基于求解蒙日-安培方程的曲面保面元映射


总结


在过去十数年间,我们经历了许多技术方面的革命:GPU对CPU的颠覆,数控机床和3D打印对传统制造业的颠覆,三维扫描对二维摄影的颠覆。每一轮技术革新都会引发一系列深刻的技术挑战:曲面全局参数化,流形样条的构造,几何大数据的聚类等等。应对这些挑战,往往传统智慧无法胜任;真正的突破,大多来自深刻的基础科学,特别是貌似无用的纯粹数学。粗暴地将基础科学视为智力游戏实际上是一种反智的愚昧。存粹数学的发展异常艰辛,需要多年的点滴积累;如何寻找技术突破点,如何应用现存的理论解决关键问题,更是需要常年的实践经验,和高瞻远瞩的胆识和智慧!我们相信,依随计算机技术的加速发展,愈来愈多的抽象理论会被理解吸纳,转化为实用算法,从而进一步推动基础理论的研究和实际生产力的发展。



欢迎个人转发分享,刊物和机构如需转载,请联系授权事宜:

iscientists@126.com


更多精彩文章:您可以通过回复“年份+月份”的形式接收精彩往期文章,比如回复“201410”即可接收2014年10月份的所有文章。您也可以返回主页点击屏幕下方子菜单获取最新文章、往期文章或直达赛先生微博。谢谢






《赛先生》由百人传媒投资和创办。上帝忘了给我们翅膀,于是,科学家带领我们飞翔。



微信号:iscientists



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存