查看原文
其他

当奥斯卡遇见图灵奖:计算机图形学让所见即所想,无问虚实 | 观点

The following article is from 微软研究院AI头条 Author 微软亚洲研究院


丹棱君有话说:谈及“计算机图形学”,很多人会觉得很有距离感,或者和计算机视觉、图像处理等领域混淆。实际上,计算图形学是一个专业性极强的领域,而且刚刚度过它的“婴儿期”。随着越来越多新技术、新硬件的使用,计算机图形学还在不断地扩展自己的内涵和外延,存在非常广阔的探索空间。近日,微软亚洲研究院院长洪小文主持了一场内部的炉边对话,与两位计算机图形学专家——微软亚洲研究院常务副院长郭百宁以及首席研究员童欣一起,与大家分享了自己与图形学的故事,并且探讨了计算机图形学领域的最新趋势。本文为大家整理了此次对话的部分精彩内容。



洪小文:今天我们讨论的主题是计算机图形学,大家都知道我是做语音研究的,我与图形学有过三次“亲密接触”,先跟大家分享一下。第一次邂逅是在我大学刚毕业,虽然我从来没有接触过计算机图形学,但是我却获得了学校计算机图形学助教的机会。对我来说,计算机图形学是个新鲜的事物,我没有修过全部的相关课程,但在计算机和教科书的帮助下,我还是能够胜任这份助教工作。

助教“生涯”之后,由于我转向了别的研究领域,所以就很少接触计算机图形学了。1994年,这个学科再次吸引了我的注意力。我一直认为图灵奖离我很遥远,但没想到我的博士导师 Raj Reddy 在94年获得了图灵奖。哦!原来图灵奖得主就在我身边。出于好奇,我查阅了过往历届的图灵奖获得者,发现我们卡耐基梅隆大学的校友、计算机图形学之父 Ivan Sutherland 也曾获得过图灵奖。

Sutherland 本人有很多出色的研究。他在60年代前后,编写了第一个交互式绘图系统 Sketchpad,也是今天便携电脑、平板电脑的雏形。后来,作为犹他大学教授的 Sutherland 与他的学生 Bob Sproull 又共同发明了 VR / AR 头戴式显示器。

除此之外,Sutherland 还撒下了图形学传承的种子。Sutherland 博士毕业之后,在哈佛大学待了几年,又转到犹他大学任教。他在犹他大学6年的时间里培养了许多学生,这些学生后来开枝散叶,为图形学的壮大做了不可磨灭的贡献,也让犹他大学成为了计算机图形学的“重镇”,创立了名符其实的“犹他帮”。

所谓“不可磨灭”的贡献,在于这些学生杰出的工作。例如 Alan Kay 发明了 Smalltalk 编程语言并获得了2003年图灵奖;Jim Clark 创建了一个图形界面浏览器 NetScape (网景),之后又创建了第一个图形工作站公司 Silicon Graphics Inc(SGI);Romney 制作了第一张 3D 图像;Gouraud 发明了 Gouraud 着色技术…….

其实,去年的图灵奖得主 Edwin E. Catmull 也曾在犹他大学学习,毕业之后他应纽约理工学院创始人的邀请主持计算机图形实验室,开创了另一支图形学领域的“山头”,这就是另一个故事了。

我第三次与计算机图形学产生深刻交集,便是在微软亚洲研究院了。郭百宁、童欣都是非常低调且资深的计算机图形学领域的研究人员,主导了相当多有前瞻性的研究,我从他们身上学到了很多图形学方面的知识。

言归正传,首先请两位分享一下,Patrick M. Hanrahan 和 Edwin E. Catmull 的贡献是什么?为什么他们会获得2019年图灵奖?

童欣:可能有些人会感到意外,计算机图形学研究的人获得了图灵奖,但这其实也是在情理之中的,因为计算机图形学早已被广泛应用于很多方面,以至于大家忽略了它的存在,在近几年随着 VR 和 AR 的热潮正在被更多人重新认识和了解。

我把人们的生活分为真实世界和想象世界,这两个世界对每个人其实同样重要。纵观整个计算科学应用,大部分领域都是在解决真实世界的问题,只有计算机图形学是通过计算机技术来充分实现人类的各种想象,并为此创造出了一系列全新的艺术表达形式,例如电影中的特效、计算机三维动画长片,和三维计算机游戏等等。让想象中的美好成为现实,也许这就是他们值得成为图灵奖获得者的一个原因吧。

Patrick M. Hanrahan 在2006年微软亚洲研究院主办的第八届“二十一世纪的计算”国际学术研讨会上发表演讲

郭百宁:去年图灵奖公布的时候,我发邮件向 Patrick 祝贺。Patrick 的回复很谦逊,他说图灵奖认可图形学对科技发展的贡献,并不是他一个人的功劳,而是所有人的汗水浇灌的果实。其实,图形学领域内都认为 Patrick 拿这个奖实至名归。

严格来说,Patrick 并不是计算机的科班出身,攻读博士期间他研究的也是生物物理相关的课题,虽然这个领域他做的还不错,但他知道,那始终不是他的“真爱”。当接触到计算机图形学后,Patrick 才找到了真正的兴趣所在。当时他与 Catmull 一起研究图形学相关的难题,试图用计算机图形学制作电影。最终,在前人的基础上,他们完成了 RenderMan 图形系统的开发,并在皮克斯推出的多部电影中发挥了关键作用,使得 3D 动画越来越逼真。最初的时候,周围的人都觉得他们疯了,今天来看,原来他们一直着眼于未来。

在我与 Patrick 的交流里,他的谦虚同样也体现在了他的代码之中。他给我分享过他写的代码,简单又不失优雅,就像一座美丽的建筑,他就是那个聪明、谦虚的建筑师。所以,当我祝贺他成为图灵奖得主的时候,他不出意料地将此归结为“集体的功劳”。

2006年前后,Patrick 曾经访问过微软亚洲研究院,他表示那次访问很有收获,打破了他过去对于中国人的刻板印象。在那次访问中,Patrick 给我们的研究员们做了一场演讲,分享了他的研究秘笈,并对他认为的最重要的论文进行了点评,到现在我还保留着那场报告的 PPT,其中的细节也记忆犹深。

Edwin E. Catmull 是“犹他帮”的一员,早期是一名研究员,创建了一种通过规范粗粒度多边形网格来表示光滑表面的新方法,被命名为 Catmull Clark,这也是现在动画和电影特效中常用的曲面片。Catmull 的技术在开发拟真图形学以及消除“锯齿状图形”方面发挥了重要作用。后来,Catmull 去了工业界,带领团队攻关将实拍序列和视觉效果结合在一起的方法,并将这些突破集成到了 Renderman 中,后来又成为了迪士尼杰出的领导人之一。

说到犹他帮,又不得不提 Evan&Sutherland 公司,它是计算机图形学之父 Sutherland 和 David Evans 在犹他大学期间创办的。虽然公司很棒,由两位大师创办,也为业界提供了许多顶尖的计算机图形学技术,不过在商业层面却没有很成功。所以,人总会面临一些失败,不可能在所有地方都成功,但也总会在某些地方有所成就。

微软亚洲研究院常务副院长,郭百宁

你们二位是因何开始计算机图形学研究的?又是如何与微软亚洲研究院结缘的?

郭百宁:我的博士导师 John Hopcroft 是一位非常有远见的人。在他看来,计算机科学研究的一些基本问题已经解决了,所以就建议我从应用层面切入,于是我选择了图形学。

毕业后我在美国工作,当时有个朋友在申请加入微软亚洲研究院,他希望我可以帮他向 Harry(沈向洋)举荐。让我没想到的是,当我联系 Harry 时,他说微软亚洲研究院对我也很感兴趣,希望我能加入。

熟悉 Harry 的人都知道,他总能带给人一种亲和感,他说的话总能让别人不由自主的相信。加上当时 Harry 在研究院里领导的图形研究组的工作非常出色,所以周围的朋友都对我说这是一个好的机会,劝我不要错过。

抱着进一步了解的心态,我又联系了 Harry,Harry 给了一个当时我无法拒绝的“大饼”,他说:“你在国外做研究,忙活这么多年才发表了一篇 SIGGRAPH 的论文,加入我们微软亚洲研究院,我们一起努力,每年都能在 SIGGRAPH 大会上发表一篇论文。”熟悉图形学的朋友都知道,图形学领域顶级会议 SIGGRAPH 的诱惑力有多么大。

就这样,我抱着每年发表一篇 SIGGRAPH 的“梦想”来到了微软亚洲研究院。

童欣:我上大学时个人电脑远不如今天这么强大,显卡是 VGA 分辨率还不是全彩色的。所以研究人员如果能有自己专用的计算机,特别是高配置的计算机来做图形是一件非常幸运并且自豪的事。当时浙江大学拥有 CAD 和图形学国家重点实验室,学生可以使用那里的专用图形工作站、大而漂亮的显示器进行科学研究和开发工作,更有一大批从事图形学研究的老师教学和指导研究,我就这样在本科阶段在浙江大学开始了计算机图形学的学习生涯。后来从清华博士毕业后,我直接加入了微软亚洲研究院,直至现在。

微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长,洪小文

洪小文:SIGGRAPH 大会的影响力毋庸置疑,我所在的语音领域的大会,论文接收率差不多在50%左右,而 SIGGRAPH 每年只接收70-80篇论文,接收率低于10%,所以中了 SIGGRAPH 的论文可以称之为一个 milestone。在1996年 SIGGRAPH 大会接收的论文中,微软研究院的论文占了近20%,因此被称为“微软研究院计算机图形学的黄金时期”,而图形学是微软研究院在学术界建立影响力的重要学科之一。当时有众多图形学大师,包括 Jim Kajiya、Alvy Ray Smith(皮克斯动画工作室的创始人之一)、Jim Blinn、Tunner Whitted 等,曾在微软研究院进行研究工作。

在 SIGGRAPH 2005上,微软亚洲研究院有9篇论文入选,占了当届大会接收论文总数的大约10%。那么,作为亲身经历者的你们对 SIGGRAPH 有怎样的感受?

郭百宁:首先,我想强调的一个原则就是,自己所做的研究确实是自己所爱,如果不热爱,你也很难去做好。兴趣驱动非常关键,要时刻谨记这一点。


其实 SIGGRAPH 不仅仅对图形学领域有巨大的影响,同时,它也影响了很多其他领域的学者。比如,计算机视觉领域的著名学者贾佳亚曾经在微软亚洲研究院做了一年半的访问学者。后来有人问起他人生中最重要的时刻是什么时候,他的回答是,在微软亚洲研究院做 SIGGRAPH 的时候,因为在研究院的这段经历帮助他学会了如何做高质量的学术研究。


于我而言,SIGGRAPH 可以算是“恶梦”级别的计算机图形学顶会了,因为进入它的门槛很高。其他会议的论文审稿人大概只需要2-3位,但 SIGGRAPH 则有5位,而且每位审稿人都会进行非常细致的、长达几页的 review,就好像把论文掰开揉碎了,逐段“攻击”查找漏洞,语言也相当犀利。如此严格的审稿在其他大会中十分少见,但其实这非常有利于研究者个人的提升。


以自己为例,我曾经发表过一篇单一作者的论文,在1997年第一次提交 SIGGRAPH 的时候,我知道论文中存在一个漏洞,但是我把论文写得非常漂亮,巧妙地绕开了漏洞,结果受到了审稿人及同行们猛烈的批评。第二年我以“要练神功,挥刀自宫”的决心,直击上一年论文中的漏洞,追根溯源,最终攻克了那个难题,也受到了大会的认可。在那之后,我都会多次检查要发表的论文,并形成了自己的检查方式。


当然在来到微软亚洲研究院之后,我再也不会独自面对这类问题了,因为在研究过程中,我的团队,比如童欣会毫不留情地对发现的问题提出质疑。事实上,刚来微软亚洲研究院时,我的第一个项目就是与童欣一起合作的,我准备的项目文件因为细节问题受到了童欣的“深揭猛批“,作为童欣的领导,这件事我一直记忆犹新。


回头来看,在我们的研究领域,有些人曾因为审稿人严厉的批评而受到了“心理创伤”,对待别人的反馈很消极,但如果你可以把反馈看作是一个礼物,消极就会变成积极。经历过这些洗礼之后,对于任何“谷底”你都将不再惧怕,更不会轻言放弃。不断地提升自己、证明自己,就成为了人生的一项基本功。


童欣:顶会论文的要求都非常高,而且在这一过程中的每一个环节,从论文的初始想法,到写作、结果、配图、视频,到最后的论文报告,我们必须不断打磨反思,超越自己的极限,才能达到更好的水平。当你为自己的论文研究感到小幸运时,其实一定有更好的论文在那里,SIGGRAPH 就是一个让你眼界大开,知道人外有人、天外有天的地方。在微软亚洲研究院的第一年,我拼尽全力,准备了一份自认为还不错的演讲PPT,但到了会场和别人做的对比之后,我却发现它真的是太粗糙了。不过第二年,第三年,我找到了使之变得更好,同时提升自己的方法。我想,在这一过程中,自我反省、追求极致非常必要。


微软亚洲研究院有一个特点我非常喜欢——在这里所有人在工作中都是平等的,都可以相互批评指正、交流探讨,无论是正式员工,还是实习生,无所谓普通员工还是老板,特别是在讨论技术和研究课题时。当你抛出一个新想法,每个人都可以各抒己见,直言自己的想法,没有好坏,只有真诚。


微软亚洲研究院首席研究员,童欣

没错,学术辩论本身就是为了寻找真理,并且更全面、辩证地看待一个问题。在计算图形学的黄金时期,微软亚洲研究院进行了一些充满雄心壮志的研究项目,例如 Project Trioxide,如今回首,你们有什么感悟?

童欣:Trioxide 项目的初衷是希望 Xbox 游戏与 PC 硬件平台上的游戏可以相互在对方的平台上兼容运行,当时没有任何游戏机厂商可以通过软件做到这一点,包括比尔·盖茨在内的微软高层希望微软可以在这个领域探索并引领技术方向,于是我们和微软雷德蒙研究院的研究人员一起开始了项目,微软雷德蒙研究院的人员负责 CPU 部分,陈刚和我带领微软亚洲研究院的队伍开始 GPU 部分。我们一个五六个人的团队,完全是从头开始学习,坚持了大概两到三年的时间,最终做出了一个可以实时运行大型游戏的验证系统。很不幸的是,当时由于商业的考量,这个项目中断了,但我们从技术角度已经开疆扩土,解决了关键性的问题。事实证明一切努力没有白费,后来在面临市场竞争激烈的情况下,曾经被存储起来的那些代码又发挥了巨大作用,微软的开发人员仅在6个月内就开发出了新的、获得用户认可的平台设备,并实现了上一代 Xbox 游戏在新一代平台上的相互兼容。连当时的行业领军者都感叹,如此短的时间不可能完成这个项目,微软到底是如何做到的。

从这个项目里,我学到的就是不要用一时的挫折或成果去衡量一个研究或者你的努力,你永远也不知道将来会发生什么,过去的挫折很有可能是未来成功的重要因素。另外,我的一个最大的感受是在决定做一个事情后,一定要全力以赴,无论你的研发结果如何,你个人一定会在这个过程中学习很多,得到成长。

郭百宁:当竞争对手都表示这是一项不可能完成的任务时,那它可能真的就是个创举了。不同的时间、不同的角度看事物本来就会有不同的看法,如果将一项研究放到历史的长河中去看,就更是如此,Trioxide 就是最好的例子。

如何看待计算图形学是一种伪物理的说法?

童欣:虽然计算机图形学中的画面是假的,但其中的数学和计算是真的,也是对物理世界一个精心裁剪过的近似模拟。更重要的是,图形学的一个重要的应用是艺术创作。我们知道,艺术家的想象可以与真实世界完全不同,这样我们可以让 3D 图形超脱物理形态,达到更美的境界。这些都是源于现实、高于现实的实现。

郭百宁:如果一定要说假的,那我们是“shallow fake”,不是“deep fake”。图形学有一个重要的应用场景就是仿真实验,仿真实验不仅可以大大提高相关研究的可视性和可重复性,还可以有助于突破重点和难点,提高相关研究的效率。这里有个有趣的背景:不少计算机图形学的早期科研人员都曾经在物理仿真领域做过真实的模拟实验,尤其是在美苏冷战期间。冷战结束后,不少人就转行到了娱乐行业,并在虚拟世界中应用他们的技术。3D 世界,虽然看起来是伪物理,但仍然是基于现实世界去创造的。

在你们看来,计算机图形学的发展前景如何?

童欣:虽然我自己在图形学这个领域已经工作了超过25年了,但是仍然觉得非常有意思。图形学刚刚度过它的婴儿期,随着越来越多机器学习技术的使用、最新图形硬件的应用,还有云服务的出现,计算机图形学还在不断地扩展自己的内涵和外延,并将创造更多机会,它还有很长的探索之路。所以我对图形学的发展和未来充满了信心,并为之激动!


郭百宁:GUI(Graphical User Interface,图形用户界面)的出现改变了整个计算历程,在此之前没人认为图形学会出现在操作系统中。它走进了每个人的生活,并且改变了人们的生活。通过接口概念,图形学改变了整个计算的方式,现在仍然在继续改变整个计算体系,所以我们也要站在更大规模的基础上去思考。图形学发现的计算新内容就像哥伦布发现新大陆一样,因此站在这个高度来看,未来的交互可能不只是图形上的面对面,更应该是从心灵出发的。


了解更多:




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存