查看原文
其他

发表了SIGGRAPH ASIA 2015的论文并参加大会是什么体验?

2015-12-09 大会分享 微软研究院AI头条

微信公众号:微软研究院


由计算机协会(Association of Computing Machinery,简称ACM)SIGGRAPH 举办的SIGGRAPH和SIGGRAPH ASIA大会,堪称世界上影响最广、规模最大、最权威的,集科学、艺术、商业于一身的图形学和交互技术盛会。从1974年开始,SIGGRAPH每年都会举办一次年会。从2008年,SIGGRAPH会议来到亚洲,也就是SIGGRAPH ASIA大会。在这两个会议上发表的论文会被收录到ACM Transactions on Graphics (TOG)上,各个商业性公司也会在这个会议上也会展示最为先进图形学技术,艺术家们也会将自己精心制作的电影短片拿来一博眼球。

今年的SIGGRAPH ASIA大会于11月2日至6日在日本神户举行。神户是日本最重要的港湾都市之一,也是一座宜居都市。神户的秋天气温适宜,凉凉的空气好像被水洗过一样,呼吸起来清爽、滋润。会议地点设在神户国际会展中心,会展中心坐落在神户的一个小岛上,安静平和。上万名图形学和交互技术方面科学家、艺术家、工程师、商业人士等等,从世界四面八方涌来,为这个小岛增添了不少热闹的气氛,会展中心附近的宾馆、饭店的员工好像一下子也愉快地忙碌了起来,来欢迎我们这些远道而来与会的客人。我有幸参加了今年的SIGGRPAH ASIA会议。会议之外,我印象最深刻是某天早上,在我和师兄前往会展中心的路上,大约有二十来个在修剪路边花草的工人看到我们之后,接连鞠躬向我们这些参会人员大声问好。这突如其来的热情让我们顿时有点不知所措,连忙笑着向他们挥手致意。由此足以见得这个大会在当地人心中也有着非常大的影响力。


对于图形学领域的学术研究者而言,能够在SIGGRAPH 或者SIGGRAPH ASIA上发表论文,就意味着自己的研究成果得到了国际同行的最大肯定。今年微软亚洲研究院网络图形组(Internet Graphics Group,简称IG组)与清华大学合作,共有两篇论文被SIGGRAPH AISA 接收。



其中一篇论文是关于人脸动画。人脸无疑是人类最感兴趣的研究对象之一,在图形学领域,对于人类面部动画的研究也堪称一大热点。利用面部动画技术,我们就可以控制计算机中虚拟角色,使其自然、逼真地通过面部运动来表达喜怒哀乐等不同感情。高质量、实时的面部动画相关技术在电影、游戏、虚拟现实等领域起着关键性的作用。


面部动画技术的一个重要分支是面部动画的捕捉,其目标是在计算机中生成与演员表情一致的三维人脸动画。传统的面部动画捕捉系统主要是利用视觉信息对面部表情进行表情重建。当演员面部发生遮挡或者演员转头动作过于剧烈的情况下,由于信息缺失,仅仅利用摄像头获取的人脸视频很难准确地获取演员的面部表情。然而人类的语音内容与嘴部运动,甚至与人的表情,都有着紧密的内在联系,同时在遮挡和转头等情况下,语音不会受到任何影响。所以利用演员在表演会进行说话这一信息,我们可以进行更为鲁棒和逼真的表情重建。今年微软亚洲研究院与清华合作完成的论文“Video-Audio Driven Real-Time Facial Animation”,巧妙地将视觉信息和声音信息结合起来,提高面部表情捕捉系统的鲁棒性和保真度。这篇论文构建了不依赖特定用户的语音、视觉信息和表情信息的关系数据库,第一次成功地联合运用两种信息进行实时的面部捕捉,对遮挡等情况足够鲁棒,得到了比现有技术得到更准确的结果。我的同为微软和清华大学联合培养的博士生师兄刘一龙是这一论文的第一作者,我们同是微软和清华大学联合培养的博士生。他们在SIGGRAPH AISA 大会上作报告的时候,还在会场对这一系统进行了现场演示。不同于实验室,虽然会场的声音嘈杂,光照条件也不理想,但这一系统的表现依然非常完美,演示结果让博得了在场专家们的啧啧称赞。


我们的另一篇论文“Rolling Guidance Normal Filter for Geometric Processing”是关于三维模型的编辑的,这也是我在微软亚洲研究院实习期间的第一篇第一作者的论文。为什么要对三维模型进行编辑呢?我想你肯定对下面一系列动作习以为常:拿起手机拍照,然后通过美图软件对照片进行处理。其实对于三维模型而言,也大致如此。随着Kinect等三维获取设备的普及,现在我们可以很轻易地重建出来一个物体的三维模型,接下来就需要对三维模型进行编辑。


对于三维模型而言,其表面通常有丰富的小尺度的几何纹理,比如鱼表面的鱼鳞、纪念碑表面的浮雕等等。正是这些几何纹理使得三维模型看起来生动形象。对这些几何纹理进行编辑处理,无疑是改变模型几何外观的重要方式。在编辑这些小尺度的几何纹理的同时,我们不希望编辑操作影响到其他大尺度的几何结构。然而传统的模型处理算法要么是针对模型表面进行噪音设计(主要用于模型去噪),要么不能很好地将小尺度的几何纹理和大尺度的几何结构区分对待。针对这一问题我们提出了一种全新的算法,用户指定待编辑的几何纹理的尺度,我们可以对这一几何纹理进行增强,去除,或者使得凸起(凹陷)的几何纹理凹陷(凸起)。在整个编辑的过程中其他大尺度的几何结构保持不变。经过预处理之后,我们算法的能达到线性复杂度。也就是说对于一个具有百万个顶点的模型,我们的算法基本能够在交互时间内将结果反馈给用户。另外,这一算法在模型分割、模型的四边形化中也有重要的应用。


与其他国际会议不同,SIGGRAPH系列会议并不只是单纯的学术会议,而是一个学术界、工业界、艺术界的盛会,因此除了技术文章之外,现场还有很多动画和新兴技术的展览。在动画展览上,会议展示了世界各地的艺术家使用电脑动画和计算机图形学特效精心制作的电影短片。它们有的有着令人称奇的独特创意,有的生成了逼真震撼的视觉效果,有的展现了动画技术与电影特效技术的无限可能。看了这些展览,在为作者的创造能力与艺术造诣惊叹的同时,我们也体会到了图形学在实际应用中的重要作用,极大地激发了我们的科研兴趣。



工业界的人士也在会场展示了新兴技术,比如最先进的增强现实技术,三维投影技术等等。我们从一个展台走到另一个展台,被一个个的独特思路和精密的系统所惊呆。这些展览者在技术的潮流中进行大胆的探索,把各种技术应用在不同的情景下,提出了一个个巧妙的方案,解决了一个个有意思的问题。

最后值得一提的是 SIGGRAPH ASIA的社交酒会。这是西方社会里比较流行的一个方式,参加宴会的人们有食物和酒饮,但是没有固定的桌子。大家端着酒杯走来走去,和不同的人们进行交谈,从而达到社交的目的。通过这个酒会,我们认识了一些各友校富有科研热情的同学,也见到了很多曾经只在一些论文中见到名字的行业领袖和大牛们,与他们的交谈让我们大开眼界,受益匪浅。


技术改变生活,而图形学恰恰将学术和艺术完美结合,SIGGRAPH ASIA会议上为最先进的图形学技术提供了展示的平台,辛勤而且充满创造力的图形学工作者在SIGGRAPH ASIA上相聚,定会为我们未来的生活创造更多的美好。



王鹏帅微软亚洲研究院 实习生

关于作者:我叫王鹏帅,是微软研究院的一名实习生,本科毕业于清华大学,目前微软和清华联合培养的博士生。我在微软的博士生导师郭百宁博士是我们领域内世界级的专家。导师们和我们一起读论文、一起讨论、甚至一起熬夜,润物细无声,我也在不知不觉中从导师身上学到了许多。在微软和其他实习生在一起,就像生活在一个大家庭里一样,大家一起开心一起进步。




了解微软亚洲研究院实习生项目,欢迎关注“明日之星”实习生项目介绍,或点击阅读原文



相关阅读:

【一篇文章】带你看完第十七届“二十一世纪的计算”大会


当学术邂逅浪漫 – 记MobiCom 2015大会


五分钟带你回顾 KDD 2015 大会




微软小冰住进微软研究院微信啦!快去和她聊聊天吧。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存