池内克史:从心所欲,不逾矩
欢迎关注微信公众号:微软研究院
在微软亚洲研究院,有一位很受年轻人欢迎的日本研究员——池内克史(Katsushi Ikeuchi)。今年67岁的他仍然时刻保持着十足的活力,走起路来步伐轻快,脚下生风,标志性的微笑总让人印象深刻,同事和实习生们亲切地叫他“Katsu”。在Katsu的身上总有一种与年龄不符的朝气,而这正是源于他对自己研究领域经久不衰的热情,也源于微软亚洲研究院带给他的惊喜。
“在微软亚洲研究院可以把想做的事情自由地结合”
在来到微软亚洲研究院之前,Katsu就已经是计算视觉和人工智能等领域赫赫有名的大师级人物。博士毕业于东京大学的他曾在美国工作,任麻省理工大学人工智能研究室研究员、卡内基梅隆大学计算机系主任研究员。与此同时,池内克史教授至今所获得的计算机科学的世界性奖项数目众多,培养过的学生也不计其数。
原本已是应该退休的年龄,Katsu却选择了来到微软亚洲研究院继续他的研究生活,对此Katsu是这么说的:“因为在这里,我可以继续做自己想做的事情,进行更多的探索与整合。”在人工智能领域,Katsu一直在钻研如何更好地发掘机器人的服务功能。他目前正在研究的一个实体机器人项目(Physical Robot),希望通过动作分解和机器学习,使机器人可以对人的行为动作进行高精度的模仿。在微软亚洲研究院,他恰好可以把这套技术和研究院已有的虚拟聊天机器人等人工智能相关的技术相结合,希望打造出一款服务型、人性化的实体聊天机器人。“七十而从心所欲,不逾矩”的生活,正是年近七旬的Katsu一直追求的状态。而现在,他在微软亚洲研究院终于实现了“从心所欲”的科研常态。微软亚洲研究院为研究人员们提供了广阔自由的开放研究空间,无论是基础研究还是应用技术,都能在这里得到自己需要的资源。Katsu还特别提出,微软亚洲研究院是一个朝气蓬勃的研究机构,有着许多有想法的年轻研究员与活力十足的实习生们,Katsu很喜欢和他们交流,“他们总有些奇思妙想值得我学习。”
然而这并不是Katsu第一次与微软亚洲研究院结缘,虽然他身处高校的研究机构多年,但是他最看重的还是跨界研究。在他看来,无论是学术界的基础研究还是工业界的应用研究都不能“单打独斗”,只有找到契合的节点,将二者相互融合,才能最大限度的造福大众。“将基础的理论研究进行应用,在实际应用的过程中发现新的问题,再来对基础研究进行修正,这样才能构成一个闭环”,他说。而对他来说,微软亚洲研究院正是实现这一闭环的不二选择,这一切都促成了他最终来到这里,开始他的新研究时代。
强人机交互:实体机器人+聊天引擎
提高人机交互水平,增强机器人的服务功能与体验一直都是Katsu的热情所在。实现这一点的关键在于把实体机器人的功能开发得更加完善,让人们能与真实可见的机器人进行深度交互。
微软的人工智能姐妹花“小冰”和“小娜”大家可能都不陌生,作为虚拟聊天机器人,小冰和小娜背后离不开微软亚洲研究院的自然语言理解、图像识别、语音识别等技术的强大支持。Katsu希望他能为这类虚拟聊天机器人增加更多的交互意味,让机器人能够站在人们面前,利用表情、手势等丰富的肢体语言灵活地进行交流。
正在进行聊天动作实验的机器人
非语言沟通其实是人们交流中非常重要的一个环节,为了让机器人和人们的聊天过程不再呆板枯燥,研究员们需要为机器人在聊天的过程中匹配相应的动作和姿势。Katsu的研究小组让机器学习了大量人类之间聊天的视频,从中观察人们聊天时会做哪些行为姿势,并进行分析和学习。学习人的动作姿势是一个复杂的过程,如果能对聊天的关键动作进行分解,则会大大提高机器人学习的效率。
Katsu采用了一个特殊的动作分析法——Labanotation来分解动作。Labanotation(拉班舞谱)是捷克舞蹈理论家拉班自创的舞蹈动作记录法,该舞谱以数学、力学、人体解剖学为基础,运用各种形象的符号,精确、灵便地分析并记录舞蹈及各种人体动作的姿态、空间运行路线、动作节奏和所用力量,如今已经被公认为一种既科学又形象、并富有逻辑性的分析记录体系。通过利用Labanotation,机器人在观察人的动作后,将其解码为“舞谱”的动作路线并记录下来,然后再映射到机器人的动作上,增强与人的动作的相似度。
会跳台湾民族舞的机器人
除了人机交互,Katsu还将Labanotation技术用在了保护濒临消失的非物质文化遗产上。早在进行实体机器人的研究之前,Katsu就尝试用计算机对濒临消失的台湾原住民族舞进行记录。
台湾原住民被认为是南岛语族的起源,共有14个部族被确认。他们没有书写系统等成熟的记录方式,因此随着时间的流逝,一些传统文化也面临着消失的危险。时间久远,一些原住民也渐渐忘记了他们属于哪个部落。Katsu通过大量的调研了解到,几乎所有部族都有自己的节日舞蹈,他们通过跳舞来寻求祖先保佑,祈祷晴天/雨天,或是寄托美好希冀。在他们的文化里,舞蹈更是一种身份的象征,通过舞蹈甚至可以判断舞者的部落、方言甚至社会地位。
对此,Katsu提出的结局方案间距创意与可行性:通过机器人来将台湾原住民族的舞蹈记录并保存下来,既可以对当地的舞蹈文化进行保护,又可以为后续的历史文化研究提供依据。和实体机器人学习人类聊天时的动作类似,机器人对人们的舞蹈也依据拉班舞谱进行关键帧的分解,再对动作及其力度和速度等进行模仿和学习。Katsu和研究员们邀请了40位台湾原住居民进行表演、录制视频,让机器人进行观察和学习。最后,机器人通过学习获得了一项新技能,那就是可以跟随音乐跳出好几种不同台湾原住民的民族舞蹈。
把文化遗产保护进行到底
用先进的计算机技术保护文化遗产一直是Katsu的心愿,如果你对Katsu的研究项目有所了解的话,你会发现他的许多研究项目都是从非盈利的慈善角度展开的。他用“e-Heritage (数字遗产)”这个词来概括他的这些研究项目。谈到为什么对这些数字遗产的研究充满热情时,他说:“因为这些文化遗产是无价的,他们不可替代,但又濒临消失。用数字化的方式记录下来,一是为了保护遗产本身;二是为了后续发挥他们的教育功能,让更多的人能看到这些文化遗产的美;三是记录下这些宝贵的数据还可以用于考古等研究。”除了用机器人模仿民族舞蹈等非物质文化遗产保护项目,Katsu还利用3D成像等技术对吴哥窟等重要的物质文化遗产进行数字化处理。
高空传感器
以吴哥窟的3D重建为例,这是一个漫长的过程。首先要通过各种传感器对建筑物的图片进行全面采集,各个角落都不能放过。对于高度较高的部分,Katsu采用了带氢气球的高空传感器(Balloon Sensor);对于狭窄区域,则利用可以攀爬的传感器(Climbing Sensor)。采集到大量的图片后在计算机上进行对准和校准,再融合成立体模型,而在融合的过程中还需要不断的修正。经过不断地校准和修正,最后呈现出吴哥窟的高度仿真3D模型,同时对吴哥窟进行全面详尽的考古测量和记录,为学术界提供包括海量数字化信息在内的第一手资料。这种精确记录为文化遗产的永久保存提供了可能。
3D模型的构建过程
目前,Katsu的团队正在和北京大学信息科学技术学院查红彬教授的团队进行合作,对洛阳的龙门石窟进行数字化呈现。数字文化遗产保护不仅是Katsu团队深耕的领域,还是微软亚洲研究院一直重视的科研方向之一。 2011年,微软亚洲研究院向敦煌莫高窟捐赠为其量身定制的十亿级像素数字相机系统“飞天号”,帮助解决莫高窟的保存难题,助力文化遗产数字化。
从民族舞蹈到历史建筑,Katsu的科研角度可谓丰富多彩。可以说,他是一位艺术气质浓厚的“非典型”计算机科学家。在他的研究中,艺术和计算机科学这两个截然不同的领域总是能碰撞出新的火花。而Katsu对艺术和科学的融合有着他自己的独到见解:“如果说20世纪的艺术和科学还是两个相互分离的领域,那么21世纪则是艺术与科学相互融合的时代,例如电影技术与电影艺术等等。我要顺应这样的趋势做出创新!”
“Have some beer!”
“Have some beer!” 是Katsu的口头禅。Katsu的家人都在日本,他说微软亚洲研究院就是他在中国的“家”,闲暇时和同事们喝点啤酒是Katsu特别享受的事情。Katsu的研究团队由来自中国和日本的研究员和实习生组成,虽然文化背景不同,但大家的相处十分融洽。在研究过程中,遇到分歧是常有的事情,但和别的团队不同的是,Katsu的解决方式是请大家去喝啤酒,一边喝酒,一边讨论,很多天马行空的创意就是这样迸发出来的。
按年龄算,Katsu在微软亚洲研究院可以算是很多人的长辈了(其实他还是微软研究院很多研究员的导师哦!),然而大家却觉得Katsu完全没有长辈的“架子”,相处起来总是很随和、亲切。Katsu经常调侃地称自己为“Old Man”,要多和年轻人“混在一起”。乐天派的他经常和大家一起去公司的健身房健身,然而在一群年轻人中却毫无违和感。
探索新领域:Idea > Paper
作为国际计算机视觉和人工智能领域的知名学者,Kastu的国际影响力毋庸置疑。2016年6月3日,“日本版的ACM”——日本信息处理学会(Information Processing Society of Japan (IPSJ))将2015年度功劳奖颁给了Katsu,以表彰他在计算机视觉领域做出的卓越贡献。此前 Kastu还曾获《IEEE模式分析与机器智能汇刊》(IEEE-PAMI)颁发的“杰出学者奖“和由大川基金会(Okawa Foundation)颁发的奖项——Okawa award等诸多奖项。
而在科研之外,培养人才也是Katsu生活中重要的组成部分。看到一批批学生的茁壮成长,Katsu非常欣慰和骄傲,其中有的已经在学术界小有名气。如今,Katsu已经指导了近50位的博士生。石凡是Katsu团队的实习生,目前大四的他正在Katsu的指导下做毕业设计。“他不会跟我说具体要怎么做,而是为我们指引一个方向,引导我自己去解决问题,这让我受益匪浅。”Katsu建议有志于学术的年轻研究者们,“在探索新领域时,最先重视的应该是idea,而不要去在乎能出几篇paper。”
正如Katsu所说, 寻找思路比在意成果更重要!经常迸发出新的想法,同时不断更新和修正自己的思路,就是Katsu不断开拓新领域的密钥所在。
不管是在实验室,还是在健身房,你都能见到神采奕奕的Katsu。他总是把全部的热爱都投入到当下的生活与工作中。而在微软亚洲研究院,还有很多这样既纯粹而又富有活力的研究员,他们来自世界各地,但对自己的研究领域都倾注着不同于常人的热爱。同时他们又凝聚在一起,共同打造着技术的未来。
你也许还想看:
微软亚洲研究院的“哈利·波特”:Thomas Moscibroda