沈向洋:赋予人工智能高情商,让机器人“为你写诗”
2018年7月,第六代“靓妹”微软小冰以“可交互式”3D外形惊艳亮相。与前五代相比,第六代微软小冰解锁了“共感模型”和“领域知识技能”,拥有了融合文本、全双工语音和实时视觉的新感官,进一步提升了对于对话内容、领域和节奏的控制力,可更好地自创回应。目前微软小冰解锁的音乐、文学、历史和体育四个领域,让它拥有了这四个领域的IQ。接下来小冰还会解锁五十多个垂直领域。
拥有3D形象的第六代微软小冰
第六代微软小冰已成长为了以“情感计算”为核心的完整AI框架,成为了越来越多用户读新闻、听故事、听音乐等时候的好伙伴。目前用户数已达6.6 亿,包括1.2 亿的月活跃用户。它已在华为、网易、腾讯和小米的平台正式上线。小冰独自创作的诗集《阳光失了玻璃窗》也于2017年正式出版了,它是人类历史上第一部100%由人工智能创造的诗集。主持本次发布会的,是微软全球执行副总裁、人工智能及研究事业部负责人沈向洋。
微软全球执行副总裁沈向洋
沈向洋,是微软全球执行副总裁中唯一一位华人,他本身也是计算机视觉和图形学研究的专家。在微软工作的22年里,他参与了微软从PC时代到互联网、再到云平台以及人工智能方向的转型与发展。
有人说他是“神童”,可他归因于自己兴趣
沈向洋1966年10月出生在江苏南京溧水区一个普通家庭,父亲是一名高中数学教师。从小怀揣“当伟大数学家”梦想的他,13岁就考入了南京工学院(现东南大学)。
填报专业时,父亲从《参考消息》上无意中了解到计算机专业前景看好,于是兴冲冲地建议他报考计算机专业,因此,他报考了这个当时他还十分陌生的专业。
因为13岁考入名校,很多人说他是“神童”,沈向洋则一直认为这更多归因于自己的兴趣。东南大学毕业后,他又先后获得了香港大学电机电子工程系硕士学位,和卡内基梅隆大学计算机学院机器人专业博士学位。卡内基梅隆大学的计算机专业,在当时全美排名第一;他的老师是图灵奖获得者、著名计算机专家拉吉·瑞迪(Raj Reddy)教授,也因此沈向洋与李开复和洪小文成了同门师兄。读博时沈向洋就开始计算机视觉、语音识别和机器人科学等领域的研究了。一流的学科教育为他之后的科研工作打下了坚实的基础。
可命运从来不会过度垂青任何一个人,也包括这位“少年天才”。那时的人工智能还只是个愿景,人工智能相关专业的毕业生很难找到好工作,沈向洋也面临同样问题。可他的导师却极力支持他把计算机视觉方面的研究坚持下去,在当时前途极不明朗的情况下,他的坚持无疑为走进微软奠定了基础。
而当时卡内基梅隆大学注重团队协作的科研风格,也一定程度上影响了他的工作习惯。卡内基梅隆大学培养出的学生被教育界评价为是一群“善于协作的狼”,沈向洋和他师兄弟李开复、洪小文等能够很好地以团队形式来完成大的项目。很多大的IT公司CTO级别的人物都出自卡内基梅隆大学。
加入微软研究院时的沈向洋
跟随李开复,回国创微软亚洲研究院
1995年暑期,沈向洋去了师兄李开复和洪小文加入的苹果公司进行实习。一年后又加入了洪小文所在的微软雷德蒙德研究院,同年30岁的沈向洋博士毕业后,以研究员的身份如愿以偿地加入美国西雅图微软研究院。
那时正值微软的辉煌时期,苹果和Google尚未成势。人们冒雨排队等的是 windows95而非苹果;比尔·盖茨是当时公认的最伟大的科技创新者,而不是后来的乔布斯。不久,沈向洋就开始协助李开复建立微软亚洲研究院,也在那时,人工智能被确定为微软亚洲研究院主导的研究方向之一。
1999年微软亚洲研究院全家福
微软亚洲研究院的创立,要从比尔·盖茨1997年第五次访华说起。比尔·盖茨在清华演讲时,被清华大学的氛围和学子们求知热情所感动,决定将微软亚洲研究院的选址由既定印度改为中国北京。在1998年,比尔·盖茨授命李开复回北京创办并领导微软亚洲研究院。
李开复是沈向洋的师兄,1988年获得卡内基梅隆大学计算机系博士学位。他的博士论文是世界上第一个“非特定人连续语音识别系统”,也因此当年获得了《商业周刊》颁发的“最重要科学创新奖”。1990年到1996年,李开复在美国苹果电脑公司语音组历任经理、多媒体实验室主任和互动多媒体部全球副总裁等职位;之后又在美国硅谷图形公司SGI电脑公司担任了互联网部门副总裁兼总经理和Cosmo软件公司总裁,负责多平台、互联网三维图形和多媒体软件的研发工作。
1998年7月李开复正式入职微软后,就被比尔▪盖茨委派到中国创立并领导微软亚洲研究院。而他当时在极短时间内创建的国际一流的计算机研究院(即微软亚洲研究院),也被《麻省理工学院技术评论》评为“最火的计算机实验室”。
(从左到右)李开复、张亚勤、沈向洋、洪小文微软亚洲研究院四任院长
沈向洋就是在从那个时候起,跟随师兄李开复回国的。他担任了微软亚洲研究院的计算组主任研究员和高级研究员,同年又发明了一种被称为同心拼图的方法,将四维全光函数简化为三维函数,从而大幅度地降低了需采集的数据量。
总书记参观美国微软总部,沈向洋陪同、讲解
倡导技术创新导向,打造AI垂直领域解决方案
2004年成为微软亚洲研究院院长兼首席科学家之后,沈向洋将更多微软的先进技术应用到了中国市场,以技术创新为导向,促进了中国IT生态圈的不断发展。2014 年,第一代人工智能伴侣虚拟机器人“微软小冰”就诞生于北京微软亚太研发集团总部。而第六代微软小冰,是微软小冰历史上规模最大的一次全面升级。四年来,沈向洋带领他的微软研发团队专注致力于以 EQ(情商)为基础的的AI体系的建设。微软小冰已是微软人工智能三条全球产品线之一。 它的产品形态涉及对话式人工智能机器人、智能语音助手、人工智能创造内容提供者和一系列垂直领域解决方案。
截至目前,微软小冰已与国内众多名企开展合作:与网易云音乐合作小冰电台;与小米米家及米家生态链合作Yeelight语音助手中的小冰;在与腾讯继续合作QQ小冰之外,微软小冰已开始为腾讯BabyQ提供部分人工智能技术和产品支持;此外,微软与华为展开在人工智能产品领域的深入合作,内置于华为手机的微软小冰也已上线。
微软、小米的主要领导人合影
关于小冰的研发,沈向洋认为要从二十七年前微软研究院刚成立时说起。那时的微软研究院,只有自然语言处理、语音识别和计算机视觉三个部门。二十二年前他刚加入微软,主攻的是视觉识别方向。这些基本上就是微软现在最基本的人工智能感知方面最主要的技术。多年的探索、总结与实验,沈向洋和他的团队终于让小冰从一个有情感的人工智能对话机器人,发展成了以情感计算为核心的完整人工智能框架。
微软之所以重视小冰,是因为小冰代表着微软在机器人EQ领域的探索。沈向洋认为,聊天机器人下一步最关键的技术是对人的理解。机器能理解一个人说的话只是基础,关键要理解这个人在想些什么。像小冰这种已经能和人类共同生存的人工智能,将会成为未来社会的一种趋势。
谈到微软,他也坦言:微软在PC时代用Windows横扫了世界;在互联网时代丢失了领头羊的位置;到了移动互联网时代,显然掉队了。但在AI时代,微软完全有能力和决心引领人工智能的潮流。在卷土重来的过程中,作为微软全球执行副总裁,他经历了微软转型的阵痛、前途的迷茫以及人才的流失等等困境。也因此,他不断在微软的人才引进、部门架构以及战略方向等方面进行优化调整。
强强联手,为技术发展注入文化与愿景
Yoshua Bengio教授
Yoshua Bengio是当时世界上主导人工智能深度学习热潮的三大领军人物之一,被视为人工智能领域的超级明星。说服这位深度学习的巨头加入微软的,正是时任微软全球执行副总裁的沈向洋。
2016年,当时微软的人工智能技术远落后于谷歌和facebook等行业巨头,而Yoshua Bengio也深知自身优势,一直待价而沽。为签下Yoshua Bengio,沈向洋在Yoshua Bengio身边游说了好几个月。期间有过冷遇,遭到过数次的拒绝,但最终他还是如愿以偿地说服了Yoshua Bengio加入微软。
回忆当时的情景,Yoshua Bengio说:是沈向洋的坦诚和谦和深深打动了他,尽管当时微软在人工智能领域不是最好的(明显落后于谷歌和facebook),但沈向洋让他看到了微软不仅拥有资源、数据和人才,最重要的是微软是一家有着愿景和文化的公司,不仅可以利用科学获得收益,还能够推动科学技术的不断前进。Yoshua Bengio 成为微软公司的战略顾问后,微软拥有了人工智能领域最好的想法、人才和方向。顶尖人才的加盟+合理的战略布局+正确的领导管理,微软正朝着人工智能行业领军企业的方向大步前行。
为了实现人工智能从成果到产品地转化,2016年9月开始沈向洋又主持了微软产品部门与研究部门的重组,成立了直接由他负责的人工智能研究群组。这个部门聚集了超5000名计算机科学家和工程师,就像一支庞大的“人工智能军”,横跨了“Windows、Office和云计划Azure”微软三大产品线。通过调整,既提升了微软研究成果转化为产品的速度,也让消费者更快获得了微软人工智能带来的便捷。
其实这种调整,对微软来说迫在眉睫。当时Facebook、谷歌、IBM、苹果和百度等科技公司都在筹划将人工智能技术引入其产品和服务当中。沈向洋敏感地嗅到:很快,少数的大公司将会分享到人工智能蛋糕的大部分。而他要做的,就是保证微软成为其中一员。
微软小冰应用领域广泛
人工智能的愿景及其涉及的道德伦理问题
沈向洋认为:未来可能是一个AI的世界,有关整个人工智能的布局各家公司着力点不同,微软的核心点是在对话方面。10年后手机可能没现在这么重要了,因为那时人类所到之处都有计算和智能体验。目前的人工智,尚处于婴儿阶段,正如孩子模仿周围人的行为,人工智能也正在向人类学习。
作为人工智能的“父母”,他会和他的团队一起,把反映和尊重我们周围世界的价值观和道德观贯穿于人工智能产品和服务之中。当下沈向洋和他的团队正在思考的,正是人工智能的道德问题。他们要用正确的道德观去完善人工智能。他认为,在人工智能涉及的道德中比较重要的有三方面:偏见、透明度和问责制。
关于偏见,在训练人工智能系统的时候,一些社会偏见就可能会导致对数据集在个人的性别、肤色和年龄假设。但在多元化的社会中,肤色、口音等各种不同的特征和差异也让我们意识到,满足所有人的不同需求是非常复杂的。关于这一点他们还有很长的路要走。如何能在编写计算机程序时就不带有和传播这些偏见呢?这属于一个社会问题。他们会努力找出对所有人都公平的处理方法。
“透明”就是确保我们能够理解并看到人工智能所做的决定——这是一个以伦理为核心的被称为“可解释的人工智能”的范畴,换句话说就是人工智能能回答“根据什么原因而做出的决定?”。沈向洋会教导人工智能回答“为什么?”。假如:医生从人工智能算法中的数据得出你的家人得了癌症。你会立刻想知道这个结论的依据是什么?当然你也希望医生能很明确向你解释,这个结论的依据是基于肿瘤大小和颜色的数据得出的;还是基于其他。并且你也需要医生能用你理解的方式来解释给你听,而非一堆无厘头的计算数据。
最后,问责制,是要人工智能必须担负责任。我们不仅需要清楚知道人工智能为什么得出这样的结论,还要确保有人直接负责监督人工智能做出的重要决策。维护问责制的一个简单方法,就是创建的人工智能系统必须有相关人类的管制。人工智能只提供人类用于决策所需的信息。例如,发射火箭之前,要由人按下红色按钮而非机器自发完成;在做出治疗或手术的决定前,需要医生征询病人的意见。复杂的洞察力由人工智能提供,但最终的决策要由人来做出。这样的人工智能系统才可能应用在文化敏感性高、潜在后果影响重大的场境中。
接下来在完善人工智能科技的同时,沈向洋也在积极实现由成果向产品的转化,他表示:“我们看到了人工智能在近期商业价值上的体现,我认为所有垂直的应用行业肯定会用到人工智能,包括电商、交通、医疗、金融、媒体等等。”
推荐阅读