微软全球资深副总裁王永东：今天的 AI 就像 99 年的互联网 | 观点 | 自由微信

微软全球资深副总裁王永东：今天的 AI 就像 99 年的互联网 | 观点

微软丹棱街5号 2021-04-27

丹棱君有话说：近年来人工智能不断升温，各种人工智能技术在全球快速落地，应用范围不断扩大。微软全球资深副总裁、微软亚太研发集团 CTO、微软亚洲互联网工程院院长王永东博士在 AI World 2019 世界人工智能峰会上分享了微软在 AI 领域取得的进展以及对 AI 落地的思考。

近年来人工智能的热度不断升温，学术研究的参与度持续上升，国际顶级人工智能学术会议的论文提交量逐年飙升。

在企业和学术机构的共同努力下，从 2019 年开始，人工智能的风口逐步形成。与此同时，人工智能技术在国内也开始快速落地，应用范围不断扩大，数据丰富度、付费意愿和竞争程度成为 AI 企业场景选择的主要考量维度。尤其是计算机视觉、计算机语音以及自然语言处理，成为了 AI 落地的热门领域。

10 月 18 日，以“AI 元力，重启未来”为主题的 AI World 2019 世界人工智能峰会在中国北京中关村展示中心成功举办。峰会由海淀区政府、中关村科学城管委会主办，新智元、海淀园管委会、智源研究院承办。

峰会上，微软全球资深副总裁、微软亚太研发集团 CTO、微软亚洲互联网工程院院长王永东博士分享了微软在人工智能方面取得进展。从基础技术来看，计算机视觉、计算机语音、自然语言处理是 AI 领域非常重要的方面。

微软在计算机视觉的探索

微软在计算机视觉技术方面的探索，主要取得以下成果：

微软将技术上的突破应用在如物体识别、人类情绪识别和文本文字识别等应用场景。

综合使用上述技术，就能看到非常有趣的落地应用，比如日本版微软小冰 Rinna 与人类对话的呈现。在水族馆，通过手机上的视觉感应，Rinna 可以看到你所看到的东西，可以和你进行对话，非常生动。这里面有视觉，也有语音，也有自然语言理解，Rinna 是将上述技术同时结合起来的应用。

媲美人类的计算机合成语音

在计算机视觉的探索之外，微软还在语音方面不断突破，目前微软的语音和语言技术在特定领域已经达到了可以媲美人类的水平。

王永东博士用自己录了一个小时的声音作为素材，然后通过语音合成技术，就可以生成与他的声音几乎一模一样的定制声音。

微软的语音技术在过去一段时间进展颇丰，尤其是在语音合成方面，声音的自然度已经接近和达到人类水平。

语音识别方面，也有不小进展，例如识别的精确度的提高。此外，微软对全球语言的覆盖范围很广，这对国内公司走向全球市场提供很大帮助。

在语音近场、远场不同的应用，以及语音助手唤醒词和语音识别模型方法上也取得突破。在一个会议的场景的演示中，会议室内布置麦克风和摄像头，当有人进入会议室时，计算机语音与计算机视觉技术的应用能够识别参会者，与参会者打招呼，通知会议的组织者等。系统通过识别不同人的声音和说话内容，利用机器翻译的功能，能够实现不同语言的参会人轻松交流。会议结束后，自然语言处理的能力还能够帮助会议纪要。

业界最好的自然语言处理技术

作为人工智能领域中的一个最具挑战性的技术，自然语言处理包括很多方面，比如机器阅读理解、机器翻译等。

微软在自然语言处理方面有长足的进步，并且把这些进步应用到了必应搜索引擎，Office 应用软件、微软小冰、微软小娜等多款产品中。用一个非常简单的搜索应用场景举例，比如搜索“姚明太太的身高”，通过理解自然语言，和海量公开信息检索以及微软所建立的知识图谱，计算机可以很快捷地找答案。

微软在中国市场的落地探索

关于微软在中国市场的探索，人工智能离不开云作为基础，微软 Azure 公有云服务在全球有着广泛的部署。通过云和边缘让 AI 为业务所用，涉及机器学习、知识挖掘和人工智能应用等多个方面。

微软人工智能产品，既可以提供人工智能平台，赋能企业的人工智能基础建设；也可提供人工智能中台型产品，使得企业能够根据自身的业务需要，构建中台，让前台的应用得以更加高效和灵活。

微软的全线人工智能技术，可以高效为企业的人工智能中台赋能。这些技术型产品和解决方案，能够大大地降低企业自建自研人工智能应用的门槛，让企业利用技术专注于解决自身的业务挑战、而不是被人工智能技术的高门槛所阻碍。目前微软的自然语言处理技术，已经提供给多个企业中台，帮助企业高效处理文本和海量信息，提升业务效率。

除了平台及中台型技术赋能产品，微软也为战略级别客户定制前台解决方案，涉足金融、制造、汽车、房地产、文化等多个领域。在金融应用的场景中，AI 可以被应用在股票的策略研究、交易复盘或者大数据平台。上市公司的公告摘要，原来可能需要人工提取，现在都是人工智能来完成，微软和万得资讯合作，10-20 秒就可轻松完成公告。

AI 甚至可自动产生内容，用语音做一个金融电台。内容和语音播报均为人工智能生产，可以大大提高生产效率。

广为知晓的“微软小冰”，就是用我们刚刚提到的平台、中台来做的一个应用案例，现在在国内外已经有庞大的用户群体。

微软小冰是能力很强的对话机器人，王永东博士主要介绍了微软小冰在人工智能创造方面的能力。微软小冰目前已出版了两本诗集，最近开始学习画画。通过对过往 400 年艺术史上 236 位著名人类画家画作的学习，微软小冰可在受到文本或其它创作源激发时，独立完成 100% 原创的绘画作品。

不管小冰做诗还是画画，人们都要给她一些灵感，比如给她一些词或者一个场景。给她一幅画，根据这幅画来写诗，也可以给她一个关键词或诗来作画。前不久小冰在中央美院举办的个人画展，受到很多观众的欢迎。

写诗、画画跟人工智能未来的应用、生产力的发展有什么样的关系？微软最近将小冰画画和设计的能力用到纺织工业中去，大家看到的人工智能设计的风格，不仅仅只是概念。通过微软小冰人工智能设计能力做出来的产品，已经进入市场，有领带、丝巾、衣服、雨伞等等。

虽然写诗的目的不是说要让她成为世界上最好的诗人，但是写诗创作的能力也可以有很广阔的应用场景。例如，可以应用在儿童故事创作中，或者为每位家长定制他们想要的儿童故事，这方面可以大大提高创作效率。

微软未来的 AI 之路要走向何方？

王永东博士认为，今天的人工智能处在技术发展很快，应用也开始落地的时期，但其实还有很长的路要走。把今天的人工智能和互联网做一个类比的话，今天的人工智能可能有点像大概 1999 年的互联网那样的状态。

从微软来看未来的发展，可以预见，在不久的将来，所有的企业及个人都将依存于云和边缘，万物互联、无处不在的计算和人工智能。以人为中心，多感官跨设备的体验。

在发展技术的同时，需要认真思考技术进步给我们带来的社会影响，以及我们因此将要面对的种种挑战。

微软作为一个世界领先的公司在这方面有很多的思考，比如出版《计算未来》这本书的内容就是微软的两位领导公开发布出的公司对人工智能在社会角色方面的思考。

同时，微软提出一些重要原则，比如负责任，透明，公平、可靠和安全，保障用户隐私和包容等，这些都是人工智能的发展至关重要的方面。微软内部设有人工智能道德委员会，微软一些人工智能方面技术的应用都要经过委员会的讨论和批准，在全公司达成共识，让人工智能更好地帮助用户，帮助人类社会向前发展。

人工智能的发展建立在一个开放的生态系统之上。微软目前已和多家单位、公司、学校、公益组织等达成合作，一起推动人工智能朝着对人类社会的有益的方向进展。

本文转自微信公众号“新智元”

了解更多：

后台入驻微软小冰

如果你很萌，请跟她一决高下！

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

京东Plus的隐藏特权，很多会员都没领取，白交了会员费...

呼吁四川大学澄清：1998年1月，川大有多少个“姜涛与爱人程月玲”？

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

多长高8厘米！国内知名专家首次公开“追高秘笈”！担心孩子长不高的家长速来！