微软沈向洋：写给AI新潮流——人工智能创作的五点建议

查看原文

其他

微软沈向洋：写给AI新潮流——人工智能创作的五点建议

沈向洋微软科技 2020-02-14

2019年EmTech 数字大会

本周，我有幸在旧金山举行的EmTech数字大会上发言，为大家讲述了当今人工智能发展的现状，以及未来的发展方向。我想与大家分享的是，面对新一轮的人工智能创新大潮，人们最该思考的五件大事。

01技术创新具有周期性，而且在不断加速

通过多年来的经验，我发现技术的创新是具有周期性的。一项创新冒了出来，继而逐渐得到普及，然后开始被人们所“觉悟”——人们开始真正意识到这项技术的作用和利弊——再往后，才是责任——人们开始思考，我们该如何以负责任的方式开发和部署这些技术？

就拿汽车来说吧。汽车最早出现大约是在19世纪晚期，到了20世纪初，在福特的带动下，汽车开始普及。1968年，美国通过法令要求所有的车辆必须配备安全带，但直到1984年纽约州立法之前，美国没有一个州强制要求驾驶员行车必须要系安全带。

汽车当然带来了好处，无论是人们的出行还是经济的发展，都得到了更自由空间。人工智能的发展历程与之非常类似，这中间既有无穷的潜力，也伴随着暗藏的风险。今天，我们虽然预想到了人工智能可能引发的一些危险，但毕竟还是无法提前80年就意识到我们需要担负的全部责任，但至少，我们可以从今天开始行动起来。

我们最近在人工智能方面取得了一些喜人的进展——在机器语音、视觉和翻译方面，分别达到了与媲美人类的水平。这些进展推动了人工智能的迅速普及，但我们对其可能引发的社会影响，考虑的还不够周全，因此也出现了像是人脸识别中的偏见这样的问题。

在微软，我们正在着手解决这样的问题。微软正在与全球客户和整个行业合作，推动然人脸识别技术能够无差别地辨识人脸。同时，微软研究院正在研发一种合成数据的技术，它可以用更完整、更有代表性的数据来帮助训练机器学习算法，从而抑制可能产生歧视和偏见的结果。

您可以识别下方二维码阅读相关论文：

在行业内，微软一直与各方通力合作，来解决这样的问题，我们希望共同推动我们的实践、原则、策略向更好的方向发展。

但从更大的维度来看，我们仍处于被动的地位。我们必须主动挑战这些难题，不是在事后补救，而是防患于未然。因为，下一个创新大潮，将更加强悍。

02人工智能创作，引领新一轮人工创新大潮

人工智能下一步的发展，将为其赋予认知和创造人类情感的能力，并且其行为也将更接近人类的表现。我将其称之为“人工智能创作”——技术将创造出全新的媒体，并通过创新的方式与人类互动，比如讲故事。

微软在中国市场推出的社交聊天机器人微软小冰，已经向我们展示了人工智能创作的未来。五年来，“她”早已声名远播，从2014年至今，微软小冰已经完成了300多亿轮人机对话，而且对话的长度和内涵都在持续增长。

人们之所以愿意与微软小冰进行交流，是因为我们让“她”的对话具备了人类的感情，也就是“情商（EQ）”。我们在对话中常用的语气、双关语、幽默内涵对电脑来说，通常是难以理解的，因为有了情商，微软小冰与人们的沟通能够更加自然，也更能引人入胜。

我来分享几个微软小冰如何使用进行人工智能创作的例子。

小冰能编写儿童有声读物，为孩子们讲故事。她能从家长的要求和建议出发，利用深度学习技术，完整地编造出一个个性化的故事，包括背景音乐、故事角色设定等等一应俱全。只用20秒，小冰就能编写并讲述出一个10分钟长的个性化故事。

借助机器学习，我们让小冰阅读了超过550位中国现代诗人的作品。“她”现在学会了独立创作诗歌。我们还开发了一个工具，让任何人都可以在小冰的帮助下完成一首诗歌。你给小冰一张照片，“她”会分析照片中的要素，并根据照片的特点，为你做一首诗。身为计算机科学专业的博士，我以前从未想过自己也能写出一首诗——但小冰帮我实现了这个愿望。

要让人工智能创作，真正在创意创新领域达到人类的水平，还需要很长的时间。人工智能创作真正的优势，在于它创作的速度够快。

微软小冰所具备的机器阅读和文字创作能力，已经被用来为金融行业提供服务。通过对海量信息进行快速汇总，小冰今天可以为中国90%的金融机构提供上市企业的季度财报摘要。

这项工作专业分析师通常需要花费20分钟来完成，而小冰只用几秒钟就能拿出一份高质量的报告草案，分析师在花几分钟稍作编辑，就能完成报告。

小冰并没有取代人类，而是在增强人类的能力，通过为我们提供有用的帮助，让创作变得更快速、更多产，让人们做的更多、更快。

03人工智能创作，带来的新挑战

从整个行业的角度看，我们现在基本上处于人工智能创作的普及阶段，差不多相当于汽车已经开上马路的那个时代。这也是我们最可能遇到问题的阶段，因为人们开始用全新的方式运用科技，而这些方式对社会也许会带来伤害。

今天，伪造声音、图片、视频、文章已经是小菜一碟。事实上，早在Photoshop出现之前，人们就在已经在对相片进行“修片”了。而好莱坞从默片时代开始，就一直在利用特效为人们制造幻象。

今天的不同之处在于，人工智能可以轻松地创造出虚假的“现实”，而且它实在是精通此道。因此，我们需要开发出全新的取证工具，来辨别这些虚假内容。

04而我们，正积极应对

从人工智能发展的上一个周期中，我们学到，人类想要继续前进，就必须认真思考我们的责任以及可能引发的社会后果。而今天，面对新一轮的创新大潮，我们更需要在技术研发的过程中，就将责任考虑进去。

因此，在积极开发这些用于创作的创意技术的同时，我们也在努力开发用于检测虚假内容和不当使用的技术。学术界、政府部门，以及计算机科学行业企业都在围绕辨别虚假媒体，展开广泛的研究。

目前的很多研究都专注于通过较低的分辨率、模糊或破损图像等线索，来辨别造假视频。研究人员正在研究如何利用深度学习和神经网络，更好地通过辨别这样的蛛丝马迹，来识别人为造价的痕迹。在微软研究院，我们研究人员也在积极探索应对图像、视频、语音和文本等领域难题的方法。

05主动出击，先发制人

我们应该提前为可预见的大问题做好准备。我们必须要主动出击，在某些情况下，甚至应该先发制人。

我们需要产业界、学术界、政府部门之间的通力合作。我们需要教育消费者，让他们懂得去分辨自己看到和使用的内容的来源。我们需要创建跨学科的工程文化，从研究周期开始，就从根本上扼制潜在的问题。

从汽车行业曲折的发展历程，到已经出现的人工智能偏见，我们看到了科学发展中周而复始的轮回合规率，但我们也可以通过自己的努力，让新一轮技术的发展不再重蹈覆辙。让我们行动起来，不要等到80年后，再为人工智能创作，准备另一条“安全带”。

请点击阅读原文或者扫描二维码前往微软新闻中心

了解更多微软资讯与故事

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

哈里斯女粉搞4B运动、毒杀丈夫，回旋镖能否让美国“血流成河”

这把绝对高端局，只有中国人才懂

许纪霖：珠海驾车撞人事件的背后，弦绷得太紧了，要给人们以松弛感 | 二湘空间