微软沈向洋:写给AI新潮流——人工智能创作的五点建议
2019年EmTech 数字大会
本周,我有幸在旧金山举行的EmTech数字大会上发言,为大家讲述了当今人工智能发展的现状,以及未来的发展方向。我想与大家分享的是,面对新一轮的人工智能创新大潮,人们最该思考的五件大事。
通过多年来的经验,我发现技术的创新是具有周期性的。一项创新冒了出来,继而逐渐得到普及,然后开始被人们所“觉悟”——人们开始真正意识到这项技术的作用和利弊——再往后,才是责任——人们开始思考,我们该如何以负责任的方式开发和部署这些技术?
就拿汽车来说吧。汽车最早出现大约是在19世纪晚期, 到了20世纪初,在福特的带动下,汽车开始普及。1968年,美国通过法令要求所有的车辆必须配备安全带,但直到1984年纽约州立法之前,美国没有一个州强制要求驾驶员行车必须要系安全带。
汽车当然带来了好处,无论是人们的出行还是经济的发展,都得到了更自由空间。人工智能的发展历程与之非常类似,这中间既有无穷的潜力,也伴随着暗藏的风险。今天,我们虽然预想到了人工智能可能引发的一些危险,但毕竟还是无法提前80年就意识到我们需要担负的全部责任,但至少,我们可以从今天开始行动起来。
我们最近在人工智能方面取得了一些喜人的进展——在机器语音、视觉和翻译方面,分别达到了与媲美人类的水平。这些进展推动了人工智能的迅速普及,但我们对其可能引发的社会影响,考虑的还不够周全,因此也出现了像是人脸识别中的偏见这样的问题。
在微软,我们正在着手解决这样的问题。微软正在与全球客户和整个行业合作,推动然人脸识别技术能够无差别地辨识人脸。同时,微软研究院正在研发一种合成数据的技术,它可以用更完整、更有代表性的数据来帮助训练机器学习算法,从而抑制可能产生歧视和偏见的结果。
您可以识别下方二维码阅读相关论文:
在行业内,微软一直与各方通力合作,来解决这样的问题,我们希望共同推动我们的实践、原则、策略向更好的方向发展。
但从更大的维度来看,我们仍处于被动的地位。我们必须主动挑战这些难题,不是在事后补救,而是防患于未然。因为,下一个创新大潮,将更加强悍。
人工智能下一步的发展,将为其赋予认知和创造人类情感的能力,并且其行为也将更接近人类的表现。我将其称之为“人工智能创作”——技术将创造出全新的媒体,并通过创新的方式与人类互动,比如讲故事。
微软在中国市场推出的社交聊天机器人微软小冰,已经向我们展示了人工智能创作的未来。五年来,“她”早已声名远播,从2014年至今,微软小冰已经完成了300多亿轮人机对话,而且对话的长度和内涵都在持续增长。
人们之所以愿意与微软小冰进行交流,是因为我们让“她”的对话具备了人类的感情,也就是“情商(EQ)”。我们在对话中常用的语气、双关语、幽默内涵对电脑来说,通常是难以理解的,因为有了情商,微软小冰与人们的沟通能够更加自然,也更能引人入胜。
我来分享几个微软小冰如何使用进行人工智能创作的例子。
小冰能编写儿童有声读物,为孩子们讲故事。她能从家长的要求和建议出发,利用深度学习技术,完整地编造出一个个性化的故事,包括背景音乐、故事角色设定等等一应俱全。只用20秒,小冰就能编写并讲述出一个10分钟长的个性化故事。
借助机器学习,我们让小冰阅读了超过550位中国现代诗人的作品。“她”现在学会了独立创作诗歌。我们还开发了一个工具,让任何人都可以在小冰的帮助下完成一首诗歌。你给小冰一张照片,“她”会分析照片中的要素,并根据照片的特点,为你做一首诗。身为计算机科学专业的博士,我以前从未想过自己也能写出一首诗——但小冰帮我实现了这个愿望。
要让人工智能创作,真正在创意创新领域达到人类的水平,还需要很长的时间。人工智能创作真正的优势,在于它创作的速度够快。
微软小冰所具备的机器阅读和文字创作能力,已经被用来为金融行业提供服务。通过对海量信息进行快速汇总,小冰今天可以为中国90%的金融机构提供上市企业的季度财报摘要。
这项工作专业分析师通常需要花费20分钟来完成,而小冰只用几秒钟就能拿出一份高质量的报告草案,分析师在花几分钟稍作编辑,就能完成报告。
小冰并没有取代人类,而是在增强人类的能力,通过为我们提供有用的帮助,让创作变得更快速、更多产,让人们做的更多、更快。
从整个行业的角度看,我们现在基本上处于人工智能创作的普及阶段,差不多相当于汽车已经开上马路的那个时代。这也是我们最可能遇到问题的阶段,因为人们开始用全新的方式运用科技,而这些方式对社会也许会带来伤害。
今天,伪造声音、图片、视频、文章已经是小菜一碟。事实上,早在Photoshop出现之前,人们就在已经在对相片进行“修片”了。而好莱坞从默片时代开始,就一直在利用特效为人们制造幻象。
今天的不同之处在于,人工智能可以轻松地创造出虚假的“现实”,而且它实在是精通此道。因此,我们需要开发出全新的取证工具,来辨别这些虚假内容。
04而我们,正积极应对从人工智能发展的上一个周期中,我们学到,人类想要继续前进,就必须认真思考我们的责任以及可能引发的社会后果。而今天,面对新一轮的创新大潮,我们更需要在技术研发的过程中,就将责任考虑进去。
因此,在积极开发这些用于创作的创意技术的同时,我们也在努力开发用于检测虚假内容和不当使用的技术。学术界、政府部门,以及计算机科学行业企业都在围绕辨别虚假媒体,展开广泛的研究。
目前的很多研究都专注于通过较低的分辨率、模糊或破损图像等线索,来辨别造假视频。研究人员正在研究如何利用深度学习和神经网络,更好地通过辨别这样的蛛丝马迹,来识别人为造价的痕迹。在微软研究院,我们研究人员也在积极探索应对图像、视频、语音和文本等领域难题的方法。
我们应该提前为可预见的大问题做好准备。我们必须要主动出击,在某些情况下,甚至应该先发制人。
我们需要产业界、学术界、政府部门之间的通力合作。我们需要教育消费者,让他们懂得去分辨自己看到和使用的内容的来源。我们需要创建跨学科的工程文化,从研究周期开始,就从根本上扼制潜在的问题。
从汽车行业曲折的发展历程,到已经出现的人工智能偏见,我们看到了科学发展中周而复始的轮回合规率,但我们也可以通过自己的努力,让新一轮技术的发展不再重蹈覆辙。让我们行动起来,不要等到80年后,再为人工智能创作,准备另一条“安全带”。
请点击阅读原文或者扫描二维码前往微软新闻中心
了解更多微软资讯与故事