“读文画图”，微软 AI 的想象力可能比你的还好！

Original 2018-01-19 DeepTech深科技

长按识别二维码，报名2018十大突破技术全球直播首发

此前，谷歌曾经教过人工智能如何涂鸦，不过这只是一些简单的线条，而更复杂的一些图案对于计算机来讲可能就会稍显困难。而现在，微软的研究人员已经利用人工智能技术实现了这一突破，他们可以做到将文字性的描述转成活灵活现的图像。

试想一下，你给出了一段描述，“画一只短嘴巴的黄色小鸟，而且它的翅膀必须是黑色的”然后计算机就按照你说的把这只鸟画出来了，怎么样，是不是很酷？

同时，微软首席研究员还特地强调，系统不是根据您的描述去图片库里寻找一张对应的图片，它完全是自己创作出一张图像，“计算机画出来的这只鸟可能并不存在于真实世界中，它只不过是计算机想象力的发挥而已！”

当然，任何新推出的技术都肯定或多或少面临着些许瑕疵，但不难想象，未来这项技术可以成为画家或室内设计师的得力助手，更远一点，甚至人们完全可以根据一个剧本就用计算机生成一部动画电影，想到这里，是不是所有的演员都会感到心头一颤！

微软的这个团队一开始是借助一个名为 CaptionBot 的 AI 系统来深入研究计算机视觉和自然语言处理的问题，该系统可以自动为照片添加字幕，之后，他们又创建了一个名为 SeeingAI 的 AI 系统，它的作用是为类似盲人的群体提供语音问答服务。

目前，这种计算机绘图的技术主要有两部分技术构成：生成对抗网络（GAN）和判断所生成图像质量的鉴别器（discriminator）。绘图计算机在被“灌输”了无数的图像和字母描述之后，它逐渐学会了哪种文字该匹配哪种图像。

最后，该团队还创建了一个用数学方法描述“人类注意力”的机制，这被用来从复杂的描述中获取有用的数据信息，就例如“红色的翅膀、尖锐的喙、黄色的翅膀”等等概念，这些概念对于机器来讲不是很好理解，所以需要转化成数学的方法来进行分析。

-End-

参考：

https://www.engadget.com/2018/01/18/microsoft-ai-draws-images-from-detailed-text/

本书灵感源于“TR35”，即《麻省理工科技评论》享誉全球的“35 位 35 岁以下科技创新青年”（MIT Technology Review 35）青年人才榜，如果你想一睹全球科技创新领导者背后的精彩事迹，你也一定不能错过这本书。

各大电商促销火热进行中，点击阅读原文预购直达