其他

“读文画图”,微软 AI 的想象力可能比你的还好!

2018-01-19 DeepTech深科技

长按识别二维码,报名2018十大突破技术全球直播首发

 

此前,谷歌曾经教过人工智能如何涂鸦,不过这只是一些简单的线条,而更复杂的一些图案对于计算机来讲可能就会稍显困难。而现在,微软的研究人员已经利用人工智能技术实现了这一突破,他们可以做到将文字性的描述转成活灵活现的图像。


试想一下,你给出了一段描述,“画一只短嘴巴的黄色小鸟,而且它的翅膀必须是黑色的”然后计算机就按照你说的把这只鸟画出来了,怎么样,是不是很酷?

 


同时,微软首席研究员还特地强调,系统不是根据您的描述去图片库里寻找一张对应的图片,它完全是自己创作出一张图像,“计算机画出来的这只鸟可能并不存在于真实世界中,它只不过是计算机想象力的发挥而已!”

 

当然,任何新推出的技术都肯定或多或少面临着些许瑕疵,但不难想象,未来这项技术可以成为画家或室内设计师的得力助手,更远一点,甚至人们完全可以根据一个剧本就用计算机生成一部动画电影,想到这里,是不是所有的演员都会感到心头一颤!

 

微软的这个团队一开始是借助一个名为 CaptionBot 的 AI 系统来深入研究计算机视觉和自然语言处理的问题,该系统可以自动为照片添加字幕,之后,他们又创建了一个名为 SeeingAI 的 AI 系统,它的作用是为类似盲人的群体提供语音问答服务。

 

目前,这种计算机绘图的技术主要有两部分技术构成:生成对抗网络(GAN)和判断所生成图像质量的鉴别器(discriminator)。绘图计算机在被“灌输”了无数的图像和字母描述之后,它逐渐学会了哪种文字该匹配哪种图像。

 

最后,该团队还创建了一个用数学方法描述“人类注意力”的机制,这被用来从复杂的描述中获取有用的数据信息,就例如“红色的翅膀、尖锐的喙、黄色的翅膀”等等概念,这些概念对于机器来讲不是很好理解,所以需要转化成数学的方法来进行分析。

 

-End-


参考:

https://www.engadget.com/2018/01/18/microsoft-ai-draws-images-from-detailed-text/


本书灵感源于“TR35”,即《麻省理工科技评论》享誉全球的“35 位 35 岁以下科技创新青年”(MIT Technology Review 35)青年人才榜,如果你想一睹全球科技创新领导者背后的精彩事迹,你也一定不能错过这本书。


各大电商促销火热进行中,点击阅读原文预购直达

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存