查看原文
其他

Elon Musk揭OpenAI研究新突破, 可在VR中自我学习的机器人(附论文)

2017-05-17 大数据文摘 大数据文摘

大数据文摘作品,转载具体要求见文末

编译 | Aileen 钱天培


导读:伊隆·马斯克(Elon Musk)作为联合创始人创办的非盈利人工智能研究公司OpenAI在不久前宣布:们新研究出了一款能够自主学习完成实际生活的人工智能系统,而它所需的学习资料仅仅是该任务在虚拟环境中的一次演示。


相关论文可以在大数据文摘后台(订阅号-大数据文摘-输入关键字)回复关键字“OpenAI”获取。


就在刚刚Elon Musk的一条推特又激起千层波(哪次不是呢…?):



OpenAI创建了一个机器人系统,完全在仿真中进行了训练,并部署在物理机器人上,机器人可以在看到任务完成一次之后就能学会执行这个新任务。

 

上个月,Elon Musk领导的OpenAI展示了这个机器人的早期版本,在那里他们使用域随机化(domain randomization)对其视觉系统进行了培训,即通过使用各种颜色,背景和纹理显示模拟对象,而不使用任何真实图像

 

现在,OpenAI开发并部署了一种新的算法,一次性模仿学习,让人们通过在VR中执行它来传达如何做一个新的任务。给定一个演示,机器人能够从任意的起始配置中解决相同的任务。


最聪明的机器人:只看一次就可复制行为


如果说模仿是最真诚的奉承的话,那OpenAI最新的机器人系统可是给人类拍足了马屁。只需观看一次展示,它就能成功复制人类的行为。这个由伊隆·马斯克合伙创立并掌舵的科研公司使用了两个分开的神经网络--视觉网络(vision network )和模仿网络(imitation network),开发出了这个“一次就中”的模仿学习系统。


首先,机器人运用一个视觉网络分析其摄像仪所见图像,用以确定实际物体所在位置(以视频中OpenAI的展示为例,这些物体就是桌上的木块)。虽然这一网络此前从未观测过真实的桌子和木块,它也能够完成这一识别。研究者们用数以千计的模拟图像替代实际观测来训练这一网络,而每一张图像代表了不同的灯光、材质以及物体的组合。


其次,机器人用一个模仿网络来决定人类在虚拟展示中所完成任务的意图。之后它就能在现实生活中完成这一任务了。同样的,这一网络的训练用到了成千上万的虚拟展示,但没有一个展示是实际发生的。


(视频全长2份51秒,请在WiFi条件下观看)

https://v.qq.com/txp/iframe/player.html?vid=f0504vj2e25&width=500&height=375&auto=0


一体被要求在现实中模仿一个虚拟展示时,它能够在观看一次展示之后就完成模仿任务。更厉害的是,即便任务的启示参数与展示中的不尽相同,它也能够顺利完成。比方说,在堆木块任务的学习中,此系统不需要那些木块被放在与展示中完全相同的位置。如果在展示中,蓝色的木块被堆在了白木块的上面,那么这系统就会复制这一做法——即便这些木块被放到了不同的位置。


新的学习方式


Elon Musk的众多其他事业不同(如特斯拉,SpaceX),OpenAI是一个非营利组织。其目的不是赚钱而是支持和引导人工智能创新。在这方面,它已经相当成功。

 

12月,该公司推出了一个开源平台Universe,用户可以使用游戏,网络浏览器和各种软件来测量和训练AI。本质上,该平台使AI能够复制人类如何使用计算机,这使得开发人员能够训练其系统来完成人类可以执行的任何基于计算机的任务



本周,OpenAI跟进发布了Roboschool,用于机器人仿真的开源软件。它具有十几个用户可以测试他们的机器人的环境,它与OpenAI Gym(一个工具包)集成在一起,它使开发人员能够发布和接收对研究工作的反馈,为他们提供一个支持AI开发的在线社区。



除了OpenAI,研究人员已经在寻找方法来教导机器人做各种事情: 从阅读到做梦。他们创建了可以自己学习的AI系统,甚至可以互相教授的AI系统。教育正在从根本上被颠覆,以满足这项新技术的需求,随着我们的机器伙伴的智慧化,我们的生活将变得更加轻松,更安全,而且更有趣。


相关论文可以在大数据文摘后台(订阅号-大数据文摘-输入关键字)回复关键字“OpenAI”获取。

 

👇戳阅读原文,填写问卷,获取福利


来源:https://blog.openai.com/robots-that-learn/,https://blog.openai.com/roboschool/ 



关于转载如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 | bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:zz@bigdatadigest.cn。
志愿者介绍

回复“志愿者”了解如何加入我们





往期精彩文章


点击图片阅读文章

Elon Musk 造访TED大会:超级工厂、特斯拉卡车和隧道交通网络



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存