【Science】机器人从单一演示中学习并相互传授技能，AI迈出统治世界第一步？

查看原文

其他

【Science】机器人从单一演示中学习并相互传授技能，AI迈出统治世界第一步？

2017-05-12 新智元

新智元编译

来源：sciencemag.org

作者：Matthew Hutson

编译：张易

新智元启动 2017 最新一轮大招聘： COO、总编、主笔、运营总监、视觉总监等８大职位全面开放。

新智元为COO和执行总编提供最高超百万的年薪激励；为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。加盟新智元，与人工智能业界领袖携手改变世界。

简历投递：jobs@aiera.com.cn HR 微信：13552313024

【新智元导读】Science报道，即将举行的 IEEE机器人与自动化国际会议上（IEEE-ICRA）有一项 MIT 的研究，提出了一个可从单一演示中学习多步骤操作任务，并在多个机器人中共享技能的系统——C-Learn。

不远的未来，机器人助理就会成为我们日常生活的一部分——但愿教它们新任务的时候不用非得编程。要是非得先学编程才能使用机器人，那这顿饭还是我自己做吧。现在，一个新系统让教机器人就像教孩子一样容易（也许不那么容易？）不过这回机器人统治论者又有了新口实，因为机器人可以用这个新系统互相之间分享技能了。训练机器人有两个基本方法。一个是为它的行动编程，这要求时间和编写代码的技能；另一个是把你想让它做的事演示给它看，摆弄它的实体或者移动它的数字表征都行，也可以做出样子来让它模仿。但一些任务的精确程度不是人类能轻松做出样子的——比如拆除炸弹引信之类的。

现在，用一个叫作 C-LEARN 的系统，科学家们赋予了机器人知识，这些知识表现为一些简单的步骤，在学习新任务时，机器人可以智能地应用这些知识。

“（C-LEARN）实用又有效。”并未参与本项研究的加州伯克利大学机器人专家 Anca Dragan 说。

C-LEARN 从单一演示中学习多步骤操作，并可实现机器人间的技能共享

在这个系统中，人类用户首先帮助构建机器人的知识库。研究人员通过在软件程序中点击并拖动其四肢，教导了一个名叫 Optimus 的双臂机器人。他们展示了诸如抓住圆柱体的顶部或块的侧面这样的动作，从不同的位置进行了七次任务。每次运动都有轻微的变化，机器人就会寻找模式，然后将其整合到系统中。例如，如果抓手总是最终大致平行于物体，则机器人将推断并行度是该过程的重要约束（constraint）。

在这一点上，机器人是“像一个2岁的宝宝，只是知道如何够到某个东西并抓住它。”研究负责人、MIT 计算机科学家 Claudia Pérez D'Arpino 说。凭借其知识库，机器人只需一次演示即可学习新的多步骤任务。用户使用 C-LEARN 软件向机器人展示所需的任务，然后批准或纠正机器人的尝试。非常简单易行。

没有参与本研究的西雅图华盛顿大学机器人专家 Maya Cakmak 说：“十多年前机器人就可以遵从几何约束了，然而，此前只有专家才能够使用它们。”

为了测试系统，研究人员教了Optimus 四个多步骤任务：拿起一个瓶子放在一个水桶里；用双手抓住并抬起一个托盘；用一只手打开一个盒子，然后用另一只手按下盒子中的一个按钮；用一只手抓住一个立方体上的把手，并用另一只手把一根杆子直拉出立方体。对于每个任务，Optimus 接受了一次演示，并进行了10 次尝试。 40 次尝试中，一共成功37 次，研究人员将于本月晚些时候在 ICRA 会议上进行报告。

为了增加挑战难度，研究人员将 Optimus 的知识库及其对四项任务的计划转移给了机器人Atlas ，Atlas 是个始终能保持平衡的双足机器人。Atlas 设法完成了四项任务。但是当研究人员删除掉一些转移的知识——例如保持某些移动平行的约束后，它失败了。

这种知识转移会有实际的应用价值。D'Arpino 说：“你能教一个德国工厂里的机器人做的事，没理由不能转移到加拿大的另一个机器人身上。”当然，那些认为未来一片黑暗的悲观主义者关心的是，通过互联网互相传递新技能将成为机器人统治世界的第一步。

D'Arpino 目前正在考察人类与 Optimus 的首次互动是否就可以教会它新的技巧。虽然还不能讨论过多细节，但迄今为止前景乐观。接下来，她希望教会机器人灵活地即时调整自己学到的技能。

最终目标之一是教会机器人拆弹，这个任务对精确性要求很高。机器人需要快速、高精度地引导。其他应用包括发现大灾中的人类、制造电子产品、帮助患病或懒惰的人做家务。“这是家居机器人的发展方向，但问题是现在它们什么都做不来。”D’Arpino说，“除了吸尘，现在的机器人还能给你做什么？这真的挺难的。”她希望能改变这个现状。

论文摘要

《C-LEARN：自动化分享中多步骤操作演示的几何约束学习》

（C-LEARN:Learning Geometric Constraints from Demonstrations for Multi-Step Manipulation in Shared Autonomy）

从演示中学习已被证明是非专家将操作性任务教给机器人的一种成功方法。这些方法通常从示范中构建生成模型，然后使用回归来重现技能。然而，这种方法对于捕获任务施加的硬性几何约束具有局限性。另一方面，虽然基于采样和优化的运动规划也将几何约束作为行动根据，但是这些操作通常是由专家精心手工制作的。为了解决这个技术差距，我们提出了 C-LEARN 系统。C-LEARN 是一种从演示中学习多步操作任务的方法，它将演示看作是一系列关键帧和一组几何约束。该系统构建了一个知识库，用于触达和抓取对象物体，然后利用该知识库从单一演示中学习多步骤任务。C-LEARN 支持具有多个终端执行器的多步骤任务；根据 SE（3）体积分析和 CAD 约束——如需要保持两轴平行——来进行动作；并提供了一种方法，原则上可以在多个机器人之间转移学到的运动技能。我们将所学任务的执行嵌入到共享的自动化框架中，并通过分析使用双臂 Optimus 机器人执行物理任务的成功率来评估我们的方法，比较不同约束模型的贡献，并通过在模拟中使用腿式双臂Atlas机器人来执行学到的任务，展示出了 C-Learn 转移所学任务的能力。

链接：http://www.sciencemag.org/news/2017/05/look-out-robots-could-soon-teach-each-other-new-tricks

新智元招聘

新智元日前宣布，获6家顶级机构总额达数千万元的PreA轮融资，蓝驰创投领投，红杉资本中国基金、高瓴智成、蓝湖资本、蓝象资本跟投。本轮融资将用于新智元团队规模扩充并增加新产品服务线，目标打造 To B 的人工智能全产业链服务平台。

职位：客户总监

职位年薪：30 - 60万（工资+奖金）

工作地点：北京-海淀区

所属部门：客户部

汇报对象：COO

下属人数：8 人

年龄要求：25 岁至 40 岁

性别要求：不限

工作年限：5 年

语　　言：英语 + 普通话

学历要求：全日制统招本科

职位描述：

热爱人工智能，在行业内有一定的人脉资源和影响力；
为客户制定媒体关系策略和公关活动策划，达成客户的市场或传播目标；
负责监督公关项目的计划和实施，使项目能按期在预算内完成；
积极拓展客户资源，开发公司业务，与既有客户保持紧密的业务联络和沟通；
监督、管理及考核客户服务团队，全面提升公司客户服务质量；
理工科背景优先，有知名企业或知名媒体机构工作经验者优先。

应聘邮箱：jobs@aiera.com.cn

HR微信：13552313024

新智元欢迎有志之士前来面试，更多招聘岗位请点击【新智元招聘】查看。

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

券商大佬卸任，曾任多家券商及公募基金一把手！

有些秘密注定只被少数人知道.....2024我们不再错过

提个醒：营养是鸡蛋的15倍，是牛奶的8倍，春夏多吃，免疫力明显提高，全家受益！