OpenAI机械手臂 无需训练就能完成人类动作
在婴儿时期,我们学的第一件事就是用手抓东西,但是这个动作并不简单,并且会随着人类的成长而变得更加复杂多样,这一复杂性让机器很难学习这一人类行为。Elon Musk和Sam Altman等人联合建立的人工智能非营利组织OpenAI的研究人员创建了一个系统,这个系统不仅能够像人类一样抓握和控制物体,还能够自己领悟出类似人类的行为。
很多的机器人和机械手臂已经能够熟练地完成特定的抓握或者其它动作——工厂里的机器人能够比人类更加灵活地使用螺钉枪。但是能够让机器人很好地完成这一任务的软件似乎是手写的,而且是特别针对这个应用程序所编写。例如,你并不能给机器人一支笔,然后让它去写东西。即使在同一生产线上,像焊接等任务就需要一个全新的系统。
但是对于人类来说,拿起一个苹果和拿起一个杯子的动作大同小异。其中会有些不同,但是我们的大脑会自动地填补这一空缺,我们也能够随机应变,想出一个新的抓取动作,安全地握住一个不熟悉的物体等等。在这一领域,机器人远远地落后于人类模型。甚至,你不能训练机器人去做人类能够做的事——你必须向它提供上百万种案例,以便充分地显示人类会对上千种物体做出哪些动作。
OpenAI的研究人员认为,解决方案就是不使用人类数据。相反,他们让计算机在模拟中一次次地尝试,一次次地失败,慢慢地学习如何移动手指,以便在机器人手中握住的物体能够按照想要的方式移动。
他们将这个系统称为Dactyl,研究人员只为该系统提供了手指的位置和手中物体的三个摄像头视角——但是要记住,当这个系统经过训练之后,会对所有的数据进行模拟,而且这一模拟是在虚拟的环境下进行。因此,计算机并不需要实时工作——它能够在数秒之内尝试上千种不同抓取物体的方式、分析结果、实时更新数据,以便进行下一次试验。(这个手臂是Shadow Dexterous Hand,要比大多数的机械手臂复杂得多。)
系统需要学习的东西,除了不同的物体和手势,还有一些随机的参数,如指尖的摩擦力大小,模拟场景的颜色和灯光等。你不能对现实生活的每一个方面都进行模拟,但是你要确保这个系统并不是只能在蓝色的房间里工作,或者只能移动有特殊标记的方块。
为了解决这一问题,研究人员使用了6144颗CPU和8颗GPU,“在50小时之内就能完成100年的训练经验。”然后他们将这个系统首次应用到现实世界中,这个系统也展示了和人类类似的行为。
我们一般不会察觉,在我们用手完成一些动作时,如转动苹果看苹果有没有擦伤,或者给朋友递一大杯咖啡,都使用了手上的很多细小部位来使物体保持稳定或者移动物体。Dactyl自己也重新创造了其它的动作,例如用大拇指和手指头来托起物体,然后使用剩余的手指来拨动物体朝向目标方向。
这个系统的强大之处不仅仅是能够自然地完成动作,并且在经历过试验和失败之后也能独立的完成,但是这个系统还没有涉及到物体具体的形状或者种类。就和人类一样,Dactyl能够理所当然地抓住和控制放置在它手上的任何东西。
我们将这种灵活性称之为泛化,对于必须和现实世界交互的机器人来说,这是很重要的。为现实世界中每一个物体和场景都编写独立的行为代码是不现实的,但是机器人能够依靠一套其自身的核心理解方式来适应和弥补这一空缺。
描写试验结果(包括OpenAI所完成其它任务)的论文现在可以免费使用,以及研究人员用于创建和测试Dactyl的工具也可以免费使用。
原文作者:Devin Coldewey
编译:信息化观察网
往期精选
围观
热文