速递 | Figure 的新型仿人机器人利用 OpenAI 进行自然语音对话,获得OpenAI投资支持
图片来源:Figure
据TechCrunch报道,Figure 推出了最新的仿人机器人 Figure 02。正如它的名字所提示的那样,该系统是 2023 年发布的 Figure 01 机器人的后续产品。最初的预告视频与我们从其他仿人机器人上看到的视频类似,与消费电子产品视频相呼应,而不是机器人动作的原始演示。
周二发布的另一段视频展示了机器人在Figure办公室中间搭建的演示区地板上缓慢、屈腿的步态。背景中还出现了另外两个机器人,它们正在搬运手提箱--这是大多数这些人形机器人最大的开箱即用的应用。
图片来源:Figure
这次最引人注目的新成员是与 OpenAI 的长期合作,OpenAI 在今年 2 月帮助 Figure 完成了 6.75 亿美元的 B 轮融资,使这家南湾公司的估值达到 26 亿美元。
神经网络的主流爆发对整个机器人行业都很有吸引力,但仿人机器人开发人员对这项技术尤其感兴趣。这种外形的主要卖点之一是它能够在工厂车间里与人类同事有效地并肩工作--当然,前提是采取了适当的安全措施。图 02 装有扬声器和麦克风,可以在工作时与人交谈和倾听。
图片来源:Figure
ChatGPT 和 Google Gemini 等模型因其自然语言功能而备受推崇,开创了智能助理和聊天机器人的新领域。为这些系统配置自然语言功能并不难:这样做既能帮助人类指导机器人,同时又能增加机器人在任何特定时间所做事情的透明度。
在处理仿人机器人时,这样的交流加倍重要,因为这些系统的设计目的是在没有安全笼的情况下自由游走。尽管它们的设计与人类相似,但重要的是不要忽视它们仍然是又大又重的移动金属,具有潜在的危险性。语音与视觉和近距离传感器相结合,可以成为一种重要的安全工具。
在这项工作中,Figure 当然不是孤军奋战。去年年底,Agility展示了其利用生成式人工智能改善人机交流的工作。在谷歌日常机器人团队被关闭之前,神经网络的使用曾是该团队的工作点。与此同时,埃隆-马斯克(Elon Musk)表面上负责Grok AI和Optimus两个项目,毫无疑问,这两个项目迟早会实现对接。
OpenAI则在这一领域进行了一些对冲。在投资Figure之前,该公司支持挪威公司1X。不过,在过去的一年里,Figure 在业内的知名度大大提高。上述 B 轮投资还包括微软、亚马逊、英伟达(Nvidia)和英特尔资本(Intel Capital)等其他顶级科技公司。
图片来源:Figure
图最近开始与宝马合作进行试点。今年 6 月,该公司发布了一段视频,展示了早期的系绳型机器人在神经网络的帮助下在地板上自主执行任务的情况。
该公司指出,02 机器人已经进入了该汽车制造商位于南卡罗来纳州斯帕坦堡的工厂,以进行培训和数据收集。我们仍处于这些合作的早期阶段。Agility、Apptronik 和 Sanctuary AI 也宣布与汽车制造商开展类似的试点项目。而波士顿动力公司的所有者现代汽车公司也把目光投向了在自己的工厂里制造人形机器人。
Figure 称 01 和 02 之间的 "硬件和软件重新设计 "是 "通信 "的一部分。其中还包括 6 个 RGB 摄像头、板载视觉语言模型、改进的 CPU/GPU 运算和改进的 16 自由度双手。
手一直是仿人机器人领域的热门话题。关于设计者应如何贴近人类的手,众说纷纭。
虽然人类的手因其精致和过度工程化而饱受批评,但我们的附肢的灵活和灵巧还是有很多可取之处的。Figure公司则一直致力于使用类似人类的手作为其系统的终端执行器。
尽管该公司暗示了在仓库/工厂车间之外的更广阔的未来,但我们还不知道在更大范围内推广 Figure 02 的时间表。该公司写道:"Figure 的机器人结合了人类的灵巧和先进的人工智能,可以在商业应用中执行各种任务,在不久的将来,还可以在家庭中执行任务。"
编译:ChatGPT
-----------END-----------