查看原文
其他

斯坦福家政机器人火了!又翻车了!多数是真人操控编排的

未尽研究 未尽研究
2024-08-23


Mobile Aloha机器人这几天火了!确切地说,是视频火了。

视频中,Aloha机器人一口气烹饪三道常见粤式家常菜——蚝油生菜、干贝烧鸡、滑蛋虾仁,整个过程丝滑顺畅、行云流水,简直就是常年泡在厨房里的“老司机”。

该视频在网上病毒式传播,收获一大拨激动网友“哇哇哇”的赞叹声。

伴随着上面这个令人激动的炒菜视频一同出现的,还有一段名为“Mobile Aloha的一天”的视频:

视频中展示了Aloha机器人的“十八般武艺”:拉开窗帘、浇花、吸尘、拧瓶盖、倒垃圾等简单动作的家务活自然不在话下,包含更多精细动作、更复杂流程的家务也能轻松应对,比如洗衣:机器人将衣物放入洗衣机、打开洗衣凝珠袋子取出一颗凝珠放入洗衣机、顺便倒入一点衣物蓬松剂,然后关上洗衣机盖子,选择洗衣模式,最后启动洗衣程序;

最令人惊叹的是,机器人还能做各种极为精细的动作:将一件衣服的拉链对齐、一拉到底,并挂入衣柜中;它甚至还能在打开药瓶盖之后,精准地倒出一颗药,并倒好一杯水,服务病人吃药。

更“恐怖”的是,它还能拿着小玩具逗猫。看出来了吧,这个家政机器人,主打的是一个360度全方位沉浸式保姆式的关怀。

但是,这些是真的吗?这些视频以十倍的速度播放,而且经过精心的剪辑。

自爆“翻车”

正当网友们还在津津有味地讨论这个机器人能怎样像“田螺姑娘”一样把家务活都包圆的时候,Aloha机器人开发人员之一的Tony Zhao主动在网上放出了一段Aloha翻车集锦视频:

原来,擦桌上的红酒渍没那么一气呵成,它也会打翻酒杯;

炒虾仁也没有那么顺滑,锅子都烧黑了不说,连铲刀都怼不进锅子里;甚至把虾仁倒出来的时候,连盘子的位置都没找准;

甚至,它傻傻地连放一个锅子进橱柜这样的简单动作也搞砸了……

Tony Zhao自爆说:机器人还没有做好准备接管这个世界。他们只是“编辑了视频”。

原来,Aloha机器人有两种模式:自主模式和混合模式。前几天火爆全网的烹饪视频引发了极大的关注度,很多网友都认为,这是Aloha在自主模式下完成的。

Tony Zhao主动发布Aloha“翻车”视频,澄清此前视频中采用的是混合模式,并呼吁网友们去项目网站仔细阅读论文和代码。

低成本、全开源

Aloha机器人背后的团队来自斯坦福大学,其中两名为计算机科学专业的华人博士生。该机器人于今年3月底发布,历经8个月的迭代和2个月的测试。

ALOHA全称是“A Low-cost Open-source Hardware System”,是一个双手遥控操作硬件系统,不仅软硬件和数据全部开源,而且成本很低,开发团队甚至发布了搭建该系统的硬件清单及价格,全部配齐仅需3.2万美元左右。

据介绍,Aloha机器人系统借助ACT或扩散策略进行模仿学习,加上静态操作数据一起进行联合训练。通过这种方式,机器人性能可以得到显著提高,尤其是完成需要精确操作的任务。

就一些简单的动作而言,如洗锅、擦桌子、餐椅归位、呼叫并乘坐电梯等,在少量真人示范下,机器人大概学习50次可以达到90%左右的成功率。

像前两天爆火的炒菜和Aloha机器人的一天这两个视频中展示的操作,其实大部分是真人操控、示范的。

AI研究人员圈内,流行Demo or Die,他们也正在变成被AI耽误的视频制作高手。作为一名科学工作者,应该把真实的一面同时用视频展示出来。

一个月前,谷歌备受瞩目的新AI模型Gemini发布后,曾引发一场关于其宣传视频夸大性能、误导观众的争议。视频通过拼接提示词、语音、图像等合成,而且加快了响应速度,看起来跟真的一样,令人震撼。事后谷歌研究人员不得不出面解释。

Mobile Aloha项目网址是:https://mobile-aloha.github.io/,有兴趣的朋友可以去看一看。





修改于
继续滑动看下一个
未尽研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存