特斯拉Optimus机器人太拉垮?别急,这只是造人的第一步
不同于此前发布的概念机器人,真正露面的原型机更像小米的Cyberone。
Cyberone占了先机至少给人惊喜,而对Optimus,许是期望太高,当看到站在聚光灯下的开发平台原型裸露的电线,笨拙的身形,脑中一闪而过的是,就这?
有人形容,小米的Cyberone走路像小脚老太太,特斯拉的Optimus则像坐轮椅的瘫痪老头。
而小米发布会上,雷军表示目前Cyberone的成本还需要六七十万,因而暂时无法做量产,还需要深度开发降低成本。
Optimus作为AI DAY最大的重磅,除了展示整体进展外,团队还从各个部位详细讲解了Optimus的原理。
此外,特斯拉团队还详细介绍了其在全自动驾驶(FSD)和超级计算机Dojo上的进展。
本次会前,马斯克曾在推特上明确称此次活动主要是为了招聘:请注意,此活动旨在招聘 AI 和机器人工程师,因此技术含量很高。
01.
Optimus能做到什么?
现场露面的Optimus开发版在台上展示了一圈后便下场离去。马斯克表示,其实Optimus能做很多动作,但因为怕它在台上摔倒,所以选择了用视频方式展示。
这款原型机的软硬件能力具备以下7大特点:
但虽然软硬件在当今已是一流水平,但视频中的Optimus动作还有些颤抖,但能从仓库中搬重物,能像人类一样拿起水壶浇花,还能将特定的物体精准地放置到固定位置。
不过,看得出此次在AI DAY上发布Optimus原型机对特斯拉来说其实还是仓促的。原计划AI DAY是在8月举办,而为了能来得及展示Optimus,才将其推迟到了9月30日,国内则是10月1日。
开发版的Optimus于今年2月完工。随后,特斯拉又展示了其最新版本的Optimus,已经覆盖了部分“皮肤”,据马斯克介绍,目前还不会走,只能静态展示,但应该几周内就能走了,将更像成品。
停在 AI DAY举办地点附近的一辆Tesla Semi上的涂鸦展示了Cybertruck的生产场景。
可以看出,未来,将不是由人类来制造Cybertruck,而是Optimus。
在去年的AI DAY上发布Optimus时,马斯克就曾表示:
而在随后的问答环节,马斯克更是表示,其实解决了机器人的智能和运动问题,它能为你做什么就是非常自然的事,你可以让它为你做任何事。
特斯拉为Optimus设计了高效的能耗模式,在静坐和行走时有不同的能耗,可提高能量利用效率。
2.3kWh的电池包可供机器人一天的电量,而其大脑则同样使用了特斯拉自研的芯片。
▲特斯拉工作人员通过穿戴式设备输入动作,机器人通过神经网络学习,从在同一地点完成相同的动作,到进化推演出在其他场景下的方案,从而学会在不同环境中搬运不同的物品。
客观来看,Optimus两款原型机的表现,马斯克当前至少解决了人形机器人以下几个问题:
1、直立行走,不怕摔倒碰撞,具有规避行人的能力;
2、可看可感知周围事物;
3、实现了部分如浇花、搬运、送货等简单行为;
4、有了一双有关节,有感知的双手;
02.
自动驾驶新进展不多
来到自动驾驶环节。
据特斯拉Autopilot负责人Ashok Ellaswamy介绍称,目前特斯拉FSD Beta版拥有客户16万人,而去年同时期仅2000人。
Ashok介绍了特斯拉FSD系统的运行流程。
FSD的主体神经网络框架包括空间占用和车道及物体检测。
将经过自动标注、仿真、数据引擎的训练数据喂给算法,形成完整的迭代过程。之后将这套算法部署在车端,完成自动驾驶任务。
此外,特斯拉FSD团队还解释了使用FSD系统的车辆如何与其他道路参与者交互并做出决策。每一个决策背后都有诸多影响因素,同时,需要对不同的物体指标进行衡量。在此过程中,海量的真实道路数据对于系统学习意义重大。
后台训练方面,特斯拉目前的计算集群,由14,000个GPU构成,其中4000个GPU用来标记,10,000个GPU用来训练。可以大大加快计算速度。
在3D标注方面,特斯拉开发了一种新的3D自动标注。
标注的第一步,是从这些数据中进行轨迹预测。第二步,重建多车道场景;第三步,对新的场景进行自动标注。
在车道选择问题上,据特斯拉FSD的长期测试员介绍,对于刚刚发布的FSD Beta 10.69.2版来说,只剩下车道选择的问题。
当然,所有宣称马上能实现无人驾驶的公司都食言了,只是没人像马斯克一样依然如此高调鼓吹,而其FSD的每一次更新也依然备受关注。
这一次,马斯克再次许诺:“目前FSD软件已经可以适用于全球各个地区的路况,如果地方监管政策允许,我们可以在今年年底面向全球推出FSD Beta版本软件。”
9月12日,特斯拉刚刚向大约10万名Beta计划参与者推送过FSD Beta 10.69.2版本。
目前,FSD在美国的售价已经涨到了1.5万美元。目前所有特斯拉车型均标配基础版Autopilot智能驾驶辅助系统,可实现TACC交通感知巡航控制和车道保持功能。
另外,可以6000美元选配增强版Autopilot,功能包括:自动导航、车道变更、自动泊车、车辆召唤和智能召唤。1.5万美元的FSD选装包除了增强版Autopilot的功能,还包括信号灯识别和停车标志控制。
中国的价格分别为32000元与64000元,但国内版的信号灯识别和停车标志控制功能还有待推送。
在AI DAY的问答环节,马斯克表示今年将考虑增加更多场景,包括停车场场景的加入,以及会考虑有哪些指标可以优化。
03.
Dojo超级计算机值得期待
Dojo是特斯拉自研的超级计算机,可利用海量视频数据,完成“无人监管”的标注和训练。
Dojo使用的是特斯拉自研的D1芯片。该芯片由台积电制造,采用7nm工艺,拥有500亿个晶体管,芯片面积为645mm,小于英伟达的A100(826 mm)和AMD Arcturus(750 mm)。
Optimus的大脑使用的也是D1芯片。
而Dojo超级计算机的单个训练模块由25个D1芯片组成。1个训练模块相当于6个通用GPU性能,而成本和能耗仅相当于1个GPU。
其强大的算力可将几个月的工作量减少到一周。
此外,特斯拉Dojo超级计算机采用的是纵向整合的结构,对数据中心进行垂直整合。
去年AI DAY上特斯拉提出了Dojo超级计算机的规划。
在马斯克的计划中,Dojo超级计算机的算力要达到每秒exaFLOP的级别,也就是百亿亿次浮点运算。
据Network World报道,“要匹配一个 exaFLOP 计算机系统可以在一秒钟内完成的工作,需要在31,688,765,000年中每秒执行一次计算。”
而今天,特斯拉表示将在2023年第一季度布置第一批10个Dojo超级计算机机柜,即算力超过1.1EFLOPS的ExaPOD,将自动标注能力提升2.5倍;将来,特斯拉共将在帕罗奥图布置7个这样的集群,提供难以想象的庞大算力。
完成后,Dojo有望成为地球上最强大的超级计算机之一,将用于运行神经网络,以训练特斯拉的人工智能软件为自动驾驶汽车提供动力。
而在问答环节中,马斯克也表示,由于Dojo超级计算机耗能巨大,未来可能会采取AWS这样的模式,以云服务的方式提供给其他公司来训练其神经网络。
从其强大的算力且开放的属性来看,对行业而言,Dojo超级计算机值得期待。
最后我们再回到人形机器人。
蹒跚学步的Optimus没有去年概念视频呈现的惊艳,原因其实很简单,没有足够的时间和足够的数据,它的成长周期注定是漫长的。
而它既然迈出了第一步,则再也不会止步。