对话开普勒胡德波:人形机器人不缺场景,缺的是“动手能力”
人形机器人早期落地,更依赖端侧小模型。
栏目| 机器人新纪元
开普勒进入大众视野,是在今年拉斯维加斯的CES 2024上,当时一则微软CEO萨提亚·纳德拉参观中国人形机器人的视频在网上一经传播,引起了不小的关注。
于是,大家开始好奇:这会是一个怎样的机器人团队?
实际上, 彼时的开普勒(全称:上海开普勒探索机器人有限公司)刚刚成立不到6个月,被带到CES 2024上的人形机器人产品两个月前才在国内正式发布。
在中国人形机器人产业最疯狂的这一年里,开普勒只是众多初创团队中的一员,没有传奇人物带队、没有明星资本加持,自然也没掀起什么风浪。
胡德波告诉科技行者,“公司成立之时,其实是开普勒团队成立的第三年,CES 2024上展出的先行者D1也已经是我们进化到第四代的人形机器人。”
和很多中国创业故事不同,开普勒走的是美国硅谷车库创业模式,创始团队中的几位工程师在2021年凭着对人形机器人的一腔热情,在工作之余聚在一起开始做人形机器人。
人形机器人这个看上去很酷的产品是智能硬件的终极形态,也是很多硬件工程师的梦想。
和大多数人形机器人项目研发路径类似的是,开普勒团队最初几人也是从下肢开始做起。
2021年,他们基于舵机和行星减速器,快速搭建了第一代腿足式人形机器人,之后又基于丝杠直线电机和行星减速器研发了第二代腿足式人形机器人。
“丝杠方案的优势是功耗低、负载能力强,但却不如旋转式执行器响应速度快、易调校,如果想要快速让人形机器人展现出一定效果,让它直立行走起来,旋转式执行器就是一个更好的方案,”回忆起最初研发人形机器人时团队内部的考虑,胡德波如是说。
由于想要快点看到自己研发的人形机器人动起来的样子,在做第三代、也是正式研发拥有上半身的完整人形机器人时,开普勒团队最终还是选择了旋转式执行器这条路径——先后用内外转子电机辅以蜗轮蜗杆结构、谐波减速器,搭建起了第一个完整的人形机器人。
2022年底,开普勒团队如愿让自己的人形机器人走了起来,据胡德波透露,开普勒内部研发的3.5版本的人形机器人当时已经可以行走、练瑜伽,甚至用手操作家用电器,“作为一个创业团队,当时如果能拿出这样一款人形机器人Demo,融资已经不是问题了。”
然而,在这一年特斯拉的AI Day上,马斯克使用行星滚柱丝杠方案的人形机器人Optimus(擎天柱)的亮相让他们意识到,“真正要能干活儿,还是要回到丝杠结构上。”
“当时我们基于旋转执行器研发出的人形机器人连续工作两三个小时就需要充电,功耗太高,负载能力也不够强,特斯拉Optimus正式发布后,我们就想将我们的架构做一次彻底的改造,而且我们之前在研发第二代原型机时就已经研发过丝杠方案,有一定的技术积累。”
回想起当时特斯拉Optimus发布时对团队的影响,胡德波如是说。
他告诉科技行者,团队当时对特斯拉Optimus做了仔细研究,发现使用行星滚柱丝杠方案确实很好,再加上对马斯克对技术趋势判断的信任,最终决定研发自己的人形机器人滚柱丝杠方案。
“马斯克对技术趋势的判断,以及他本人的影响力对人形机器人这波热潮起到了很大的推动作用,实际上,人形机器人赛道也确实因为马斯克和Optimus进场才火起来的。”
“做擎天柱的平替”
自2022年正式发布Optimus后,马斯克就成了人形机器人产业的代言人,全球人形机器人团队都在盯着马斯克和他的Optimus。
马斯克对人形机器人产业的预判相当激进,他认为,未来人形机器人数量将会超过人类,甚至达到100亿台。
如果只是观念激进,或许也难掀起什么浪,然而,马斯克是一个超强的行动派,在过去两年里,他的人形机器人Optimus越来越灵巧,在最新的演示视频中,已经进入工厂做起了分拣工作。
作为全球最接地气的人形机器人,Optimus采用的方案也自然备受关注,开普勒正是借鉴了Optimus的行星滚柱丝杠方案。
虽然大家都知道Optimus采用的是滚柱丝杠方案,但要想自研一套同样的方案用到自己的人形机器人上,远没有想象的那样简单。
胡德波告诉科技行者,“国内此前供应链没有行星滚柱丝杠执行器的制造基础,如何研发一套用在人形机器人上的滚柱丝杠执行器方案是当时摆在团队面前的难题。”
实际上,就在距离上海300多公里外南京的某个研究所,很早就开始研究滚柱丝杠方案,在滚柱丝杠工件的机械加工方面,国内供应链有着一定的技术和工艺积累。
不过,此前这些工件普遍应用于工业机床制造场景中,要造出一套用于人形机器人上的滚柱丝杠方案,就存在两个难题:
第一个难题是规格问题,此前用于工业场景的滚柱丝杠工件并不适用于人形机器人执行器制造,如何造出人形机器人需要的滚柱丝杠就成了开普勒团队当时面临的首要难题;
第二个问题是结构问题,最终用到人形机器人上的执行器包括行星滚柱丝杠、电机、电控、编码器、传感器、通讯模块等在内的复杂机电系统,如何将这些集成到一起,做出一个稳定可靠的解决方案,这也是此前国内供应链没有做过的尝试。
全球对人形机器人的研究至今有半个世纪之久,由于有大量公开资料可供参考,开普勒前三代人形机器人的研发并没有遇到太多困难,前三代人形机器人研发仅仅用了两年的时间,2022年年底,开普勒3.5版本的人形机器人就已经研发完成。
到了考虑量产、开始研究行星滚柱丝杠方案、做4.0版本时,真正的挑战才正式开始。
胡德波告诉科技行者,“滚柱丝杠这一机械结构是几十年前就开始应用的一项传统技术,欧洲在这方面的加工工艺一直非常领先,这也是为什么马斯克会去欧洲找代工厂的主要原因。”
胡德波说,和马斯克造火箭的经历类似,开普勒团队研究行星滚柱丝杠方案同样是从研究相关文献和技术资料开始。
“此前国内更关注的是滚柱丝杠的机械设计,没有完整的执行器设计方案,我们参考国外资料,从0到1设计了整个执行器和加工工艺,之后是打样、组装、测试、改进,在应用到人形机器人身上之前,我们这一方案来来回回改了很多版。”
2023年11月17日,开普勒先行者系列人形机器人正式对外发布,其搭载的行星滚柱丝杠执行器和旋转型执行器分别用于控制机器人的肌肉群和关节,前者峰值推力达到了8000N,后者峰值扭矩达到了200N.m。
在外界看来,开普勒只是这一年众多快速拉起团队、立项出产品的创业公司中的一员,实际上,这时面世的开普勒人形机器人已经经历了三年研发、四次迭代,是一款被寄予量产希望的人形机器人产品。
更重要的是,这款将在今年年底量产的人形机器人,对外售价预计在3万美元左右。
一个对比数据是,特斯拉预计2025年年底前开售的Optimus,售价预计在2万美元左右。
胡德波说,“很多人对特斯拉的人形机器人感兴趣,但特斯拉的人形机器人不对外开放,我们机器人和其上搭载的开普勒星云软件平台秉持对外开放战略,玩不到特斯拉擎天柱的人可以玩我们的人形机器人。”
不过,胡德波也坦言,“现在的人形机器人离人类期望,仍有一定的距离。”
造船业亟需人形机器人
2011年3月11日,日本发生了有史以来最强地震,在这场9级地震中,福岛第一核电站发生泄漏,这场震惊全球的核泄漏事故发生后,一些人形机器人陆续被派往福岛执行救灾任务。
然而,在这场灾难中,人形机器人并没能如众人期望那样起到作用。
这让人形机器人产业遭遇到一次广泛的质疑。
胡德波告诉科技行者,“实际上,即便是现在再遇到这样的情况,也没有哪一款人形机器人能真正派上用场,依然需要靠无人机或小车+机械臂这样的专用机器人来解决问题。”
“人形机器人的干活能力还处于逐渐落地阶段,今年会有一些机器人团队能够进入到实验室测试阶段,开始在实验室搭建的测试场景中进行早期测试(还不是真正的POC)。”
在这个阶段中,人形机器人产业缺的不是场景,而是能力,是替代人类干活的能力。
据胡德波透露,“现在开普勒陆续接到了来自各行各业的各种需求,很多企业恨不得立刻就能将我们的人形机器人部署到他们的岗位上去用。”
这其中,令胡德波印象深刻的一个应用需求来自船舶制造业。
船舶制造业是一个历史久远的传统行业,也是一个工作环境相当恶劣的行业,在大型船舶制造过程中,需要工人对船体进行焊接、打磨,在这个环境中,工人需要穿上特制的工作服、戴上面具,工作两个小时就浑身是汗、需要换人轮班,如果换用自动化设备,动辄数千万的设备定制投入又远没有人工划算。
在这一场景中,2-3万美元的人形机器人就变得很划算。
实际上,开普勒的人形机器人将在今年与全球客户进行联合测试,胡德波告诉科技行者,“我们会在今年8月与一家日本物流企业进行联合测试,届时,我们的人形机器人会在他们参照实际物流场景搭建的几百平方米的实地模拟场景中进行现场测试。”
开普勒的人形机器人如果能够顺利通过这个模拟环境测试,双方将会进一步规划在真实仓储环境中的测试、部署的计划,进入到真正的POC阶段。届时,将会有百台人形机器人进行集中部署,会测试出一台人形机器人究竟能替代几个人,算出人形机器人在这一场景中真正的ROI是多少。
不过,胡德波也坦言,“真正的POC阶段,至少要到明年才能做。”
在此之前,胡德波为自己的人形机器人规划好了四大应用场景,分别是智能制造、仓储物流、特种行业和科研教育。
开普勒的目标是先在全球与一些顶级大客户进行合作,在典型应用场景中,针对客户实际应用场景需求做端到端的方案落地,之后再在全球与自动化方案集成商合作,通过这些集成商将人形机器人做到自动化解决方案中,实现全球规模化部署。
这是胡德波为开普勒规划的发展路线,他告诉我们,“欧美和中国的自动化方案集成商模式都已经很成熟,工厂通常不会直接买一台机械臂,而是通过自动化方案集成商买一整套自动化解决方案,在工厂中进行完整的产线部署。”
当然,这是开普勒的一条长期发展路线,据胡德波估算,如果一切顺利的话,开普勒预计会在2025年开始尝试与一些技术能力较强的自动化方案集成商合作。
让人形机器人先“跑起来”
2023年,就在生成式AI技术发展如火如荼时,斯坦福在一篇论文中构建了一个名为Smallville的虚拟小镇,在这个小镇上,生活着25个AI智能体,这些AI智能体可以有自己的工作、生活、社交,是基于虚拟世界的一个完全自治的乌托邦。
斯坦福的虚拟小镇将关于AI智能体的研究推上了一个高潮。
关于人形机器人的发展,同样需要类似的“机器人小镇”的构想,与研究AI智能体的虚拟小镇不同的是,“机器人小镇”是进行数据采集的一个绝佳场景。
人形机器人这波热潮,除了马斯克的入局外,另一个重要推动因素是人工智能技术的进步,尤其是生成式AI技术的突破,让通用人形机器人的研发成为了可能。
各种AI模型构成了人形机器人的大脑,而对于生成式AI模型、大模型而言,数据至关重要。
胡德波认为,通用人工智能技术与人形机器人必然会走向融合,而通用人工智能技术企业与人形机器人企业未来也会走向更广泛的合作。
他指出,目前OpenAI与Figure的合作可以让他们自己训练出的机器人大模型能够有人形机器人可用,通过Figure进行大模型的技术测试和落地,但要想做真正的具身智能,OpenAI的机器人大模型就需要适配所有主流人形机器人架构,通过这些不同架构的人形机器人采集数据,测试和训练他们的大模型。
“只有本体构型越多样,采集的数据越多,训练出的机器人大模型效果才会越好。”
胡德波告诉科技行者,“我们目前正在和几家主流大模型厂商洽谈合作,希望可以尽早地参与到全球具身智能这一战场中。”
不过,胡德波更强调的依然是人形机器人商用落地,而开普勒人形机器人早期落地,更依赖的是端侧小模型。
在人形机器人本体趋于稳定后,今年下半年,开普勒人形机器人将会进行小批量量产,届时,开普勒将会有几百台人形机器人陆续进入全球市场。
至于人形机器人的ChatGPT时刻何时到来,胡德波认为,“这只是时间和数据的问题。”
当人形机器人相关数据积累得足够多,具身智能大模型将会迎来ChatGPT时刻,那时,人形机器人的泛化能力和通用性将会得到一次巨大的提升。