大模型+机器人案例分享与碰撞(暨国发院AI碰撞局第三局小记)
注:本文原文9.1号发在,就海淀瓢泼大雨那天的活动。
2024年8月9日,在北大承泽园429教室,举行了北大国发院AI碰撞局的第三期活动。当晚大雨瓢泼,街上水流过膝,依然还是有20多名同学到了现场,线上也有70多名同学参加了本次活动,活动持续到10点多。
碰撞局结束的时候,
大家一致认为侯老师比较帅,韩博像董宇辉
大家之所以如此关注这次活动,和AI有关,和具身智能有关,和本场分享嘉宾千寻智能的韩峰涛韩博也有关。如果说AI应用的形态基本全是机器人,那机器人发展到终极差不多就是具身智能。反过来说具身智能正是科幻照进现实的具体体现,《终结者》或者《超能陆战队》中温情些的大白则全是人类对未来具身智能的想象。韩峰涛博士作为创始人和CEO的千寻智能刚刚获得顺为资本、绿洲资本的投资,此前韩博则以CTO身份长期奋战在机器人的一线,所以还是很适合谈谈这个话题。
北大国发院 AI碰撞局主理人王新在主持开场
千寻智能韩峰涛博士在分享
从科幻回到现实后韩博则先对具身智能的巨大预期泼了一盆冷水。韩博谈到:
从商业现实来看,当前工业机器人渗透率也就在1%~2%(2022年一共销售30万台工业机器人,保有量在150万~200万之间,产业工人按约1亿,每个机器人按照与1个人等价)。
从技术现实来看,如果最终我们期望的成熟度是100%,那当前最为成熟的机械臂大概是40%,韩博用下面的分数来描述现在的技术现实。
那这次具身智能的新机会来自于那里呢?如果说过去的瓶颈是:产品太贵和通用性较差导致的机器人在具体场景里没什么用,那现在到底出现了什么样的新可能呢?韩博判断是在任务层上解决过去某些常识性问题的新可能加上机械臂等过去的积累创造了新产品机会。而任务层的新能力关键在于两点:一是任务分解层可以大量重用现有各种大模型,一是在动作生成层则需要开拓性的打造具身大模型,从微观任务形成机器人的运动轨迹。
对这点,韩博认为相关技术比较确定,但确实让模型生成具身智能的GPT-Token会面对一些独特的挑战,比如数据问题等。
碰撞局中的韩峰涛博士和侯宏老师
进入碰撞环节后,有点像开闸放水,大量问题一下子就涌了出来。我们这里截取其中几个有代表性的问题。(下面综合了很多现场参与同学的观点,不一一列举各位名字了。)
第一个碰撞点起于侯宏老师、韩博关于资金使用的讨论,随后现场嘉宾(贾梓筠博士等)加入了进来一下子就扩展到市场定位、数据使用、战略控制点等多个方面。
简单总结这个环节,要点是:具身机器人大概率要重走类似自动驾驶的道路,在相对垂直场景提升通用度,然后逐步扩展覆盖场景范围,比如自动驾驶的从扫地机器人到园区再到城市的部分地区等。具体下判断花钱的时候,则要在市场规模、海外国内等多个要素间取舍均衡选择一个落点(典型的选择和集中相关的战略问题)。
在这个逐步拓展落地场景的背景下,从产研角度看影响机器人进化速度最大的是数据,而数据要么是仿真数据,仿真数据到底可用度什么样?要么是一般2D数据,那2D到3D的转换可用度什么样?要么就是真实数据,那数据量级和真实场景这个矛盾怎么解决?
大概率是在启动期仿真数据、一般视频有点用,最终还得依赖真实场景跑起来螺旋放大,转起来数据飞轮。
碰撞中的各位同学们
第二个大的碰撞点则和产品的系统性有关。
先是侯老师提到了AI碰撞局这三期的一个差异:具身机器人的复合度明显更高,比前面纯粹数字的智能体至少多出来机器人这部分的专业性,随后就衍生到机器人管理、时延等问题。端上要管理,云上也要管理,那到底怎么去构建这种架构,云边端的角色如何划分?
这问题眼下没那么关键,讨论也没结论。肯定还是优先要解决机器人本身在场景上可用性和价值创造问题,然后大致参照IoT的处理在云边端分别构建管理机制。
但这个问题会越来越关键,一定程度上甚至会变成发展方向之争。
未来的机器人到底是像《超能陆战队》里的大白,完全的独立化,还是像《黑客帝国》里面的章鱼统一受控于一个中心呢?很遗憾由于时间关系,除了上面的问题外还有类似特斯拉这种端到端的大模型是不是更好?等问题没来得及展开。
除了上面的两个碰撞点外,最后探讨的一个问题特别有意思,现场有同学提到到:海外、国内聊了很多团队,有的估值一下子也变的很高,但直观上很多其实很像“骗子”。韩博怎么看待这事?
韩博很坦诚的表达了自己的一个观点:泡沫有坏的一面,但从真想做事的人角度,它也有很积极的一面,否则像具身机器人这样的大赛道不好启动的,更是很难跨周期。
这个问题正好切中了AI行当的一个大痛点。
AI这行业总是处在两个极端状态间摇摆:要么处在对AI的普遍预期远大于技术现实,要么就是从业者都是骗子(当年Geoffrey Hinton一度申请不到经费,那时候大家觉得干AI的差不多都是骗子)。更为神奇的则是虽然AI一直让人失望,但每隔几十年或者十几年它就再回来一次,回到大家关注的焦点,人们又总是重新对它报有巨大预期。
AI在这个时间点确实太混沌了,对于从业者、创业者、应用者而言,在这个时间点,回到现场,解剖麻雀,然后从中可以见小,可以见大差不多是最有效的方法了。这也正是AI碰撞局的宗旨:现场问题,底层逻辑,和而不同,相望而行想表达的。活动越进行越会真切的体会到底层逻辑不能和现场问题分开,两者更像一个整体的不同侧面。欢迎大家继续关注国发院数字中国AI碰撞局。
------------------------------------------------------------------------
这个时点的AI太混沌了,宣称有赚钱方法的大概率是骗子,宣称全无机会的又过于消极。面对AI就得解剖麻雀,研究案例,回到现场,获取一线信息。反之越高大上、越论文就越危险。关键是真实案例不好找,所以就有了琢磨事AI碰撞局。研究清楚多个案例,弄明白产业底层逻辑,再回到自己问题差不多是眼下最靠谱的方式了。对活动感兴趣的同学请联系cathywangyue。 老李话一三,公众号:琢磨事穿透8个AI案例,可以看到什么?
总结AI成功产品,透视AI的下一步(暨琢磨事AI碰撞局第五期小记)