查看原文
其他

12万的马杀鸡机器人、踹不倒的钢铁小强……这届AI的花活,真的能落地了 | 直击WAIC 2024

暴走的智涌 智能涌现 2024-07-08

文|王沁 邱晓芬 周鑫雨

拍摄采访|周鑫雨 常敏潇 邱晓芬 邓咏仪

制图|袁滢靓

编辑|邓咏仪

封面来源WAIC

大模型的厮杀日趋白热化,而世界人工智能大会(WAIC)就是AI界的狂欢,AI界的春晚。

7月4日,WAIC在上海世博展馆开幕。在主论坛上,姚期智、李彦宏等AI大咖齐聚一堂;在展馆中,AI战场从模型一步步卷到了应用,又从软件卷到了硬件——2024年的展馆新设机器人专区,有25款人形机器人亮相。

今年的WAIC也比往年更卷:500余家企业,参展企业数量历史最多。

上海的酷日与冰雹来得猛烈,AI之火来得更猛烈:大会的几十场论坛早早就被约满,媒体们带上直播的长枪短炮,AI博主们纷纷在展馆闪现并与网友见面,也有求职者直接到大会现场找工作、应聘企业。

在展会上,你可以跟AI一起玩狼人杀,跟着数字人一起同台跳舞健身,还可以让AI老罗帮你直播带货。大量的AI应用,悄然跃过了纯展示和Demo阶段,从手机App延伸到到词典笔、电视等等硬件中,进入到生活的方方面面。

你还能看到特斯拉的赛博皮卡Cybertruck,和特斯拉的人形机器人Optimus合影…


△特斯拉电动皮卡Cybertruck 图源:作者拍摄

数不清的具身机器人中,有会写书法的、会做穴位按摩的、会叠衣服做家务的,甚至还有会跳女团舞的…

与AI共存,不是未来某刻,而是此时此刻。

机器人总动员

特斯拉Optimus:很牛,但只能看不能摸

时隔7个月,特斯拉Optimus第二代产品终于亮相,这次自然也吸引了不少目光。这次,Optimus毫无疑问变得更强了。

据特斯拉工作人员介绍,Optimus如今在直立行走的基础上,行走速度提升了30%,而且,它的十个手指还“进化”出了感知和触觉。这意味着,它不仅仅能轻握脆弱的鸡蛋,还可以搬运沉重的箱子。

特斯拉还在尝试把Optimus用到他们的汽车工厂中,替代人类。比如,借助和特斯拉汽车上类似的视觉神经网络和FSD芯片,Optimus已经能够模仿人类的操作进行电池的分拣训练。特斯拉方面称,明年将会有超过1000个Optimus要进厂工作。

遗憾的是,这次其他家的机器人都在现场整花活,唯独Optimus被关在了一个玻璃柜子里面,只可远观,不可亵玩。

△特斯拉人形机器人Optimus 图源:作者拍摄

原地后空翻吧!机器人!

这次,“宇树科技”则展出了他们的Unitree H1人形机器人。据说,这款机器人是全球首款能在原地后空翻的人形机器人,而且还是纯电驱动。

从外观上看,一米八的身高,和成人男子差不多。

在现场,宇树可以还展示了他们的一系列机器狗产品。这些机器狗能自如做站立的动作,并且还能连续原地侧空翻,每翻一次,现场都惊起“哇”声一片。

△宇树科技Unitree H1 图源:作者拍摄

咋踹都不倒的机器人

通用足式机器人公司“逐际动力”的标杆产品,是一款用脚踹都踢不倒的双足机器人。

运动的稳定性,对机器人执行任务、打工干活儿是关键。要走得稳,才能代替人类上刀山下火海。

在地形复杂、坑坑洼洼的山路上,而且是在完全陌生的野外环境,这款机器人可以走石子路、过沟渠、爬草坡,甚至人怎么用棍子打它,都不会倒。

在大会现场,这款产品几乎赢得了机器人区最多的目光。观众用各种方式欺负这款双足机器人:拉、拽、踢、踹……


△“逐际动力”机器人 图源:作者拍摄

可怜的机器人哪怕被人踢得快跪下了,甚至都被地上的坎儿绊了一下,都没倒,继续还能双脚交替调整,站起来。

有观众不忍心叫道:“你别欺负它!”

机器人这种怎么踢也踢不倒的能力,得益于强大的运动控制。

在软件方面,需要结合更实时、更精准的地形感知信息,同时需要迭代全身的运动控制算法。通过对全身动作的实时规划,机器人的手臂与腿部的动作更加协调,身体在运动过程中的晃动显著减小。

会叠衣服的贤惠机器手

灵活的手,造就了人类使用复杂工具的能力。而对机器人来说,灵活的手决定它是否能代替人类做各种操作。

在人类的日常家务中,叠衣服其实难度很高:对手指关节的灵活性、对柔性变形衣物的感知能力、操作的力道和角度要求,都很高。

“穹彻智能”的机器手,就是代替人类叠衣服的一双灵巧手:


△穹彻智能灵巧手 图源:作者拍摄

穹彻智能公司成立于2023年11月,该公司由非夕科技拆分而来,初创团队主要由非夕科技CEO王世全和上海交大教授卢策吾等人组成。卢策吾曾是著名AI学者、斯坦福教授李飞飞教授团队成员。

不过,据《智能涌现》观察,穹彻智能的这双灵巧手叠衣服比较费时,三分钟才刚能把衣服拉起来。机器人帮你做叠衣服这种高难度家务,在效率暂时还比不上人类,但是曙光应该就在眼前。

机器人为你做一次马杀鸡

当你腰酸背痛,又不想出门去按摩店,如果有一台机器人在家为你做按摩,岂不是爽呆了?

△康养机器人 图源:作者拍摄

“睿尔曼智能”的这款康养机器人,采用仿人机械臂,能对人体上不同的穴位进行按摩。跟传统的按摩器大不相同。

传统的按摩器,按摩的动作是固定的,只可以调档位。在同一个档位和模式下,按摩的手法、动作与力道是一样的。

△康养机器人操作界面 图源:作者拍摄

AI时代的机器人,可以根据不同人体的形状与身材,调整按摩手法和力道。

据现场工作人员介绍,这款机器人录入了400多种不同的人体身体的数据,可以自动判断当前床位上人的穴位位置进行按摩。此外,机器人还能调整按摩的力度、温度和时间。

用户还可以有个性化定制按摩,比如当你近期感觉肾脏欠佳,就可以设定让机器人重点给你敲打肾经。

价格也帮大家问过了,标价每台12万元,在场的《智能涌现》小伙伴们人人都心动。

玩转AI应用

Soul:和AI一起玩狼人杀

谁是狼人,谁是平民?

在AI时代,你要问:谁是人类,谁是AI?


△Soul旗下AI游戏“狼人觉醒” 图源:作者拍摄

在兴趣社交社区平台Soul的“狼人觉醒”游戏中,真人与AI同上牌桌,一起尔虞我诈。

“但凡你要为狼人做事情的话,你都会说两句话对不对?结果你直接划水。”在一次游戏场景里,一个AI角色信誓旦旦地分析道。

有用户在旁边感叹道:“AI把我整得一愣一愣的。”

Soul社区在今年发布了“狼人觉醒”的站内游戏,AI扮演角色,和人类玩家一样,在狼人和村民的角色中互相博弈。

△图源:Soul

据了解,该游戏基于Soul自研的语言大模型Soul X,采用强化学习技术,在游戏各个阶段让AI角色作出包括伪装、信任、领导与对抗等精准拟人决策,还能支持多角色扮演,也能选择不同的音色。

B站:一键让漫画会动+有声音

喜爱的漫画成功TV化,或者被搬上荧幕,其中的幸福滋味,二次元们肯定懂。

这次,“二次元老家”B站,亲自用AI生成动漫的视频版,暂解动漫迷的苦守TV化之苦。

在哔哩哔哩漫画上,B站上线了“动态漫”模式。所有的漫画都可以丝滑地切换成TV模式,漫画分镜连成了视频,角色拥有了肢体动作,台词也转换成了字幕。


△图源:作者拍摄

没想到吧,B站也悄咪咪地自研了大模型——B站小伙伴向《智能涌现》介绍,无论是“动态漫”还是数字人,都是基于B站自研的大模型能力。在展会现场,B站也开放了自研大模型的对话能力,用户扫码即可进入大模型的直播间聊天。

在家跟数字人斗舞

不想去健身房、在家又怕学不会动作的社恐们,现在可以在家跟着数字人同台健身了。

腾讯就推出了体感健身应用“舞动极光”。用户不需要额外购置设备,只需要要把手机连上一台电视/电脑,就可以跟着虚拟角色一起健身。


△“舞动极光” 图源:作者拍摄

舞动极光使用了AI动作捕捉技术,依靠机器学习来推断出身体结构运动。在真人模式下,你自己的影像,会与虚拟角色的影像一起,同时出现在台上。

你可以实时根据虚拟角色的动作,来自己学动作。

比如,虚拟角色是喜羊羊,喜羊羊怎么抬手、踢腿,你就跟着抬手、踢腿,你的动作会显示在屏幕上的真人影像上,实时反馈,动作正确就会奖励得分,像游戏闯关一样。

AI闺蜜“关小芳”,有了眼睛和耳朵

如今的AI智能体,已经不仅仅是二维屏幕上跟你对话的软件,而是有着三维体积感的数字人——能站在你面前,看到你的相貌,像活人一样跟你聊天,夸你今天的穿搭,为你唱歌。

你面前的关小芳,是快手的虚拟数字人,站在如同透明液体一般的VR显示设备里,隔着一道玻璃,但你仿佛能触碰到她。


△关小芳数字人 图源:作者拍摄

展会上的关小芳数字人,当你跟她聊天、希望她给你唱首歌,她会用知性的声音唱道:“拥抱的温度,只有你清楚。”这个有着3D体积感的数字人,仿佛伸手就能拥抱你。

快手开发关小芳智能体之初,是用来当带货主播。借助虚拟演播助手,用户只需要站在摄像头前,面部表情和肢体姿态就可以被快速捕捉与识别,并实时呈现在直播间的虚拟角色上,能够和直播间的观众进行实时互动。

2022年,快手还与AI卖铲人英伟达合作,用数字人在圣诞节开直播。

在AI的加持下,VR/AR、元宇宙重新焕发活力。元宇宙不仅能让数字人带货,还让《头号玩家》里人类与虚拟人共同生活成为可能。

AI老罗,24小时帮你直播带货

真实世界里的罗永浩,已经今年慢慢从直播界淡出、降低了直播频率。没关系,AI罗永浩可以替他干活儿——大模型独角兽公司“智谱AI”发布的数字版老罗,就是用罗永浩真人语料库训练出来的AI智能体。

只要有电,AI老罗可以24小时无间歇和你聊天,还可以24小时干活儿做直播——这可比真人老罗有性价比多了。


△老罗智能体 图源:作者拍摄

罗永浩的幽默诙谐,已经成为他直播带货的风格护城河。那么AI罗永浩能模仿真人罗永浩的风格精髓吗?

不能说完全一样,但AI老罗也继承了真实罗永浩的语言风格:

当《智能涌现》问AI老罗:AI有什么创业机会吗?

AI老罗也用罗永浩标志性的双手撑桌姿势,用带点调侃的语气回应:

“AI领域火得一塌糊涂,机会多如牛毛,比如AI在医疗健康、金融、零售、制造业等行业的应用,都是创业热点……但别忘了,创业不是光靠点子就能成功的,执行力、团队、资金、市场定位,一个都不能少。有兴趣的话,可以深入了解一下,也许下一个改变世界的就是你了。”

AI改作业,十国语言不在话下

什么应用能在海外的下载量超过TikTok?答案是会实时批改作业的AI。

这款能解放教师双手的智能批改系统,来自猿力科技自研的AI大模型多语言智能批改技术。

批改作业和试卷,最怕的就是因为错批、漏批而影响到学生对错题的复盘。猿力科技的智能批改系统,已经学习了海量青少年的书写笔迹,进而能够更准确地读懂学生的答题字迹。

仅仅是批改还不够,这套系统还担当了错题讲解员的角色。根据上传的作业,系统界面能够实时出现批改结果,并提供智能解析和视频讲解。

△图源:猿力科技

在海外受欢迎,也是因为这款懂十几种语言的系统,能解放多国教师的双手。除了中文,英语、日语、葡萄牙语、西班牙语、法语、德语、俄语、越南语、印尼语、西班牙语等多种语言的作业,AI也果断拿捏!

“文科教师”有道词典笔,终于会讲理综题了

最受家长关注的展台,网易有道是其中一个。

去年,网易有道就开始用自研教育大模型“子曰”,给词典笔“换脑”。这次新推出的词典笔X7,就注入了会做、且能分布讲解所有科目的能力。

相当于,曾经偏科语文和英语的有道词典笔,终于换上了一颗全科教师的AI大脑。

使用方法也很简单,只需要用机身扫过题目,词典笔内置的AI摄像头就能识别、读取题目信息。

相较于搜索引擎或市面上其他直接给出答案的教育产品,X7的特点在于,内置了有道AI教学应用“小P”老师,强调了给孩子“讲题”的能力。

比如,下图中有关浮力的物理题,X7就分了两步来讲解。孩子如果有不懂的地方,还能用语音输入相关疑问,如“为什么排出水的重量就等于浮力?”

△有道词典笔X7 图源:作者拍摄

X7上也搭载了有道的AI虚拟人口语教练“Hi Echo”,孩子可以与虚拟人老师Echo进行英语口语的实时联系。发布了一年的Hi Echo,也推出了语气更可爱、更会夸夸的儿童版模式。


△图源:Hi Echo

不过,2023年8月9日,有道才刚发布搭载基础AI学习功能的有道词典笔X6 Pro。时隔不到一年,即便功能升级,X7还卖得动吗?

网易有道工作人员告诉《智能涌现》,消费电子市场正处于缓慢的恢复期,AI在商业化布局上承担的最重要角色,是拉新,而非带动老用户的换机。而且,家长们不希望孩子们天天玩手机,这也是购买新硬件的重要动力。

当然,产品的吸引力最终不仅在功能,还在价格——升级功能的X7定价为999元,和X6 Pro(售价1199)相比,加了量还减了价。

AI算力

中科曙光:打造国产算力基础

中科曙光作为国产智算的领军企业之一,打造了坚实的AI算力基础设施,具备从底座、平台、服务、生态到应用的全栈能力,致力打造新“智”生产力引擎。

其中的一大亮点是曙光人工智能基础软件系统DAS,它由基础算子、框架工具和扩展组件三部分构成,同时下层依托基础硬件系统及开发工具栈,上层支持广泛AI应用,为用户提供包括模型训练、推理落地等全领域智能计算服务,为大模型迁移和优化提供了新捷径,帮助客户更高效快速地实现AI技术的落地应用。

△图源:中科曙光

国产GPU:从千卡跃进万卡大关

在通用显卡这一领域,国内少数或可从功能上对标英伟达的GPU芯片——摩尔线程,现已从千卡集群,升级到万卡集群了。

摩尔线程发布的万卡集群,叫夸娥(KUAE),能够承载万卡规模,具备万P级浮点运算能力,能用来训练万亿参数级别的复杂大模型。

对于显卡来说,多卡互联可以拓展算力,那么从千卡规模拓展到万卡规模,算力便更上一个台阶。据介绍,构建万卡集群并非一万张GPU卡的简单堆叠,而是一项复杂的系统工程。


△GPU数量越多,集群算力越高。图源:摩尔线程B站账号

夸娥万卡集群很注重生态兼容性,支持多种大模型架构,基于MUSA编程语言和完整兼容CUDA能力,提供了生态适配工具。

而且,这个万卡集群还很稳定,平均无故障运行时间超过15天,最长可实现大模型稳定训练30天以上,周均训练有效率在99%以上。

AI+一切

AI+办公:WPS AI伴写

WPS Al是金山办公旗下一款具备大语言模型能力的人工智能应用,2023年11月开启公测,锚定AIGC(内容创作)、Copilot(智慧助理)、Insight(知识洞察)三个战略方向发展,支持文字、表格、PPT、PDF等主流办公组件,提供快速起草文档、处理复杂函数公式、辅助阅读长文本等AI功能。

WAIC展厅上,WPS AI又带来了新的功能体验——WPS AI伴写。

在用户写作过程中,AI陪伴实时为用户提供后文写作建议,有效帮助用户提升文稿质量,快速完稿。AI伴写打破了常规大模型写作中对话框的限制,且无需跳转查询,不会打断用户写作思路,模仿用户的文风,以AI写作助手的身份猜测你想要表达的内容,从而写出专属于你的文案。


△图源:WPS

展台工作人员介绍,本次WAIC展会WPS AI经过一年的摸索,将会全新发布4个AI办公助手能力。

AI+播客:在喜马拉雅听见“AI”

喜马拉雅并没有亲自下场做AI大模型,但成为了AI的内容平台与流量池。

播客正逐步成为许多人获知科技资讯、促进自我提升的重要渠道。根据最新发布的《2023喜马拉雅中文播客生态报告》显示,“前沿科技”类的播客内容占据80后人群收听榜的TOP1。


△图源:喜马拉雅

喜马拉雅上,有各种围绕AI的话题活动,如“2024年AI新趋势”、“谁是AI时代的新霸主”、“个人如何把握AI新机遇”等,邀请经济学家管清友、经济学家向松祚、科普作家严伯钧、科技作家涂子沛等知名主播发声,与人民公园说AI、新商业相对论、科技行者等科技领域主播一起探讨。

此外,喜马拉雅上还有各种AI相关的专辑:《AI实践真知课》、《山姆·奥特曼传》、《芯片的未来》、《数字文明系列》、《“AI教母”李飞飞自传》等。

播客,让你能抓紧一切碎片时间,赶上AI浪潮。

👇🏻 扫码加入「智涌AI交流群」👇🏻

36氪旗下AI公众号
👇🏻 真诚推荐你关注 👇🏻


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存