附内测地址:AI 开始接管物理世界
今天在智谱,很震撼。先看视频:
这两天,正在写一篇文章:《物理世界的接口,探索 AI 如何与世界交互》,并打算吐槽一下:
几乎所有 AI 大厂,都在做一件事:更好的 Chatbot,然后疯狂刷榜&PR」
却少有人关心:AI 如何真正有效的改变世界、改变生活。
文章还没写完,就被拎到了智谱发布会...
被发了个群红包(喜
红包很大,两万块(大喜
红包很多,100个(特喜
我没抢到(悲
但最终,
发现智谱走在了更前面... (喜
链接物理世界
放个片子:
上个月,Claude 发布了一款新的 API,Computer Using:
这次,智谱更进一步,发布了成熟产品:GLM-PC,也可以叫「牛牛」,Logo 是头牛
形式上虽是 ChatBot,落地完全不同:
从纯语言理解转,向物理世界的交互
因现场没有过于演示,我自己测了下:「让 AI 自动给B站上战鹰点赞投币」
任务完成,很顺利,看下面的视频:
这里有个细节,让我挺惊讶:当 GLM-PC 准备投币时,会主动暂停并询问确认 - 由 AI 主动发起,这就有意思了。
从技术角度看,这个行为意味着 GLM 实现了:
语义理解:它知道"投币"和"点赞"虽然都是互动行为,但投币会消耗用户的虚拟货币
场景认知:它能识别出哪些操作需要额外确认,而不是简单地执行所有指令
决策判断:它会在关键节点主动暂停,等待用户的二次确认
这是一种有趣的思路:AI 再是一个单纯的"执行者",而是在执行的过程中,判定是否合理。
(刚好的,OpenAI 之前讨论过这个:OpenAI:搞 Agent 时,你要注意这些)
另一个牛逼的是... 它支持我用手机来操作电脑
在绑定了手机后,输入指令:「给渤海小吏投币」后,
电脑也会完成这一操作
这个操作可以定时... 所以非常适合... 打卡。
牛牛这东西,内测地址在这(Mac 可用):
https://www.wjx.top/vm/mOs9cHw.aspx
还有一个基于浏览器的,更通用(智谱清言浏览器版):
https://new-front.chatglm.cn/webagent/landing/index.html?channel=ads_news_openday
来自异次元的红包
最能打动我的,总是红包。
发布会现场,张鹏总对着手机说了句:往群里发个红包,2万块,100个
于是... 人类收到了来自 AI 发送的第一个红包(虽然我没收到...碎碎念ing)
同样,发红包的过程中,对于敏感操作如支付,也会主动请求用户确认。
2万块的微信红包
微信没抢到(悲)
一份支付宝红包
支付宝抢到了(喜)
这个在手机里的产品,叫做 AutoGLM,内测地址
https://agent.aminer.cn/
再度开源
这些之外,端侧模型 GLM4-Edge 今天也有发布
由两种尺寸的大语言对话模型和多模态理解模型组成
1.5B / 2B模型主要面向手机、车机等平台
4B / 5B 模型主要面向 PC 等平台
发布即开源
https://github.com/THUDM/GLM-Edge
最后,我想说的是
从实验室数字,到物理世界的操控
从语言理解,到现实世界改变
可能是 AI 下一个突破口