查看原文
其他

附内测地址:AI 开始接管物理世界

金色传说大聪明 赛博禅心
2024-12-08

今天在智谱,很震撼。先看视频: 

这两天,正在写一篇文章:《物理世界的接口,探索 AI 如何与世界交互》,并打算吐槽一下:

几乎所有 AI 大厂,都在做一件事:更好的 Chatbot,然后疯狂刷榜&PR」

却少有人关心:AI 如何真正有效的改变世界、改变生活。 


文章还没写完,就被拎到了智谱发布会... 

被发了个群红包(喜

红包很大,两万块(大喜

红包很多,100个(特喜

我没抢到(悲


但最终,

发现智谱走在了更前面... (喜




链接物理世界

放个片子:


上个月,Claude 发布了一款新的 API,Computer Using:

革命序章:Claude 3.5 新 API,可操作电脑


这次,智谱更进一步,发布了成熟产品:GLM-PC,也可以叫「牛牛」,Logo 是头牛



形式上虽是 ChatBot,落地完全不同: 

从纯语言理解转,向物理世界的交互 


因现场没有过于演示,我自己测了下:「让 AI 自动给B站上战鹰点赞投币」 

 

任务完成,很顺利,看下面的视频:

这里有个细节,让我挺惊讶:当 GLM-PC 准备投币时,会主动暂停并询问确认 - 由 AI 主动发起,这就有意思了。

从技术角度看,这个行为意味着 GLM 实现了: 

  1. 语义理解:它知道"投币"和"点赞"虽然都是互动行为,但投币会消耗用户的虚拟货币

  2. 场景认知:它能识别出哪些操作需要额外确认,而不是简单地执行所有指令

  3. 决策判断:它会在关键节点主动暂停,等待用户的二次确认

这是一种有趣的思路:AI 再是一个单纯的"执行者",而是在执行的过程中,判定是否合理 

(刚好的,OpenAI 之前讨论过这个:OpenAI:搞 Agent 时,你要注意这些) 


另一个牛逼的是... 它支持我用手机来操作电脑


在绑定了手机后,输入指令:「给渤海小吏投币」后,


电脑也会完成这一操作

这个操作可以定时... 所以非常适合... 打卡。


牛牛这东西,内测地址在这(Mac 可用):
https://www.wjx.top/vm/mOs9cHw.aspx


还有一个基于浏览器的,更通用(智谱清言浏览器版):

https://new-front.chatglm.cn/webagent/landing/index.html?channel=ads_news_openday





来自异次元的红包

最能打动我的,总是红包。

发布会现场,张鹏总对着手机说了句:往群里发个红包,2万块,100个

于是... 人类收到了来自 AI 发送的第一个红包(虽然我没收到...碎碎念ing)


同样,发红包的过程中,对于敏感操作如支付,也会主动请求用户确认。 


2万块的微信红包 


微信没抢到(悲)

一份支付宝红包


支付宝抢到了(喜)


这个在手机里的产品,叫做 AutoGLM,内测地址

https://agent.aminer.cn/


 



再度开源

这些之外,端侧模型 GLM4-Edge 今天也有发布

由两种尺寸的大语言对话模型和多模态理解模型组成

1.5B / 2B模型主要面向手机、车机等平台

4B / 5B 模型主要面向 PC 等平台

 

发布即开源

https://github.com/THUDM/GLM-Edge




 


最后,我想说的是

从实验室数字,到物理世界的操控

从语言理解,到现实世界改变

可能是 AI 下一个突破口

继续滑动看下一个
赛博禅心
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存