查看原文
其他

情感语音+手机智能体,智谱你是要取代我的Apple Intelligence了

AI沃茨 卡尔的AI沃茨
2024-11-06

 AI for the rest of us 

这是苹果 Apple Intelligence 宣传片里的最后一句,意思是打造人人可用的 AI。

结果周二内部员工爆料说苹果 AI 只相当于 75% 的 ChatGPT,也就是说我为了 AI 买的 iphone16 还没开始用就落后两年了?!

饺子包好了,醋被调包了。

很巧的是,同一天我收到了智谱清言的新功能内测邀请:

情感语音+手机智能体

提前测试了三天后,我单方面称后者为 Android Intelligence。

AI 已经不满足于 computer use 了,「phone use」Time 也来了

请看VCR:

不需要人工干预,在微信上批量总结公众号文章的内容

先来说说情感语音

但凡是语音模式,就肯定要跟 GPT 的高级语音模式 pk 一下:


陆陆续续跑了小20条语音对话后,可以说智谱的情感语音有三个优点:


  • 模拟不同的情感和语调,喜怒哀乐。
  • 对话过程中动态调整语速快慢。
  • 随时打断。打断 GPT 一般需要五到六个字,而智谱通常在第2个字就反应过来了。延长到一次完整对话里面,我可以少重复2-3句话。

要丝滑地使用语言模式的“秘籍”在于:

摆脱原有的大模型文字对话习惯,

也就是放弃提示语,像平时跟人交流一样,唯一的区别是追问,反复追问。

我常用的追问有两种:

  • 橫向追问
假设你通过AI学习烹饪:

你:「请问红烧肉要怎么做?」
AI回答后
你:「那青椒炒肉呢?」
AI回答后
你:「那麻婆豆腐又该怎么做?」
  • 递进追问
假设是一个模拟面试场景:

你:「面试时如果被问到期望薪资,该怎么回答?」
AI回答后
你:「如果对方说这个薪资太高了,该如何应对?」
AI回答后
你:「那如果他们坚持不能给到这个数,但我觉得自己的能力值这个价,要怎么继续谈?」

关键是大模型还能给你提供情绪价值,越问越开心😏。


再来说说“手机智能体” AutoGLM

大家还记得半年前的 Rabbit R1 吗?它主打将用户的语音转化为手机里的操作任务,像是打车、购物、订票、制定旅行计划等。

5天就买出了5万台,结果第一批发售后,就被吐槽响应速度慢、支持的APP很少。

关键是不能完全取代手机上的操作就意味着你的左右兜会被各种不同功能的 AI 硬件塞满,很臃肿。

跟Rabbit R1 say bye

但今天,这些之前没能实现的功能都被 AutoGLM 实现了,甚至更好。

你不需要买台新的 AI 手机,也不需要买 AI 硬件。

 App is all you need 

AutoGLM 仅仅是一款软件,就可以通过读取当前屏幕,做出任务规划,执行手机上的常用操作:

1. 在淘X上购买之前买过的产品

2. 在携X上订个高铁

3. 在X团里面买个螺蛳粉

它避免了依赖各种各样的 API,而是反过来模拟手动操作。也就是说我们肉眼看到的信息跟它看到的一样多,理论上我们在手机做的任何事,它都可以copy下来。

还有一个大家问很多的问题,Agent 有了权限后会不会给我乱花钱,

实测下来,涉及交易等重要操作,AutoGLM 会主动询问是否执行。

而且当我关闭 App 后,AutoGLM 还会主动取消屏幕读取权限。

这也太实诚了,光这一点就比一些在后台偷偷开着十几个权限的软件强多了好吧。


写在最后

之前我不习惯在手机上使用AI,

是因为手机上的 AI 更适合情景对话而不是加快问题的解决速度。

像复制/黏贴文本、上传/下载图片等操作,在网页端都来得更加顺手。

但手机版的智能体让我体验到的是不需要干涉的体验 AI,像自动驾驶。

不需要来回切换,甚至不需要双手,

我只需要看就可以了,这是全新的体验。

我相信,

此刻,我们在通往AGI的道路上,

再次迈出了「一小步」。


最后再补一个更新预告:

情感语音将会上线视频通话,

这要是能跟 AutoGLM 联动起来,

Apple Intelligence是不是又要被拉爆了🫨

PS:点击 `阅读原文` 还有一个小彩蛋

@ 作者 / 卡尔@ 动手学AI知识库 / learnprompt.pro


最后,感谢你看到这里👏如果喜欢这篇文章,不妨顺手给我们点赞👍|在看👀|转发📪更多的内容正在不断填坑中……

继续滑动看下一个
卡尔的AI沃茨
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存