查看原文
其他

AI Agent新篇章

调研纪要 2024年10月27日 23:56

事件:10月25日,智谱AI推出自主智能体AutoGLM,可以模拟用户使用手机界面的过程,在手机应用程序以及网页上进行操作,包括根据用户给出的指令完成购物、进入应用程序完成文字填充、总结等。


1、背景:今年年初,OpenAI被爆出将自研AI Agent软件,它可替代人类,自动导航至任何网站并执行指定任务。10月25日,智谱AI推出相似产品——自主智能体AutoGLM,智谱将其称为是一个可模拟用户点击屏幕的手机操作助手,以及点击网页的浏览器助手。同时,智谱AI还推出了端到端情感语音模型GLM-4-Voice 。此外,苹果宣布Apple Intelligence的正式公开版本将于下周在iOS 18.1中上线。


2、AutoGLM基于OCR理解UI组件信息,通过链式思维训练理解组件功能。根据清华大学发布的《AutoWebGLM: A Large Language Model-based Web Navigating Agent》,AutoWebGLM通过OCR模块解析页面截图并将其转化为易于LLM理解的HTML,帮助LLM理解UI功能及所处页面位置。通过GPT-4的链式思维推理,生成UI与执行动作对应意图的QA问答数据集,并对AutoGLM进行训练,使其可根据用户指令,确定用户意图所需UI组件,并自动完成相应操作。


3、自动驾驶仍需明确指令,个性化场景需与手机厂商合作,跨应用操作待改善。根据数字生命卡兹克发布的实测视频,AutoGLM自动驾驶需要用户下达明确的指令信息,如预订酒店,需要用户给出时间、地点、预算及相应房型。我们认为AutoGLM执行如“帮我订回家的机票”等更个性化指令,仍需与手机厂商进行合作,获取用户个人信息使用权限方可实现。目前AutoGLM已可自动执行微信、淘宝、美团、小红书等App中用户常用操作,更多个性化操作尚未实现,并且未适配滴滴、京东、微信读书等App,未来需要更多第三方厂商以及更全面的UI训练数据集支持。


4、与荣耀等手机厂商深度合作,加速手机Agent落地,驱动AI手机渗透率提升。根据智谱,其在2024年9月与荣耀共同成立AI大模型技术联合实验室,与荣耀进行深度合作。2024年10月23日荣耀Magic 9.0发布会展示具备自动驾驶功能的AI Agent YOYO。具备自动驾驶功能的AI Agent可帮助用户摆脱繁琐的App操作,仅需语音指令即可满足用户需求,真正实现AI个人助理,有望驱动AI手机渗透率加速提升。


硅谷:AI Agent是应用的最重要方向

这次去加州硅谷,主要去了一些创业公司。我比较喜欢去创业公司,历史证明,创新的科技趋势都是从创业公司诞生的。一些感受和八卦:

1、不管是一二级投资人,还是创业者,大厂,AI是核心。

2、AI Agent是应用的最重要方向,不管是2B还是2C,就是基于大模型的应用形态。

3、应用非常的垂直和细分,创业趋势从infra开始逐渐向应用在走。

4、未来1年会迎来一波AI Infra公司的ipo潮,估值在几十亿到百亿美元。

5、工具类以编程为主,这个跟中国是一样的。

6、OpenAI可能在12月推出Orion,但GPT5做的不是很顺利,至少明年上半年不一定能推出。


相关概念股梳理:

1)维度一:股东,主要有电广传媒(旗下达晨财智(电广持股55%)A轮进入占比3%)、凌云光(直接投资,1%)、华策影视、三七互娱;

2)维度二:算力(火山云-润泽科技、优刻得(23年1300万收入)、亦庄智算中心(光环新网、深桑达等))

3)维度三:合作方(豆神教育(周末发公告,成立合资公司,做AI教育产品)、华信永道(智慧政务)、阿尔特(汽车座驾)、创业黑马(数字政务)等;


继续滑动看下一个
调研纪要
向上滑动看下一个
选择留言身份

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存