Kimi发力AI搜索,产品形态更加明确,在聊天中探索生产力
产品功能和试用体验我们稍后再谈。
从产品形态上来看,Kimi 可能是国内最接近 ChatGPT 的 AI Native 产品,恰巧近期 OpenAI 的一些动作,我们觉得可以做一些延展的讨论。
关注 Founder Park, 更多 AI 产品 review
01
把模型当成产品 feature
在 AI 产品形态的探索上,过去两年正在定义行业的 OpenAI 只有一个答案:chatbot。
行业更加关注 OpenAI 在模型上的动作,年初的视频生成 Sora,年中的多模态 4o,以及近期发布的 RL 推理强化模型 o1-preview,都在全行业引起了广泛讨论。
但在模型能力的主线之外,还有另一条也许更重要的主线任务,产品化,在 2024 年尤其明显。OpenAI 产品层面的一切动作,都指向了 ChatGPT。
4o 的实时语音在 ChatGPT App 里,o1 直接放进了 ChatGPT 里,最近刚刚发布的交互更新 canvas,直接以可选模型的形式放进了 ChatGPT 里,甚至仅开放少量试用的 SearchGPT,也在官方 blog 里明确指出,当前只是原型版本,后续会将重点功能直接移植到 ChatGPT 里。
SearchGPT 官方 blog,感谢沉浸式翻译
打开现在的 ChatGPT,可以理解 OpenAI 的思路,只有一个「对话框」,可以在一个对话流里切换模型,4o real-time、canvas、o1,这些模型都成为了 feature。
Model as a feature,甚至,post-training as a feature。主动的 MoE 和被动的选择切换,对产品来说,模型只是功能。
GPT-4o with canvas 的交互是一个很好的「preview」,在一个对话框里,启动文本/代码编辑,通过「聊天」,创造生产力。可以想见 OpenAI 接下来的动作,是任何功能,任何交互,都可以在一个对话流里完成。
更多模态的选择,更多形态的交互,就能打开一个又一个新的场景。
这和市面上很多「智能体」模式的 chatbot 的区别在于:一个十项全能的助手,还是 10 个各有所长的专家,甚至一个庞大的人才市场。
多一个功能,对智能体市场来说是多一个「人才」,对 ChatGPT 来说是助手多了一个技能点。
用户体验上的差异,用互联网黑话说,就是一个 leader 是否要跟很多人对齐,同步 context。
这一视角来源于之前与 Kimi 创始人杨植麟的交流,在大约一年的尝试和摸索后,他持有类似的观点。
今年 6 月,在媒体曝料月之暗面曾有两款泛娱乐产品折戟的消息传出后不久,杨植麟在 Founder Park 的大会上强调月之暗面会更加聚焦,「做好 Kimi 这一个产品」。
在那之前的另一次交流中,他更加明确地表达过对于产品形态的想法:
张鹏:你认为 Kimi 这样的产品,最终我们会怎样定义它?
杨植麟:我们还是希望它能成为一个入口。
张鹏:这么明确?
杨植麟:对。因为 AGI 最终的产品形态可能是比较确定的。因为 AGI 的定义就是和人一样智能,本质上跟它交互的感觉与跟人交互没有区别。所以我觉得,AI 之后(的体验),只要你想到一个问题,或者有一件事需要做,但自己不想做,都可以让它去做,或者说有一件事,你不确定自己能不能做好,AI 会在其中扮演一个很关键的角色。所以只要智能的需求是一个普世的需求,那大概率会存在一个或若干个入口。
张鹏:就是每个人身边其实都有这样的几个人,有个啥事就想起来。
杨植麟:对,这个人既博学又温柔,不光是给你建议,还能帮你把事给做了。我觉得一定会有这样的产品。
AI 产品的「主线任务」是明确的。
但这种产品形态,或许只适合具备模型能力的团队。甚至在组织层面上,同时具备产品和模型能力的大厂,如果产品团队并不完全依赖于模型团队,All-in-one 的移动互联网 Super App 标准目前看也是面向市场的最佳选择之一。
Founder Park搞创业者交流,做产品研究,满脑子都是AI,欢迎交流探讨⬇️02
AI 搜索是自由的
怀着长期以来对 AI 搜索的疑问,或者说,抱着当下所有 AI 产品都处于「preview」阶段的预期,我们也体验了「Kimi 探索版」这个产品。
工作学习中有很多需要搜索、研究的地方,很多工作是在大量的网页里提取信息,根据不同的需求进行梳理,我们日常也有大量的工作与此有关,但你可以在其他地方看到相关测试,我们就不展开了。
还有什么场景,不是苦大仇深的工作和作业,同样需要大量收集信息并整理呢?
战斗。
结合 Founder Park 个别同事的生活经验,我们做了一些测试,效果还是不错的,大有可为。
(以下 prompt 仅为测试产品,不代表 Founder Park 观点。)
AI 产品的可能性还挺多的。博学、温柔,给你建议,把事给做了,都感受到了。
养成依赖是用户体验很重要的一环。搜索引擎二十多年,虽然有「Don't ask something you can Google」这样为人处事的守则,人们还是习惯张嘴问身边人。但当搜索变成「身边人」,也许情况会发生一些变化。
下面还是正经介绍下这次 Kimi 更新的功能。
03
Kimi 探索版产品介绍
10 月 11 日,月之暗面发布了 Kimi 的新版本——Kimi 探索版,主打深度搜索,可以模型人类的推理思考过程,对长难问题和复杂问题进行拆解,同时会尝试搜索更多内容,官方对此的说法是,「Kimi 探索版的搜索量是普通版的 10 倍」。
Kimi 探索版会分批上线 web 端,预计 10 月 14 日全量上线。使用方式为打开对话框左下角的探索版开关,或者直接在对话框中输入「/」切换,但是如果你没有把输入法切换为英文,直接输入了「、」,Kimi 也是能识别的。
官方介绍都本次更新的主要特点:
自主规划策略,会先规划问题的整体策略,将问题拆解为有层次的子问题,然后分步回答。
大规模信息检索,一次性检索多个关键词,相比手工搜索的大提速。
回答的同时会即时反思搜索结果,补充信息。多在信息和数据查询类任务中触发,不是所有任务都会进行反思。
“如果 Kimi 搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到。未来搜索引擎会成为AI更擅长调用的工具,人只需要专注于提出好的问题,AI就可以结合模型本身的能力在庞大的互联网中自主海量搜索,不断反思迭代,更精准地定位所需答案。” Kimi 探索版产品负责人表示。
Kimi 主攻生产力场景,核心用户是知识工作者和大学生。根据 Similarweb 数据,从今年以来,在代表生产力的 PC 网页端,Kimi 的月访问量从 140多万增长到 2500 多万,增长了 17 倍。目前 Kimi 的 PC 网页版,也是国内 AI 助手产品中唯一月访问量超过 2500 万。
这是 Kimi 探索版的第一项能力,后续还会有其他新能力上线。
案例展示
对于复杂且需要多步骤回答的问题,Kimi 的回答在这次升级后有了明显的质量提升,不会只关注其中一个问题,或者只回答问题中的某个子项,比如常见的历年数据统计这样的需求。
除了对问题按照类别进行拆解之外,Kimi 探索版这次的另外一个升级,是拆解了回答问题的步骤,尤其是那种需要思考下或者了解逻辑之后才能回答的问题。比如这个:
kimi 先去搜索了逻辑推理题的解题方法,然后再运用这种逻辑方法去回答这个问题。作为对比,kimi 探索版的答案是正确的,而普通版的 kimi 的回答,是错误的。
更多阅读
后发先至,字节版 Sora 发布!10秒长度、多主体交互、一致性多镜头a16z对话创业者李飞飞:语言不是全部,AI 要进化出「可操作性」
万字探讨:国内AI应用创业陷入恶性循环,问题在哪里,出路是什么?
o1核心作者演讲:激励AI自我学习,比试图教会AI每一项任务更重要
转载原创文章请添加微信:founderparker