对话周鸿祎:别被 Co-pilot 带沟里去了|李榜主会客室
AI 产品榜·1 周年大会 李榜主邀请了 360集团创始人周鸿祎 来进行对话。
你可能刷到过很多红衣大叔的短视频,为了短视频的传播特性,内容在深度上做了很多妥协,你绝对没有看过像这次对话一样,8000 字的深入浅出。
红衣大叔开头说,他的观点大家可能在不同场合听过了,但对话过程中,我发现,有些道理常听常新,有些场景越找越明,有些逻辑越辩越清,同时红衣大叔也透露了很多 AI 应用的机会。
分享给你。
有的公司继续做闭源,我觉得是一种商业选择
李榜主:我先请教一个问题,原来您跟李厂长有一个开源跟闭源之争,现在依然还坚持这个开源的观点嘛?
红衣大叔:我觉得,你不要老是挑起矛盾啊。
我对李厂长是一贯拥护,而且表示支持的。好像是傅盛同学老要跟他PK一下。像最近这个萝卜快跑,我还亲身到武汉去体验了一下。
我觉得百度在人工智能方面还是做出了很多卓越的贡献,包括国内人工智能团队里边很多应该都是百度培养的人,百度相当于是自动驾驶的黄埔军校。
关于闭源和开源的这个争论,一直都有,我觉得这个也很正常。最近,扎克伯格推出了 Lama3.1 从刷榜的成绩来说接近了GPT-4, 有些地方甚至超过了GPT-4o,然后他讲了为什么要做开源。
我个人觉得,从现在来看,开源肯定是一个正确的方向,没有开源的 Linux 就没有互联网,今天开源给我们很多开发者,提供了一种科技平权的可能。
所以,这个问题我觉得不用争论,有的公司继续做闭源,我觉得也是一种商业选择。有适当的争论也挺好的,不一定要堵一条路,最后有一条路走成功了,这就可以。
大模型应该消于无形,让用户意识不到大模型的存在
李榜主:最近你们俩的观点好像也发生了一些变化,李厂长也说不要卷模型了,要开始卷应用了?
红衣大叔:我看李厂长在上海2024世界人工智能大会上讲的一个观点,让我觉得蛮诧异的。
因为百度一直在做模型,然后李厂长自己来讲,说大家不要再卷模型了。
大家卷模型每次出来,秀自己的各种花里胡哨的功能,觉得没有意义,应该卷产品卷应用、卷场景。
这倒不是说,验证了谁的想法对,我觉得只要人不要太笨,经过大模型 2023 年的百模大战到2024年,其实大家都会回答这个问题。你不回答这个问题,你的投资人会问你。你不回答这个问题,你的客户会问你。你做的东西这么好玩,但是怎么跟产品相相结合?
所以我有一个观点就是:大模型不是操作系统,大模型更像一个组件,更像一个电动机。
有人做出来,世界上转的最快的电动机,最后这个电动机,一定要跟用户实际的需求相结合。电动机它只是代表了一种能力,要跟用户的场景相结合。
电动机买回去装上传动轴,装上四个轮子,它可能就变成一个汽车。装上传送带,它就变成流水线。装上扇叶,它可能就变成电风扇,取决于你给它怎么跟你的业务去相结合。
我觉得未来大模型会无处不在,会像电动机一样。
今天小到一个电牙刷,一个刮胡刀,一个电吹风,可能里边都是有个电动机,但是,你用这些产品的时候,你根本感觉不到里面有个电动机。
同样,你在买一个新能源车开的时候,你也看不到电动机,但是,你能感受到它的能力。
所以,我认为大模型应该消于无形,让我们都意识不到大模型的存在。
刚才面壁智能李大海讲的,我觉得也是这个理念,无论是云端云测模型还是端测模型,最后,他在里面默默地发挥作用。
AI 应用还不能着急,确实需要一个探索的过程
李榜主:这是不是反映,在行业里面逐步形成了一些共识?
红衣大叔:你说的AI产品爆发进行时,我觉得今年,大家肯定要重新回到场景和产品上来。
但我觉得你稍微有点乐观,想一年就解决这个产品场景的问题,我觉得是不现实的,我觉得大概需要个几年的时间,这已经相当快了。
我们只要回顾一下1994、1995年互联网浏览器刚出来,1998年才有了谷歌,才有了2000年代的高速发展,大家也在探索。
所以,我是觉得大家别太着急了,确实需要一个探索的过程。
李榜主:那这个探索,在应用层面,老场景老产品机会更多,好像 AI 现在也没有创造一个新的场景,那创业者们,如何去找到一些可以弯道超车啊?或者说可以去杀入的契机呢?
红衣大叔:这个我特别怕回答这种问题,你这问题实际上隐含那个图省事的想法,就老想问我如何一招制敌。
我真的知道一招制敌,我就在家做了,我还跑到这来吹什么牛呢?
大模型技术它跟我们过去很多产品模式的创新不一样,它是一个技术上的创新,是一个生产力提升的工具。
首先把已有的产品重塑一遍,把已有的业务流程重塑一遍,是大家比较容易想到的做法。
好比蒸汽机刚出来的时候,大家首先想到的是,蒸汽机能不能取代磨坊把磨面给改善了,能不能带动纺织机提高纺织厂的效率。
所以你看目前微软、苹果,包括各种智能硬件和AI的结合,都是用大模型把已有的能力重塑一遍,或者给已有的流程加上这个智能的能力,我觉得这个做法是比较务实的。
而从蒸汽机到火车的构思需要时间,不光是要解决蒸汽机的问题,要解决驱动的问题,要解决火车铁轨的问题,要解决一系列的问题。
toB 正因为比较碎,这里面才会有更多你的机会
李榜主:在中国呢,做 AI 有什么机会?
红衣大叔:在中国来说呢,我个人觉得 toB 的市场,实际上是比较有机会的。
因为这个也符合国家的大政方针,有一次我开一个内部的会,有一位大领导在会上内部就讲,你们做大模型,别老想着做娱乐的东西,要为国家的数转、制改做出贡献。
国家现在强调的是产业数字化,要非常重视传统行业,特别是先进制造业,现代化工业的发展。
既然说大模型是一场工业革命,那它最好就应该直接提高劳动生产力,在 toB 、toG 里面有很多场景。
有人会说这个市场特别碎,好像感觉都是苦活累活。
李榜主:本质,像一个外包?
红衣大叔:我不这么认为。
谁都梦想做一个互联网的产品,像微信一样,像抖音一样,一下子就几亿人用,然后就打造一个平台,但这种机会属于千年不遇、千载难逢,而且有时候撞上了也要有运气。
toB 的市场,正因为大家都在探索,所以这个市场比较碎。
如果今天谁能拿出一个放之四海的方案,那一定没有你什么机会,正是因为比较碎,我觉得这里面才会有更多的机会。
到底什么是场景,什么是细分垂直场景
李榜主:你说的场景到底是什么?
红衣大叔:这两天我也在思考,比如说我们经常觉得,我们的场景已经够细了,比如,我那天表扬了kimi,在所有的大模型都在卷通用的 AI 功能的时候,kimi 应该说算是第一个提出来说做文档分析的,做这个长的上下文窗口,随后大家都跟进了,但是仔细想想,长文档分析,真的是一个垂直的场景吗?
李榜主:它不是一个高频行为。
红衣大叔:它还是太笼统,还是从功能的角度,还是从技术的角度出发的,需要再细分一下。
很多企业收到大量的合同,对合同来做一个快速的分析。
雇不起自己的律师,或者花不了太多钱雇外部的律师,可以用大模型帮我看一下这个合同有什么需要注意的、警惕的,需要提醒我有哪些不完善的地方。
这实际上是文档分析的一个更细分的场景,在这个更细分的场景上,我感觉可能,更容易去打动用户。
朱啸虎老爱讲他那个自动面试的公司,其实即使不讲面试,很多公司看简历,对简历进行阅读分析评估,实际上也是一个文档分析,但简历有简历的特点。
我觉得在 toB 领域,如果我们能够把场景进一步的细分,跟企业直接的业务需求,能够结合在一起,这里面我觉得会有更多的机会。
你要说它更像集成,更像外包。刚开始的时候,用户也不清楚怎么做,你也不清楚怎么做,那为了做一两个POC(Proof of Concept 概念验证)当然是要辛苦点的。
今天大家都觉得华为很牛,华为做了很多产品,直接卖给大家,大家觉得了不起。
可是你看华为早期创业的时候,它也是给中国一些县市一级的通信公司做交换机的机房,那也是到现场去改软件,甚至到现场去改硬件,也是经过了这样一个必然的一个过程。
因为一旦你在一两个模式上获得突破,找到了一个真实的场景,找到一两个成功的案例,你实际上就可以迅速的去复制。
toC 的机会在出海,出海的机会在 NGFW
李榜主:AI 在 toC 的应用,怎么看?
红衣大叔:在 toC 的场景里边,我觉得互联网这些巨头会在,自己已经稳固的场景里,比如,聊天是在微信,视频会在抖音,视频工具会在剪映,加上 AI 的能力。
至于做创新的东西,我认为现在可能还真的还需要时间。
发明了一个词叫 NGFW,大家知道 NGFW 啥意思吗?
李榜主:有知道的可以举下手。
红衣大叔:这个叫 Not Good for Work。这种在国内就很难做。但是, 我看那些国外的产品,包括中国团队在海外做的产品,如果能做的很深入,是很有机会的。
目前国外做这个 NGFW 的都是闷声发大财的状态。
编辑补充:我找了一个 NGFW 案例不好写在文章里,关注 AI产品榜,后台回复关键词【NGFW】获取案例。
C.AI 卖身了,怎么看。
李榜主:哈哈,大家都懂的。
C.AI 创始人的退出或者说放弃了,从模型角度不算成功,从创业角度算成功的,你怎么看?有没有创业者可以参考的方向?
红衣大叔:出海做 NGFW。
在国内的话,我就鼓励大家多为国家的大战略做贡献,多做 toB、toG 的应用。
如果让我总结一个,我认为 C.AI 不叫成功。他只是对他的投资人来说,避免了一定的损失。
大家说他放弃了,说明还是做的不够尖锐、不够聚焦。他似乎创造了很多数字人,但是每个数字深度不够的情况下,你刚开始聊的时候很有兴趣,跟哈利波特聊一聊,跟孙悟空斗斗嘴,但是这毕竟不是一种刚需和高频。
李榜主:但是 C.AI 从这个产品的使用时长上来说,确实是要比其他大部分的 AI 产品的时长是要高非常多。
红衣大叔:跟更差的比可能好一点,但是它的付费率不足以支撑它的发展。
只要你场景选的足够窄,几百亿参数就够了,便宜还好用
李榜主:你为什么要做专业的大模型呢?
红衣大叔:我在很多地方讲过。只要你场景选的足够窄,你对大模型的功能要求不那么全面,专业大模型它就不需要那么高的参数,可能不需要千亿万亿的参数,可能几十亿百亿的参数就够了。
前面面壁智能的 PPT 里肯定是在讲这个,小块头也有大能力。而且基于开源的模型,做这种能力的蒸馏,实际上,对算力的要求也没有那么高。
最近,国内的正好这十几家大模型都不约而同的把价格降低了,这反映两个原因。
一个是他们确实也意识到,他们原来希望模型即产品这个想法实际上没有那么容易做到。
他们需要别人来使用他们的API,因为没有用户的使用,没有数据的反馈,这个模型是进步不了的。
一个是,当价格调低到一定程度的时候,你会发现短期内自己弄一个大模型的运营成本,可能甚至要高于用第三方大模型的 API 的时候,那么你就会愿意接受去用它的API,就形成一个良性的生态。
他们价格的降低,也为我们很多开发者做试错提供了一个机会。
如果我们说,大模型市场是一场工业革命,等于才刚刚开始。
李榜主:给成年人做一个聊天助手,为什么 OpenAI 这么强,大家依然觉得,很多场景不能满意呢?
红衣大叔:因为成人的需求太多了,特别在工作场景里。在工作场景里有很多需求,目前大模型,如果不依赖很复杂的 Agent 框架,不依赖很复杂的 workflow,不调 API,光是一个 Co-pilot 模式,是不 work 的。
但是,如果我们把它放在一个 3 岁到 12 岁的小朋友的场景里,比如说,我手上戴的 360儿童手表上,它是没有工作场景的,我也不希望手表变成一个学习机,就是小孩的一个玩伴,就是小孩的一个AI朋友。
那他所干的主要就三件事,一个陪小孩聊天,第二个给小孩回答各种问题,十万个为什么,第三个给小孩讲故事。实际上这几个场景,用大模型满足,绝对是绰绰有余的。
所以同样的能力,你换一个场景就好解决的多。
李榜主:我给我小朋友做了一个AI爸爸。他问我英语我不会,我就说,让他跟AI爸爸去聊。
红衣大叔:那没必要,我送你个儿童手表就行了。
李榜主:多好,哈哈。
套壳的两种逻辑
李榜主:怎么看待,有人说接 API 是套壳?
红衣大叔:不要去管别人说你是不是套壳,用 API 如果就定义成套壳,那以后就没人不是套壳了,最关键的还是要找到应用场景。
有两种套壳。
一种套壳是本身并没有加入新的场景,只是把他的能力做了一个新的界面,这种套壳比较简单,也没有啥壁垒,你愿意去做也可以,国外有个公司叫 Poe。
我们很多开发者被某些言论给害了,大家做创业的时候不能老听那些评论家的。因为评论家自己不做产品,点评别人是容易。有评论家妄自菲薄,就老认为用开源的,就好像怎么怎么样,就应该自己研发大模型,自己去买 H100 去搞算力,这就把很多开发者引入了歧途。
一种是,把场景越找越准之后,你会发现,今天要解决垂直场景的工作,光有一个大模型和 API 是不够的。
甚至说大模型都已经不是,里面最重要的问题了,最重要的问题变成了,你构造什么样的 Agent 框架。
就是智能体会比大模型更重要,通过智能体,你才能让大模型从快思考变成慢思考,你才能让大模型从一个光是喋喋不休的一个话唠,变成能够有手跟脚,能够调API,能够实际干活的人。
讲一个可能跟大家不一样的观点, Co-pilot 模式实际上不是一个好的场景模式,你真的去做过,你就会发现他就是一个问答的专家,他跟用户的业务联系非常的薄弱,而且并不能直接提高劳动生产率。
现在大家又开始关注 workflow 工作流,最近像小到像 Comfy UI 这样的 workflow,大到像 扣子 和 dify,实际上都在往大的 workflow 在发展。
一个大型的 workflow 可以让大模型的能力,真正的跟一个企业的内部的管理业务流程,外部的产品和服务,紧密的融在一起,包括 RAG 外部的知识对齐。
过去认为大模型是核心,这些是大模型的辅助组件。现在如果大模型走垂直路线,RAG、Agent 还有 workflow 变得非常重要,这几个东西做得好坏,直接决定大模型的效果。
吴恩达也有一句话,说一个好的 Agent 框架和 workflow 加上 GPT3.5 最后在某些事情上的效果,是可以超过GPT4.0 。
总而言之,我们很多人也被 OpenAI 误导了,因为 OpenAI 在发布 ChatGPT 的时候,为了让大家容易接受,做了一个聊天机器人的界面,我们很多人就迷信死了这个聊天机器人界面。实际上,在很多场景里,你做了一个聊天机器人界面,是不能直接解决用户的很多问题。
1 个千亿模型换成 5 个百亿模型,响应速度快十倍不止,推理成本降很多
李榜主:我去了您 ISC·AI 的发布会,发布了AI助手,AI 助手是一个什么逻辑?
红衣大叔:AI助手,我们先把它集成到360浏览器和桌面上来,先让我们国内这 15 家兄弟大模型厂商,包括360智脑一共16家,有一个入口的流量。
同时,让愿意尝试使用 AI助手 聊天机器人的用户,有一个可以对比的对象。当一个大模型让你不确定的时候,让其他几个大模型的结果给你做参考,这样你总能找到正确的答案。
更重要的是,我们在做一个 COE 的架构,COE 架构类似 workflow 或 Agent 框架的一个扩大版,是我们专门训练的一个意图猜测模型。Agent 讲究模型的能力增强,Workflow 讲究模型跟业务的融合,COE 架构讲多个模型的协作。
通过意图猜测模型来知道用户的意图之后,来调度其他的若干个,这方面比较擅长的同行大模型来完成工作。
我们做了一个非常复杂的测试,大概有了4000个意图分类,是依据用户在使用 AI 搜索时候真实的问题意图来分类的,这要大过任何一张大模型曾经做过的卷子。
我们给国内这 16 家大模型做了一个能力放射图,测试完我们就知道,百度擅长什么,阿里擅长什么,我们希望把他们的能力能综合起来,用户不需要,手动的去调度,用哪个模型,而是由我们的调度模型在背后调度。
关注 AI产品榜 后台回复关键词【能力雷达】获取 10 个能力维度的雷达图
相当于 16 个有点偏科的学生,每个人都只做自己最擅长的卷子,希望总分能够超过GPT-4。
现在文字能力肯定已经能达到了效果,多模态还差一点。
下一步,我们也会引入类似扣子、Dify 这样的 Agent 框架,那就不光是有一个意图猜测模型在做路由,在做任务的分工,而是通过 Agent 框架来调度多个模型。
譬如:你要做一个翻译,文心一言先做第一遍翻译,然后让阿里通义千问来做挑战跟质疑,最后 deepseek 来做一个润色和改写。
可能三个模型通过一个workflow,通过一个 Agent 框架,协同工作就来达到一个效果。
李榜主:COE 框架已经在用到,360 的某一些产品场景里面了吗?
红衣大叔:用到了我们 360安全大模型里 。
也说的不对,因为没有一个叫 360安全大模型的东西存在,实际上里面做了 6 个专业小模型,这 6 个专业小模型,一个模型就干一件事儿。
实际上,在360AI浏览器背后,我们最早也是一个千亿模型。我不知道 Kimi 的同学来了没有,kimi 做这个长文本文档分析,我都替他们心疼,他们的费用肯定高的不得了。
因为大模型最难的就是成本高,所以后来我们把 1 个千亿大模型换成了 5 个百亿大模型,专门有一个大模型做翻译,专门有个大模型做分析,专门有一个大模型做阅读,专门有个大模型做改写。
整个的响应速度比原来千亿模型,可能快了十倍都不止,推理成本也降低了很多,对算力的要求也降低了很多。
所以还是那句话,一定要找对场景。
找不对场景,你今天用 GPT-4 可能都觉得做不出来,交付不了。
找对了场景,只要你不是老梦想做一个大模型,啥问题都能解决,那肯定是可以的。
这都是被 OpenAI 给带到沟里去的,OpenAI 的想法是做一个全宇宙最强,叫 AGI。
全世界什么人,不管干什么,都来用我一个东西就好了,这个想法固然很伟大,但是现在,真的做不到。
都看到这这里了,给一个免费的 【赞】跟 【在看】吧,也欢迎【分享】给你的好友!也欢迎【评论】区聊聊你的想法!
-- AI产品榜 aicpb.com --
点击图片查阅 最新榜单 已按月更新 13 期
更多榜单
文末点击 “阅读原文 ” 免费访问 或
直接访问 官网 AI产品榜 aicpb.com
AI产品榜 全网同名