查看原文
其他

对话周鸿祎:别被 Co-pilot 带沟里去了|李榜主会客室

李榜主 AI产品榜
2024-12-11

AI 产品榜·1 周年大会 李榜主邀请了 360集团创始人周鸿祎 来进行对话。

你可能刷到过很多红衣大叔的短视频,为了短视频的传播特性,内容在深度上做了很多妥协,你绝对没有看过像这次对话一样,8000 字的深入浅出

AI产品榜·1 周年大会 周鸿祎(左)李榜主(右)

红衣大叔开头说,他的观点大家可能在不同场合听过了,但对话过程中,我发现,有些道理常听常新有些场景越找越明有些逻辑越辩越清,同时红衣大叔也透露了很多 AI 应用的机会

分享给你。


有的公司继续做闭源,我觉得是一种商业选择

李榜主我先请教一个问题,原来您跟李厂长有一个开源跟闭源之争,现在依然还坚持这个开源的观点嘛?

红衣大叔我觉得,你不要老是挑起矛盾啊。

我对李厂长是一贯拥护,而且表示支持的。好像是傅盛同学老要跟他PK一下。像最近这个萝卜快跑,我还亲身到武汉去体验了一下。

我觉得百度在人工智能方面还是做出了很多卓越的贡献,包括国内人工智能团队里边很多应该都是百度培养的人,度相当于是自动驾驶的黄埔军校

关于闭源和开源的这个争论,一直都有,我觉得这个也很正常。最近,扎克伯格推出了 Lama3.1 从刷榜的成绩来说接近了GPT-4, 有些地方甚至超过了GPT-4o,然后他讲了为什么要做开源。

我个人觉得,从现在来看,开源肯定是一个正确的方向,没有开源的 Linux 就没有互联网,今天开源给我们很多开发者,提供了一种科技平权的可能。

所以,这个问题我觉得不用争论,有的公司继续做闭源,我觉得也是一种商业选择。有适当的争论也挺好的,不一定要堵一条路,最后有一条路走成功了,这就可以。


大模型应该消于无形,让用户意识不到大模型的存在

李榜主:最近你们俩的观点好像也发生了一些变化,李厂长也说不要卷模型了,要开始卷应用了?

红衣大叔:我看李厂长在上海2024世界人工智能大会上讲的一个观点,让我觉得蛮诧异的。

因为百度一直在做模型,然后李厂长自己来讲,说大家不要再卷模型了

大家卷模型每次出来,秀自己的各种花里胡哨的功能,觉得没有意义,应该卷产品卷应用、卷场景。

这倒不是说,验证了谁的想法对,我觉得只要人不要太笨,经过大模型 2023 年的百模大战到2024年,其实大家都会回答这个问题。你不回答这个问题,你的投资人会问你。你不回答这个问题,你的客户会问你。你做的东西这么好玩,但是怎么跟产品相相结合?

所以我有一个观点就是:大模型不是操作系统,大模型更像一个组件,更像一个电动机

有人做出来,世界上转的最快的电动机,最后这个电动机,一定要跟用户实际的需求相结合。电动机它只是代表了一种能力,要跟用户的场景相结合。

电动机买回去装上传动轴,装上四个轮子,它可能就变成一个汽车装上传送带,它就变成流水线。装上扇叶,它可能就变成电风扇,取决于你给它怎么跟你的业务去相结合。

我觉得未来大模型会无处不在,会像电动机一样

今天小到一个电牙刷,一个刮胡刀,一个电吹风,可能里边都是有个电动机,但是,你用这些产品的时候,你根本感觉不到里面有个电动机。

同样,你在买一个新能源车开的时候,你也看不到电动机,但是,你能感受到它的能力

所以,我认为大模型应该消于无形,让我们都意识不到大模型的存在

刚才面壁智能李大海讲的,我觉得也是这个理念,无论是云端云测模型还是端测模型,最后,他在里面默默地发挥作用。


AI 应用还不能着急,确实需要一个探索的过程

李榜主:这是不是反映,在行业里面逐步形成了一些共识?

红衣大叔:你说的AI产品爆发进行时,我觉得今年,大家肯定要重新回到场景和产品上来。

我觉得你稍微有点乐观,想一年就解决这个产品场景的问题,我觉得是不现实的,我觉得大概需要个几年的时间,这已经相当快了。

我们只要回顾一下1994、1995年互联网浏览器刚出来,1998年才有了谷歌,才有了2000年代的高速发展,大家也在探索。

所以,我是觉得大家别太着急了,确实需要一个探索的过程

李榜主:那这个探索,在应用层面,老场景老产品机会更多,好像 AI 现在也没有创造一个新的场景,那创业者们,如何去找到一些可以弯道超车啊?或者说可以去杀入的契机呢?

红衣大叔这个我特别怕回答这种问题,你这问题实际上隐含那个图省事的想法,就老想问我如何一招制敌。

我真的知道一招制敌,我就在家做了,我还跑到这来吹什么牛呢?

大模型技术它跟我们过去很多产品模式的创新不一样,它是一个技术上的创新,是一个生产力提升的工具。

首先把已有的产品重塑一遍,把已有的业务流程重塑一遍,是大家比较容易想到的做法。

好比蒸汽机刚出来的时候,大家首先想到的是,蒸汽机能不能取代磨坊把磨面给改善了,能不能带动纺织机提高纺织厂的效率。

所以你看目前微软、苹果,包括各种智能硬件和AI的结合,都是用大模型把已有的能力重塑一遍,或者给已有的流程加上这个智能的能力,我觉得这个做法是比较务实的。

而从蒸汽机到火车的构思需要时间,不光是要解决蒸汽机的问题,要解决驱动的问题,要解决火车铁轨的问题,要解决一系列的问题。

toB 正因为比较碎,这里面才会有更多你的机会

李榜主:在中国呢,做 AI 有什么机会?

红衣大叔在中国来说呢,我个人觉得 toB 的市场,实际上是比较有机会的。

因为这个也符合国家的大政方针,有一次我开一个内部的会,有一位大领导在会上内部就讲,你们做大模型,别老想着做娱乐的东西,要为国家的数转、制改做出贡献。

国家现在强调的是产业数字化,要非常重视传统行业,特别是先进制造业,现代化工业的发展。

既然说大模型是一场工业革命,那它最好就应该直接提高劳动生产力,在 toB 、toG 里面有很多场景。

有人会说这个市场特别碎,好像感觉都是苦活累活。

李榜主:本质,像一个外包?

红衣大叔我不这么认为。

谁都梦想做一个互联网的产品,像微信一样,像抖音一样,一下子就几亿人用,然后就打造一个平台,但这种机会属于千年不遇、千载难逢,而且有时候撞上了也要有运气。

toB 的市场,正因为大家都在探索,所以这个市场比较碎。

如果今天谁能拿出一个放之四海的方案,那一定没有你什么机会,正是因为比较碎,我觉得这里面才会有更多的机会


到底什么是场景,什么是细分垂直场景

李榜主:你说的场景到底是什么?

红衣大叔这两天我也在思考,比如说我们经常觉得,我们的场景已经够细了,比如,我那天表扬了kimi,在所有的大模型都在卷通用的 AI 功能的时候,kimi 应该说算是第一个提出来说做文档分析的,做这个长的上下文窗口,随后大家都跟进了,但是仔细想想,长文档分析,真的是一个垂直的场景吗?

李榜主:它不是一个高频行为。

红衣大叔:它还是太笼统,还是从功能的角度,还是从技术的角度出发的,需要再细分一下

很多企业收到大量的合同,对合同来做一个快速的分析。

雇不起自己的律师,或者花不了太多钱雇外部的律师,可以用大模型帮我看一下这个合同有什么需要注意的、警惕的,需要提醒我有哪些不完善的地方。

这实际上是文档分析的一个更细分的场景,在这个更细分的场景上,我感觉可能,更容易去打动用户

朱啸虎老爱讲他那个自动面试的公司,其实即使不讲面试,很多公司看简历,对简历进行阅读分析评估,实际上也是一个文档分析,但简历有简历的特点。

我觉得在 toB 领域,如果我们能够把场景进一步的细分,跟企业直接的业务需求,能够结合在一起,这里面我觉得会有更多的机会

你要说它更像集成,更像外包。刚开始的时候,用户也不清楚怎么做,你也不清楚怎么做,那为了做一两个POC(Proof of Concept 概念验证)当然是要辛苦点的。

今天大家都觉得华为很牛,华为做了很多产品,直接卖给大家,大家觉得了不起。

可是你看华为早期创业的时候,它也是给中国一些县市一级的通信公司做交换机的机房,那也是到现场去改软件,甚至到现场去改硬件,也是经过了这样一个必然的一个过程。

因为一旦你在一两个模式上获得突破,找到了一个真实的场景,找到一两个成功的案例,你实际上就可以迅速的去复制


toC 的机会在出海,出海的机会在 NGFW

李榜主:AI 在 toC 的应用,怎么看?

红衣大叔:在 toC 的场景里边,我觉得互联网这些巨头会在,自己已经稳固的场景里,比如,聊天是在微信,视频会在抖音,视频工具会在剪映,加上 AI 的能力。

至于做创新的东西,我认为现在可能还真的还需要时间

发明了一个词叫 NGFW,大家知道 NGFW 啥意思吗?

李榜主有知道的可以举下手。

红衣大叔:这个叫 Not Good for Work这种在国内就很难做。但是, 我看那些国外的产品,包括中国团队在海外做的产品,如果能做的很深入,是很有机会的。

目前国外做这个 NGFW 的都是闷声发大财的状态

编辑补充:我找了一个 NGFW 案例不好写在文章里,关注 AI产品榜,后台回复关键词【NGFW】获取案例。


C.AI 卖身了,怎么看。

李榜主:哈哈,大家都懂的。

C.AI 创始人的退出或者说放弃了,从模型角度不算成功,从创业角度算成功的,你怎么看?有没有创业者可以参考的方向?

红衣大叔:出海做 NGFW。

在国内的话,我就鼓励大家多为国家的大战略做贡献,多做 toB、toG 的应用

如果让我总结一个,我认为 C.AI 不叫成功。他只是对他的投资人来说,避免了一定的损失。

大家说他放弃了,说明还是做的不够尖锐、不够聚焦。他似乎创造了很多数字人,但是每个数字深度不够的情况下,你刚开始聊的时候很有兴趣,跟哈利波特聊一聊,跟孙悟空斗斗嘴,但是这毕竟不是一种刚需和高频。

李榜主:但是 C.AI 从这个产品的使用时长上来说,确实是要比其他大部分的 AI 产品的时长是要高非常多。

红衣大叔:跟更差的比可能好一点,但是它的付费率不足以支撑它的发展


只要你场景选的足够窄,几百亿参数就够了,便宜还好用

李榜主:你为什么要做专业的大模型呢?

红衣大叔:我在很多地方讲过。只要你场景选的足够窄,你对大模型的功能要求不那么全面,专业大模型它就不需要那么高的参数,可能不需要千亿万亿的参数,可能几十亿百亿的参数就够了

前面面壁智能的 PPT 里肯定是在讲这个,小块头也有大能力。而且基于开源的模型,做这种能力的蒸馏,实际上,对算力的要求也没有那么高。

最近,国内的正好这十几家大模型都不约而同的把价格降低了,这反映两个原因。

一个是他们确实也意识到,他们原来希望模型即产品这个想法实际上没有那么容易做到

他们需要别人来使用他们的API,因为没有用户的使用,没有数据的反馈,这个模型是进步不了的。

一个是,当价格调低到一定程度的时候,你会发现短期内自己弄一个大模型的运营成本,可能甚至要高于用第三方大模型的 API 的时候,那么你就会愿意接受去用它的API,就形成一个良性的生态

他们价格的降低,也为我们很多开发者做试错提供了一个机会。

如果我们说,大模型市场是一场工业革命,等于才刚刚开始

李榜主:给成年人做一个聊天助手,为什么 OpenAI 这么强,大家依然觉得,很多场景不能满意呢?

红衣大叔:因为成人的需求太多了,特别在工作场景里。在工作场景里有很多需求,目前大模型,如果不依赖很复杂的 Agent 框架,不依赖很复杂的 workflow,不调 API,光是一个 Co-pilot 模式,是不 work 的

但是,如果我们把它放在一个 3 岁到 12 岁的小朋友的场景里,比如说,我手上戴的 360儿童手表上,它是没有工作场景的,我也不希望手表变成一个学习机,就是小孩的一个玩伴,就是小孩的一个AI朋友。

那他所干的主要就三件事,一个陪小孩聊天,第二个给小孩回答各种问题,十万个为什么,第三个给小孩讲故事。实际上这几个场景,用大模型满足,绝对是绰绰有余的。

所以同样的能力,你换一个场景就好解决的多

李榜主:我给我小朋友做了一个AI爸爸。他问我英语我不会,我就说,让他跟AI爸爸去聊。

红衣大叔:那没必要,我送你个儿童手表就行了。

李榜主:多好,哈哈。

360儿童手表已经用起来啦,最喜欢跟巴迪龙聊天


套壳的两种逻辑

李榜主:怎么看待,有人说接 API 是套壳?

红衣大叔不要去管别人说你是不是套壳,用 API 如果就定义成套壳,那以后就没人不是套壳了,最关键的还是要找到应用场景

就像今天在新能源车里边,汽车工业的分工特别明确,这也是汽车工业干了 100 年积累的一些传统。
如果一个人造汽车的时候,比如说,小米他说什么都自己干,什么都自己造,那他不可能三年,造出一部好的车来
事实上,今天大家除了核心的智能座舱,核心的支架系统可能要自己做之外,其他很多的技术都是用第三方的供应商。
那你说,这叫不叫套壳?
电池可能买的是宁德时代的,轮胎可能买的是米其林的。所以,我是觉得,可能大家这个这半年下来,有了很多的经验教训,这没有什么理由去嘲笑,也没有理由去放弃信心,放弃希望,我觉得这都是非常正常。

有两种套壳。

种套壳是本身并没有加入新的场景,只是把他的能力做了一个新的界面,这种套壳比较简单,也没有啥壁垒,你愿意去做也可以,国外有个公司叫 Poe。

我们很多开发者被某些言论给害了,大家做创业的时候不能老听那些评论家的。因为评论家自己不做产品,点评别人是容易。有评论家妄自菲薄,就老认为用开源的,就好像怎么怎么样,就应该自己研发大模型,自己去买 H100 去搞算力,这就把很多开发者引入了歧途。

一种是,把场景越找越准之后,你会发现,今天要解决垂直场景的工作,光有一个大模型和 API 是不够的

甚至说大模型都已经不是,里面最重要的问题了,最重要的问题变成了,你构造什么样的 Agent 框架

就是智能体会比大模型更重要,通过智能体,你才能让大模型从快思考变成慢思考,你才能让大模型从一个光是喋喋不休的一个话唠,变成能够有手跟脚,能够调API,能够实际干活的人。

讲一个可能跟大家不一样的观点, Co-pilot 模式实际上不是一个好的场景模式,你真的去做过,你就会发现他就是一个问答的专家,他跟用户的业务联系非常的薄弱,而且并不能直接提高劳动生产率。

现在大家又开始关注 workflow 工作流,最近像小到像 Comfy UI 这样的 workflow,大到像 扣子 和 dify,实际上都在往大的 workflow 在发展。

一个大型的 workflow 可以让大模型的能力,真正的跟一个企业的内部的管理业务流程,外部的产品和服务,紧密的融在一起,包括 RAG 外部的知识对齐。

过去认为大模型是核心,这些是大模型的辅助组件。现在如果大模型走垂直路线,RAG、Agent 还有 workflow 变得非常重要,这几个东西做得好坏,直接决定大模型的效果

吴恩达也有一句话,说一个好的 Agent 框架和 workflow 加上 GPT3.5 最后在某些事情上的效果,是可以超过GPT4.0 。

总而言之,我们很多人也被 OpenAI 误导了,因为 OpenAI 在发布 ChatGPT 的时候,为了让大家容易接受,做了一个聊天机器人的界面,我们很多人就迷信死了这个聊天机器人界面。实际上,在很多场景里,你做了一个聊天机器人界面,是不能直接解决用户的很多问题


1 个千亿模型换成 5 个百亿模型,响应速度快十倍不止,推理成本降很多

李榜主:我去了您 ISC·AI 的发布会,发布了AI助手,AI 助手是一个什么逻辑?

红衣大叔:AI助手,我们先把它集成到360浏览器和桌面上来,先让我们国内这 15 家兄弟大模型厂商,包括360智脑一共16家,有一个入口的流量。

同时,让愿意尝试使用 AI助手 聊天机器人的用户,有一个可以对比的对象。当一个大模型让你不确定的时候,让其他几个大模型的结果给你做参考,这样你总能找到正确的答案。

更重要的是,我们在做一个 COE 的架构,COE 架构类似 workflow 或 Agent 框架的一个扩大版,是我们专门训练的一个意图猜测模型Agent 讲究模型的能力增强,Workflow 讲究模型跟业务的融合,COE 架构讲多个模型的协作

通过意图猜测模型来知道用户的意图之后,来调度其他的若干个,这方面比较擅长的同行大模型来完成工作。

我们做了一个非常复杂的测试,大概有了4000个意图分类,是依据用户在使用 AI 搜索时候真实的问题意图来分类的,这要大过任何一张大模型曾经做过的卷子

我们给国内这 16 家大模型做了一个能力放射图,测试完我们就知道,百度擅长什么,阿里擅长什么,我们希望把他们的能力能综合起来,用户不需要,手动的去调度,用哪个模型,而是由我们的调度模型在背后调度

关注 AI产品榜 后台回复关键词【能力雷达】获取 10 个能力维度的雷达图


相当于 16 个有点偏科的学生,每个人都只做自己最擅长的卷子,希望总分能够超过GPT-4。

现在文字能力肯定已经能达到了效果,多模态还差一点。

下一步,我们也会引入类似扣子、Dify 这样的 Agent 框架,那就不光是有一个意图猜测模型在做路由,在做任务的分工,而是通过 Agent 框架来调度多个模型。

譬如你要做一个翻译,文心一言先做第一遍翻译,然后让阿里通义千问来做挑战跟质疑,最后 deepseek 来做一个润色和改写

可能三个模型通过一个workflow,通过一个 Agent 框架,协同工作就来达到一个效果。

李榜主:COE 框架已经在用到,360 的某一些产品场景里面了吗?

红衣大叔:用到了我们 360安全大模型里 。

也说的不对,因为没有一个叫 360安全大模型的东西存在,实际上里面做了 6 个专业小模型,这 6 个专业小模型,一个模型就干一件事儿。

实际上,在360AI浏览器背后,我们最早也是一个千亿模型。我不知道 Kimi 的同学来了没有,kimi 做这个长文本文档分析,我都替他们心疼,他们的费用肯定高的不得了。

因为大模型最难的就是成本高,所以后来我们把 1 个千亿大模型换成了 5 个百亿大模型,专门有一个大模型做翻译,专门有个大模型做分析,专门有一个大模型做阅读,专门有个大模型做改写。

整个的响应速度比原来千亿模型,可能快了十倍都不止,推理成本也降低了很多,对算力的要求也降低了很多

所以还是那句话,一定要找对场景。

找不对场景,你今天用 GPT-4 可能都觉得做不出来,交付不了。

找对了场景,只要你不是老梦想做一个大模型,啥问题都能解决,那肯定是可以的。

这都是被 OpenAI 给带到沟里去的,OpenAI 的想法是做一个全宇宙最强,叫 AGI。

全世界什么人,不管干什么,都来用我一个东西就好了,这个想法固然很伟大,但是现在,真的做不到。


都看到这这里了,给一个免费的 【】跟 【在看】吧,也欢迎【分享】给你的好友!也欢迎【评论】区聊聊你的想法!


--  AI产品榜 aicpb.com --

点击图片查阅 最新榜单 已按月更新 13 期

更多榜单

文末点击 “阅读原文 ” 免费访问 或

直接访问 官网 AI产品榜 aicpb.com

AI产品榜 全网同名


继续滑动看下一个
AI产品榜
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存