我今天没有能力给大家发 AK47,但可以教授一些射击的方法,也就是对于创业者来说,在大模型领域应该关注什么市场?市场分为中心化和去中心化。如果把中心化理解为科技巨头、互联网平台公司,那么在已有的业务上,它们用 AI 把握住现有的存量市场,那么这一块不会有创业者大多的机会,除非别人做到 60 分,你能做到 200 分。所以巨头们,会把自己已有的场景,特别是 to C 的场景都占住。为什么腾讯不慌不忙?因为谁做出一个聊天机器人,最大的聊天场景都是在微信和 QQ 里;字节跳动也不慌不忙,如果将来它有一个大模型,在每个抖音场景里给你放一个,那不用都很难。我觉得,巨头一定会用全家桶的思路,把自己的全家桶产品装上它们的大模型。用户又很懒,很多用户会就近使用。所以这个存量市场,或者叫中心化市场,我预估在未来在大模型市场里,很难有大的改变。我觉得在 80% 去中心化的企业级市场,蕴含着巨大的机会。也就是我刚才提到的,每个政府部门、每个行业、每个企业可能都需要结合自己业务使用的大模型。因为大模型就像一个发动机,这些企业都关心怎么把发动机买来,放在自己造的「车」上,和现有的业务进行紧密的结合。张鹏前段时间去美国做了一系列调研。我这几年也一直在转型做 to B 和数字安全,我发现我们的调研结果是一致的,就是很多企业对大模型非常神往,但是他们又有非常多的顾虑。大模型不是云计算,企业不会选择直接接入大模型的 API,通用大模型在企业级场景中没办法直接用。周鸿祎总结主要是以下几个方面的问题:第一个痛点:目前的大模型是万事通,但不是行业通。如果你真的用过 chatGPT,在震惊完它什么都会之后,你会发现一旦问它一些行业的问题,它就会说很多概念性的正确废话。也就是说,ChatGPT 对行业理解的深度还远远不足。我经常夸奖创业者,「你可能是一个天才,但你一定不是一个全才。」反过来,如果把自己定义成一个通才、全才,那么在某一个方面要想达到天才的深度,我认为也是很难的。第二个痛点:不懂企业,不懂企业内部的知识。而我们每个成功的企业,都有点自己的「小九九」,有点自己的 know-how。比如说 360,在数字安全方面积累了全球最多的攻击样本。我会愿意把这个贡献给行业吗?我会愿意把它训练到公有的大模型里吗?不可能。所以这就形成了一个巨大的矛盾。即:企业有独特的知识,希望能够训到模型里面去,这样这个模型才能更加的结合企业的业务,但同时,企业又不愿意把这些知识放到公有云上去。顺道说一下,中国和美国的市场有很大的不一样。在美国,基本上都是公有云的天下。哪怕 IBM 收购了红帽公司 Red Hat,但是私有云市场在美国还是不成气候,甚至美国的很多军方情报机构都会接受和使用微软或者亚马逊的公有云。但是在中国,你会发现我们的企业老板、政务部门对服务器的位置是非常在意的。所以在国内,混合云、专有云、私有云的市场,机会要比美国要大很多。第三,存在数据安全隐患。三星曾经犯过这个错误,360 也给程序员开了 ChatGPT 的账号,让他们试用一下。还真有程序员,把刚写的代码整个上传,让 ChatGPT 给他看一下有没有 bug,这是不被允许的。第四,大模型无法保证生成的内容完全可信,或者说大模型能产生知识模糊、制造知识幻觉。我觉得这是既是优点也是缺点。对于一个帮助别人写剧本、写小说的大模型来说,能编出「林黛玉三打白骨精」、「贾宝玉倒拔垂杨柳」的故事,可以看成创造力的展现。因为在这个出现之前,世界上所有的动物只有人类会瞎编,我们每个创业者都要学会描绘不存在的事情来激励自己的团队,这是产生意识和智力的基础。大模型有了这种能力,让我们看到它有机会产生真正的智能。但问题是,在企业里面,如果这种不可信和企业的业务系统融合在一起,就可能产生悲剧的结果。举个例子,如果有人要做一个中医大模型,准备把本草纲目、黄帝内经全部都灌进去了。但是它给你开了一方子,敢不敢照方抓药呢?怎么解决内容不可信的问题,我觉得是一个非常大的挑战。幻觉问题是一个大模型的普遍问题,谁能解决幻觉问题,相当于摘下了「皇冠上的明珠」。目前看到有人在用向量数据库解决,其他的解决方案还包括使用企业全文检索,企业外部数据库,但即使这样,你会发现它依然不能全部解决这一问题,所以我们也在研究如何训练一个大模型,来保证大模型的内容输出。第五,大模型的模型训练和部署,现在的普通企业无法承担。传说 OpenAI 训练一次 GPT-4,需要 2000 万美元的成本。中国什么样的客户能承受这样的价格?所以,如果不把大模型拉下神坛,让它像 PC 一样变得简单好用、成本低廉,企业是很难接受的。就算有一些企业和单位现阶段买得起大模型,它也雇不起训练大模型的人——现在训练大模型的人比大模型还要贵。最后一个问题,无法保证大模型的所有权。我们的企业和政府,对所有权都非常在意,因为大模型一旦把企业的核心知识训进去了,它的安全性、重要性就无比重要。把中石化的数据拿到,然后去给中石油服务,或者把协和医院的数据拿到,去给 301 医院服务是不现实的。to B 和 to C 的市场完全不一样。另外,我们要考虑国家对大模型的政策法规对创业的影响。我觉得国家大战略是产业数字化。互联网企业要甘当配角,顺势而为,把数字化能力和大模型能力赋能传统企业,特别是制造业,帮助他们实现数字化、智能化。网信办近期公布了一个《生成式人工智能服务管理暂行办法》,它明确了如果你是为企业、行业提供生产力的工具服务,数字化转型的赋能服务,用大模型给中国的产业数字化做赋能,国家是支持的,这对我们很多做 to B、To G 的创业者来说是一个非常好的消息。在我和极客公园张鹏讨论的时候,我们谈到会不会有行业大模型的机会。对这个问题,我现在还处于思考之中,我觉得行业大模型可能是一个幻觉。不会出现公有服务的行业大模型,但很多企业仍然会做私有的行业大模型。可以想象一下,我是一家医院,我有无数的病例知识做训练,训练结束后我会一定拿这个医疗大模型加强我的行业竞争力,但我不会把它开放出去共享给其他医院,所以做公有的行业大模型的机会是不是存在?我们打一个问号,这也是值得各位创业者去思考的问题。
最后简单分享一些我们关于如何让大模型在企业去落地的实战的想法。第一个,虽然大模型无所不能,我建议大家仔细的把大模型的能力好好做一个筛选,把它最通用的、最成熟的能力先拿出来。你像现在有很多人很痴迷于研究 agent 模式,就是代理模式,但是这是国外最前沿的研究。用大模型来做规划,为什么干着干不下去了?规划不稳定,有时会陷入死循环,而且让大模型做规划,控制资源还有很多安全问题。我觉得大模型最常用的功能只有两个:一个是知识问答,一个是写作生成。所以我觉得应该先把大模型这两个功能找到各种细化的垂直场景应用。第二个,要选择用户的痛点和刚需切入,「小切口、大纵深」。实际上目前讨论大模型跟生产业务系统连接的,我认为现在都是浪漫主义行为,我非常的不赞同。我的建议还是先回到办公的场景。我把它划分为四个需求:上下内外。对上,就是对领导,需求有信息决策、舆情分析。对下就是对普通员工来说,需求包括企业的知识搜索、知识管理和新员工培训。对内,需求有办公协作,办公生成。对外,智能客服。这些目前的场景都是企业客户比较能接受的,也是大模型比较擅长的。第三个,这个观点会很有争议,一些创业者希望用大模型来做主驾驶驱动业务系统。我倒是跟客户都这么讲,大模型不是万能的,那么你现在的很多业务系统是不能被取代的。创业者千万不要介入旧系统的改造之中,陷入其中可能长期无法交付。大模型要跟现有的系统做一定的隔离,尽量少发生 API,函数调用的联系,它们看起来很强大,但和已有业务融合在一起很难交付。做一个相对独立的人工智能的公文系统、问答系统、知识管理系统,那么它相对容易落地,容易交付。第四点,人工智能应当作为副驾驶。微软做的产品叫 Copilot,想想还是很有道理。现阶段人工智能还是有一些不稳定和不确定的情况,不要让它来做出不可撤销的决定。我举一个例子,比如我们可以专门做一个系统,就叫客户邮件生成,给客户写邮件。系统可以生成文本,可以帮助修改用户的邮件,但是千万不能接管用户的邮箱。你想有一天我的机器分身接管了我的邮箱,自己就给别人发了一些信件,也太可怕了。第五点是坚持 AI 普惠的原则,大模型发展要以人为本。我们做大模型的创业,不要给企业宣扬有了这个东西就会裁员。过去很多信息化系统在落地之后,跟普通的企业的基层员工没有关系。但人工智能的办公系统的用户实际上是单位里的很多普通员工、中层干部,当然也包括领导。如果中层骨干和基层员工都讨厌你的系统,你的系统一定不会成功。这件事表面看起来是 to B 的模式,最后实际上你的产品的使用终端是 to C 的,最终的用户还是企业里的个人。第六点,也是和它相关的一个观点,因为我们需要让企业里的每个人都能使用,我们做 to B 产品时需要考虑产品体验。我认为现在有些人宣扬 LUI,也就是用自然语言作为交互界面,现在有点走火入魔了,我也不认同我们每个人都要变成 prompt 专家。网上有人研究写 prompt 写到那个令人发指的程度,那 prompt 你说它是中文吗?说它是自然语言,它写得又很有格式化,说它是编程序语言吗?它比编程语言还复杂。写 prompt 对于我们的观众来说可能不是很难,但是对一个企业的普通员工来说,基层员工来说,这个东西比搜索还要门槛要更高一些。所以我在内部讲,能用程序解决的问题千万不要用自然语言去解决问题。不要去迷信 LUI,我认为未来 CUI、GUI 将成为主流。CUI(Conversational User Interface 对话式用户交互界面),是指可以把一些功能定义成数字人。数字人绝不仅仅局限于直播中,我们在政府里面做了一些尝试,提供数字顾问。当员工面对一个法律顾问时,他只会问跟法律相关的问题,更适合专业的垂直大模型。GUI(Graphical User Interface)是图形化交互界面。很多场合下,比如点餐,在图形化界面上快速的点选其实还是最方便的交互方式。如果拿语言说,「我要一个葱姜肉丝,多加点葱,不要姜。」虽然机器能理解,但是它依然很繁琐。大模型很好,但大家不要走极端,总说要把 GUI 都消灭。将来的应用,背后可能是大模型的 API,但是前端依然会是各种应用软件的界面,这样也能更好地和企业的业务系统融合。所以我建议三条路并行,LUI 满足高级用户,CUI 满足领导,GUI 满足普通员工。所以最后总结一下,在我想象里,如果今天你有幸给一个企业做一个行业或者垂直的大模型,你不要试图去解决万能的问题,你不要试图去解决所有的问题,你也不要跟它原来的业务系统糅合地特别紧密,你就是挑一个领域说,我帮你做一个知识管理,或者知识问答的应用。不过知识管理,大家不要狭隘地理解为回答问题。举个例子,有一次我听百度的 Robin 在台上讲,说他们进入了造车领域。我一开始有些不解,他和我解释说,一个车厂有上万种零件,有几千种工艺。创造一个工具,使大家可以及时地找出来应该用什么零件,这本身是知识搜索的范畴可以解决的。你会发现,在很多场景下,本质的逻辑都是知识搜索。我建议大家去选小的切口,小的场景。比如我了解到,山东省想推文旅大模型,让外地的人知道山东不仅有淄博的烧烤,还有其他的旅游项目。这用知识问答就可以解决,知识问答的方向可能是文旅知识,面向的是全国各地的旅游者。选这种小的接口、小的场景,特别容易成功。现在很多甲方对于大模型依然还是一个半信半疑的态度,他们不是我们这行业里的人,他们也被无数新技术骗过。每次出来一个新技术都有公司找到他们,劝说他们花钱做个新技术,所以客户希望的是我能不能花点小钱,快速地一两个月、两三个月能出一个成果。如果这个成果出来之后,他的客户,他的员工都能用一下,像我们第一次用 ChatGPT 一样,有一个「哇」的感受,我认为你就获得了第一步的成功。所以这个模式的验证可能比你第一次要挣用户一个亿可能更为重要。
05
守住安全底线,
迈出大模型创业坚实一步
最后,构建企业级大模型,我认为应该遵循安全、向善、可信、可控。安全指的是网络安全、数据安全、算法安全,这也是 360 核心要解决的方向。向善的原则,主要是内容安全,要注意不要让 AIGC 成为诈骗者的工具。可控,是如何把大模型关在笼子里边,保证它变得非常 powerful(强大)的时候不会危害人类。这边有两个原则,一个是说永远让人在决策的回路上,而不能让大模型决策。第二个我觉得做垂直大模型也是一个很好的解决思路。垂直大模型出错的概率比一个天才大模型出错的概率要低很多。大模型的进化刚刚开始,百模大战才是第一波浪潮,有了开源之后,万「模」乱舞都是有可能的。我觉得企业级市场具有无限的创业可能性,而且这个市场不会被垄断,不会被统一。360 也做了自研通用大模型「360 智脑」,我们希望能够与许多创业者合作。如果你愿意做行业市场,那 360 可以提供 to B 方向很多的经验和算力。我们也愿意把很多原来是我们安全的客户分享给大家,因为每一个行业都需要有大模型的深度结合。光有 foundation model(基础模型)是不够的,与 B 端结合的技术和经验非常重要。我们目前的服务已经落地了。我们和中税集团合作做了一个税务大模型,在注册税务师考试里面,我们比 ChatGPT 还高 5 分。那么我们也跟黑马创业联合做了一个企业服务大模型,帮企业写各种评高新企业的报告,人写报告大概花几个月,大模型写报告效率比人能够提升 20 倍。我们也发起了 GPT 产业联盟。许多创业者希望说我像 OpenAI 一样做一个大模型,我就等着卖 API 赚钱了。这个想法我觉得对创业者是很难的。还有人希望说我做一个大模型,我就卖给企业,企业直接采购了去自己用。真正做过 to B 的人都知道这个想法很不切实际。即使是 Oracle(甲骨文),在中国还有很多增值服务商,帮助它能够和企业的行业理解,企业的具体的业务领域相结合。所以,现在要说在大模型的 to B 方向能够形成一个产品方法论,我的建议就是:深度垂直,重度垂直。不能太贪心,上来之后就选择多个行业铺开。你可以在某一个行业,比如说教育,比如说医疗,选择行业中的一个顶尖的,有数据有知识的企业进行深度合作,我觉得这可能是大模型创业最坚实的第一步。谢谢大家。 如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。 更多阅读