天天都在说AI agent,这些制造AI agent的人们究竟在想些什么
智能体的概念自去年底开始受到广泛关注,智能体的发展及其增长策略是当前讨论的热点。
智能体有多种形态,包括通过低代码/零代码开发的小助手、提供陪伴和交互功能的AI伴侣,以及能够直接协助人类提升生产力和效率的AI智能体。
本次直播探讨了从技术实现的挑战、商业模型的构建到用户增长策略的全方位议题。我们试图探索智能体如何影响企业的未来,并探索在这一变革过程中如何实现可持续的增长。
嘉宾阵容:
骆轶航-品玩/硅星人创始人&CEO
周健-澜码科技创始人兼CEO
樊刚正-汇智智能联合创始人
什么是智能体?
周健: 在当今时代,算力对于创业公司至关重要。如何有效地利用这些资源,实现技术落地,成为一个重要问题。
我们的目标是帮助大型企业的创新部门解决这一刚需问题。在私有化部署环境中,我们发现AI智能体最有价值的两个功能是信息抽取和指令遵循。信息抽取指的是从大量文档和规章制度中提取关键信息的能力。指令遵循则是通过自然语言处理来理解和执行任务的步骤和指标计算的能力。这两个能力为我们提供了广泛的应用场景,使我们能够批量复制这些核心能力,从而满足不同客户的需求。
AI 智能体(Agent)的概念与中介(agency)相关,它代表数字环境中的智能体。从RPA时代发展到现在,AI智能体的环境已经从笔记本电脑扩展到数字世界,包括数据库、网站和企业系统等。同时,还有智能世界,即人类和越来越智能的智能体。此外,还有物理世界,如物联网和摄像头。AI智能体应该帮助人类在这些世界中交互和完成任务。
大语言模型的出现使得智能世界的理解和互动变得更加容易,这是AI智能体成立的关键点。尽管如此,我们认为AI智能体还缺少一个重要的组成部分——世界模型。即使是最简单的应用,如行程助手,也需要有一个“状态机”来表征环境和状态。AI智能体需要能够感知环境,帮助用户从状态A转移到状态B,并考虑成本和回报。
樊刚正: 从我们的用户群体出发,我认为智能体的价值在于能够为中小企业解决实际的小问题,尤其是过去那些占用大量时间的环节。
针对中小企业客户,我们不能要求他们投入巨额资金做AI转型,所以智能体的应用成本还得低廉。成本既包括实际的项目成本,也包括教育成本。在推广智能体的过程中,我们发现很难向中小企业解释清楚智能体的概念。客户不需要智能体的定义,他们只关新智能体是否像下载应用一样简单易用。
因此,我们接受对智能体做宽泛的定义,比如“大模型+插件工具”就可以视为智能体,这种简化的解释更易于用户理解。另外,我们的商业模式更专注于发挥平台层的价值,而不是直接解决每个用户的需求。当客户有交付需求时,我们会让合作伙伴一起参与。对合作伙伴来说,一个更容易理解的智能体概念也有助于合作推进。
如何处理智能体与现有数字化平台的关系?智能体如何与现有的数字化平台协作或竞争?
周健: 服务大中型企业,尤其是央国企,是一项复杂任务。这些企业如银行、能源企业、电网和航空企业,它们要求稳定,为这些企业服务需要找到战略方向、投资资源,这是一个系统工程。
免费服务在TOB领域并非好策略,可能带来责任归属问题。
私有化部署不仅是软件提供,还涉及咨询、指导企业如何投资和行动。数字化转型是一个渐进过程,企业需要时间理解和接受新技术。例如,大型银行可能有巨额IT预算,预测未来将有相当比例投资于大模型相关技术,但具体实施策略需要仔细规划。
AI智能体和数字员工的概念正在演变,大语言模型使得AI 智能体更像真正的员工。专家知识在AI 智能体中至关重要,它决定了业务结果的价值上限。B端服务中,AI 智能体的责任归属是一个重要问题,企业需要考虑AI 智能体在决策中的作用,以及如何确保其行为的合法性和安全性。
随着AI技术的发展,多Agent系统协作变得可能,但也带来质量控制和责任归属的挑战。目前,建议企业专注于单个Agent的使用,以保持专业性和质量。未来的组织结构可能会因AI 智能体的融入而发生变化,类似于历史上军队结构的演变,从静态到动态,以适应新的技术和战术。
骆轶航:大中型企业,包括银行、电网和央企,具有强烈的使命感,这既来自企业自身也与国家使命息息相关。这些企业不仅使命感强烈,而且非常焦虑,希望推动事情向前发展。在强调模型泛化能力的同时,可能隐藏着在专业知识领域出现问题的风险,因为泛化能力和专业知识有时难以兼容。
提及大模型API价格战,如阿里云、百度云和Open AI大幅降低价格,反映了通用模型能力的普及。但这并不能用来衡量API的价值,因为一个强大的模型API能否在具体场景中良好运作,还取决于其与知识库的结合程度。当前模型发展趋向于采用MOE架构,这有助于支持长期、可持续且稳定的商业模式。有使命感的企业在转型过程中行动迅速,因为他们的认知能力强,不需要过多解释变革的重要性。
但在执行过程中,他们非常谨慎,这要求服务提供者考虑企业组织结构和痛点,帮助他们避免高度的、精确性的问题,这是非常有价值的反馈和思考。澜码提供的服务不仅仅是转型服务,还包括深度的咨询服务,我理解这是一个非常重的业务。
而汇智智能的生意相对较轻,面向TOC的服务相对简单,与文心一言等面向C端的服务具有相似性。同时也面向B端提供服务,特别是对小型企业。
小型企业大企业不同,大企业一旦签约就会持续合作,出现问题会有人负责,不继续也会有人负责,因此他们会持续推进合作。而小型企业端的合作更为松散,认知相对不清晰,缺乏天然粘性。如果使用效果不佳,小型企业端可能会立即停止合作。
在这种情况下,我们需要思考如何抓住小型企业端用户,增强他们的品牌忠诚度。我们需要在实践中探索工具包的形态,包括衡量服务成功与否的标准和指标,明确工具包包含哪些内容,以及如何通过内部逻辑和标准来评估服务小型企业端客户的成功或失败。
如何设计和评估一套工具包,以增强小型企业端用户的心智并衡量服务他们的成功与否?
樊刚正: 在面向小型企业端用户的服务中,我们经历了三个阶段的智能体交付方式。
最初我们做了一个小程序,让用户自己在小程序上创建和上传知识库,包括调试提示词,但很快发现这种方式对用户来说太复杂,小程序也变得越来越臃肿。
所以第二阶段,我们转向自己完成交付,提供标准化智能体,但用户有源源不断的定制化服务需求,我们的运营人员不可能满足每个用户的个性化需求。依靠运营人员自己设计的智能体,数量和多样性都不足。
因此,第三阶段,我们转向让合作伙伴完成部分交付工作,特别是那些了解行业的合作伙伴,他们可以提供更深度的定制化服务。通过这种模式,我们的工作变得更加轻量,专注于最新技术的接入和市场培训团队的建设。
合作伙伴利用我们的平台能力,面向自己行业的用户提供服务,我们提供底层技术支持和售前服务。我们为合作伙伴提供行业解决方案,帮助他们在自己的行业内推广智能体。例如,我们与中国殡葬服务网的合作,通过成功举办行业分享活动,吸引大量行业人士的兴趣,为合作伙伴带来收入。
另外,尽管汇智智能的行业定位在平台应用层,我们仍然开发了自己的大模型。这是出于成本和技术的能力双重考虑,拥有自己的大模型可以控制成本,确保给合作伙伴和终端用户提供合理价格,同时深入底层技术,还能让团队能快速适用、接入新技术,保持开发敏捷性。
骆轶航: 对于某些AI agent服务来说,调用外部模型的接口能力可能意味着更高的成本,有时高于自建模型。这通常是一个未被广泛讨论的事实。
另外观察到的一个现象是,总结过去一年的经验和教训,发现我们好像进入了“既要又要”的形态当中,起初服务过于轻量,随后又过于繁重,现在我们根据需要提供给客户或用户,同时在通用服务和垂直服务之间做出选择。这种策略可能导致团队扩张,但将针对单一企业的服务转变为面向整个行业的服务,可以同时服务数百家企业。
AI Agent从某种程度上来说,可能是一项相对重的生意,不知道两位是否赞同。
樊刚正: 数字员工要真正落地,关键不在于接口或自动化问题,而在于记忆的传承和共享问题。只有实现这一点,数字员工才能被视为真正的员工,否则只能作为工具。
我们团队在大模型长期记忆上做了重点投入,开发了名为数字生命的技术的专利技术,让智能体能够实现以年为计量单位的长期记忆。
比如我们给苏豪集团定制开发的智能体云服务:在集团内部的智能体平台中,员工可以将自己的日报和周报发送给智能体,也可以用智能体来完成日常的一些工作。通过分层级的智能体空间设计,智能体能够继承离职员工的记忆,新员工可以询问智能体岗位前任员工过往一年解决的问题和挑战。此外,智能体还能模拟与上级沟通的场景或在员工缺席时参与群聊,替代真人进行协作。
推广数字员工时,我们也会遇到用户习惯问题,比如把日报发送给智能体。改变习惯非常困难,就像早期财务软件推广一样。此外,还有隐私问题,有的员工不愿意将信息交给智能体。在推广数字员工时,需要考虑用户习惯、工作量、隐私问题等综合因素。
在使用智能体进行工作时,客户面临哪些独特的痛点和责任归属的困惑,以及如何为这些挑战提供有效的解决方案?
周健:在实践中,运营智能体被证明是一项十分困难的任务。无论是交易助手、出差助手还是数据分析,这些领域都存在很多变化。
例如,银行业务中的“一表通”,涉及到大量报表上传下达问题,特别是上级监管机构要求银行和央企按规范收集和上报财务数据。疫情期间,突显了组织在数据上报和组织协调上的困难,监管侧希望按需调整,而传统方式下实现的成本很高。
现在有机会利用智能体实现个性化定制和调整,以应对运营中的变化。但这也带来了新的挑战,如时间计算、业财一体化的复杂性,以及业务解释的多样性。理论上,使用AI 智能体可以提高精确性,但同时也带来了新的博弈问题和如何处理模糊性的问题。
AI 智能体的可解释性改变了专家知识传承的方式,现在可以更精确地执行和检查过程。自动化使得专家知识可以被记录和分析,进而迭代。例如,在招聘过程中,专家规则的应用和结果可以被量化和优化。智能体的运用需要在短期效率和长期效益之间找到平衡点,这本身是一个巨大的挑战。
骆轶航:在讨论中,我们认识到即使是先进的模型配备自动化工作流,也会面临许多挑战。
这些挑战包括模型本身的能力限制、安全对齐问题、组织形态的变化、个体习惯的转移,以及过程中的利益和取舍考量。这是一个复杂的过程,需要深入了解。
一个重要的收获是,无论怎么做,这都不会是一个轻的生意,尤其在中国。中国的组织形态和公司运作方式非常多元化,体量和规模也很不均衡,这增加了业务的复杂性。模型和智能体之间存在关系,我们希望不受限于模型的局限,也不想因模型局限带来成本的不确定性。我们了解到,不需要开发一个特别大的模型来支持智能体。
从周总的观点中,我们得到启示:即使在C端或媒体端看似具有巨大颠覆性和革命性的模型更新,真正落实到企业中需要一个漫长的过程。企业需求和模型更新之间存在差异,需要结合企业实际情况。
如果AI智能体技术足够好,适用性和兼容性足够强,并且与专家知识库结合的解决方案扎实,那么它某种程度上不依赖于模型本身,AI智能体的先进性并不完全与所谓的scaling law成正比。我们需要理解模型和智能体之间的关系,并探索它们如何相互独立又相互支持。
怎样理解模型和智能体之间的关系?
樊刚正: 通常认为,大模型是底层基础,而智能体是基于底层模型开发的应用。但随着应用的发展,大模型本身的重要性可能在降低。开发大模型有固定的步骤,如数据标注、预训练和微调。
相比之下,开发大量实用的智能体要困难得多,因为大模型追求的能力方向是相对固定的,而智能体需要满足用户不断变化的需求。如果开发者不能明确智能体的改进方向,尤其是获取不到真实用户需求时,落地将非常困难。数据对智能体开发的重要性等同于对大模型的重要性。
智能体需要通过外部输入或特定的数据集来满足垂直场景的需求,还有大量差异化的行业数据等待挖掘。这是一个巨大的工程,不可能只由一家公司来完成,这也是我们广泛吸纳合作伙伴的原因。如果无法获得相关资料并进行有效训练迭代,只能交付一个半成品,用户最终会发现它并不好用,转头就去寻找其他平台或者解决方案。
骆轶航: 首先,智能体的发展可能会减少模型本身的重要性,这是由于智能体能够提供更直接的应用和解决方案。其次,无论是模型还是智能体,数据都是最重要的因素。数据的质量和处理能力在很大程度上决定了模型和智能体的有效性。
在商业化过程中,算力的分配可能会偏向于大规模商业化项目,如与普华永道等大公司的合作。这可能导致资源从其他项目转移,影响智能体的开发和应用。智能体在商业化中的角色是一个有趣的议题。企业可能希望绕开微软等大公司,建立自己的复杂架构智能体,这涉及到如何平衡商业化需求与技术实施的挑战。
如果智能体做得足够好,会不会让人们依赖于通用的模型的先进性?
周健: 我们从组织管理的视角看待智能体,认为当流程标准化到一定程度时,对人的要求会降低。在大型企业中,流程被视为资产,有助于人们更好地协作。
大模型的发展让机器能更好地适应和理解人类,使我们能复用这些流程资产,让大模型在其中发挥更大作用。早在GPT-4发布时,我就深度思考过大模型与智能体的关系,也促使我思考如何利用大模型的优势来强化澜码的服务价值。
我认为,即使信息可以完全共享,人与人之间存在博弈,需要模拟这种博弈过程。这涉及到多智能体间的协作和通信协议。长期来看,数据的收集和分析可能为智能体提供解决方案,但目前存在很大挑战,短期内实现这一目标似乎不太现实。
超级个性化是未来的一大挑战,尤其是如何为每个个体提供理解他们的助手。能源消耗问题可能是大模型发展的瓶颈,个性化服务的普及和质量是一个难题。大模型和智能体代表两个不同的维度,大模型可能发展为更强的云端大脑,而超级个性化则需要为每个个体提供助手。智能体的普及和质量,尤其是对于需要高度个性化服务的个体将是一个巨大的挑战。
如何去定义智能体的用户增长?用户的稳定更重要还是增长更重要?
樊刚正: 从汇智智能的视角看,增长比稳定更重要。我认为应该先追求增长,再考虑稳定。
首要任务是让行业用户开始使用智能体,如果用户不使用,前面提到的差异化数据就迟迟不能获得,智能体自然也无法发挥它的作用。用户增长是智能体发展的第一推动力,相对的,稳定性并非当前最紧迫的问题。我们的目标是先让用户使用起来,再逐步优化提升。技术选型不断变化,新的大模型和智能应用平台不断涌现,从商业角度出发,要生存就需要先抢占市场先机。
大家现在普遍认为2024可能是智能体元年,智能体的未来或许很长,但智能体市场的窗口期可能是短暂的,就像社交平台一样。为了实现快速增长,我们计划建立城市运营中心,让城市合伙人直接面向用户。通过沙龙、大型会议等形式,帮助伙伴迅速增加用户数量,这比在单一区域推广更有效。
我们正在和一些企业咨询公司合作,这些公司已经在数字化转型和咨询服务领域与企业建立信任。他们可以向客户推荐我们的智能体平台,利用现有关系促进用户接受和使用智能体。我们还与知识博主合作,当他们在面向企业和个人提供培训时,也可以推广智能体平台,实现更广泛的市场渗透。
周健: 我们讨论的核心是数字员工,涉及新质生产力的概念。
技术是推动从工业革命到当前技术革命变革的关键。技术革命带来了编程语言的范式转变,从现代语言如Java、Python向更高级别的形式如提示词、智能体等发展,预示着编程群体的变化和新的世界语言的诞生。
最初我对GPT-4的代码生成能力抱有较高期望,认为其能生成相当于程序员一天工作量的几十行代码。然而,实际测试后发现其能力有限,这也引发了我对智能摩尔定律和模型能力边界的深入思考,随着模型的不断演进,我们需要通过迭代和堆叠不同规模的模型来探索其能力极限。
对于我们的客户群体,提供安心和明确的能力边界至关重要,确保在特定场景下模型能够胜任。这不仅需要我们具备分辨能力,还需要我们能够让客户信任我们。
我们试图从底层原理上给出指标,因为仅仅追求准确率而不考虑实际场景是没有意义的。在当前的技术和创业环境中,组织模式可能比技术本身更为重要。我们不仅要关注技术的发展,还要关注如何有效地组织和利用这些技术。
对于创业企业而言,抓住第一性原理,明确核心竞争优势是至关重要的。我们需要确保在竞争中不被超越,保持稳定的增长和生命力。