其他
AI智能体与人类的未来协作方式、合作组织与生产空间(万字长文)
说明1:本篇长文以口语化表达逻辑为主,不同于以往基于思考逻辑的文字表达方式,文本阅读上相比以往文章可能不太严谨,存在口语缀词,表达重复的诸多情况,敬请见谅!
说明2:本篇文章的语境是面向大众科普,因此表达口语存在学术前沿与技术工程上的不严谨以及概念误差。(整篇修改对齐学术研究标准工作量太大了,建议研究员可忽略本篇文章)
本文底部有本次公开课会议的录屏链接。
01
互联网超级个体的由来
超级个体这个概念并不是很新,它早在互联网初期就已经存在了。我还记得,最早提出这个概念的人是古典,他是一位超级个体的咨询师,当时也有一些相关资料可以查阅。
在互联网时代,超级个体的核心思想是利用网络的力量。如果你在互联网上拥有足够多的粉丝和影响力,你就可以通过网络来获取资源和变现流量。
02
三大技术叙事融合趋势
这三个技术趋势不仅仅代表了具体的技术,更是一种具有巨大社会影响力的技术概念,这些概念交织在一起,将对整个社会产生深远的影响。
让我们再深入思考一下所谓的超级个体时,需要先考虑一些前提条件和背景因素,这三个主要背景因素是最不容忽视的。
03
如何定义新一代的超级个体
想象一下,在工业革命早期,工人的生产空间就是工厂。例如一个纺织工女坐在一台纺织机前织布,就构建了一个典型的生产空间场景,她的纺织机就是她的生产工作台,她与工作台所处的环境整体构成了她的生产空间。
进入现代,我们看到白领工作都在办公室里,坐在电脑前,这台电脑与工位就成了我们的工作台,电脑、工位、办公室构成了都市白领的工作空间场景。
在Vision Pro的虚拟世界中,我们将进入一个虚拟空间,这个空间允许我们随意调用各种不同的桌面和窗口,与我们今天的PC端或移动端工具相比,虚拟空间内的工具将具有更立体的特性。这将为我们创造全新的生产空间。
我们完全可以想象的一个必然发生的场景就是,在这个虚拟空间中,我们可以将工作流程具象化,就像一个工厂流水线一样,在这个流水线中,可以放置不同的智能体完全任务的处理。
在这三个主要背景下,未来的工作模式必将经历巨大的变革。我们需要深入了解这三个不同的科技趋势,当它们相互融合和碰撞时,将如何彻底颠覆传统的工作方式。
那么,经过对这些背景的了解,我们可以定义新一代的超级个体是什么?它是由一个拥有自己AI团队的个体组成,能够执行自动化任务工作流程,并与其他超级个体建立更智能和自动化的协作关系。
超级个体与超级组织必然涌现出全新的社会生产方式。
04
那人类与AI协同的三种方式
传统的公司中,工作更多地是人与人之间的交流和协作,但很多时候沟通和任务交接都是一个巨大的问题。这一部分工作通常非常繁琐和复杂,但它完全可以交给Agent来自动化执行,从而帮助我们更好地沟通。
首先是"embedding"模式,你可以将其理解为我们通过与AI进行语言交流,使用提示词来设定目标,然后AI协助我们完成这些目标。
其次是"Copilot"模式,在这种模式下,人类和AI各自发挥作用。AI介入到工作流程中,从提供建议到协助完成流程的各个阶段。
第三种模式是"Agent"模式,由人类设定目标并提供资源,这些资源通常是计算能力,然后监督结果。在这种情况下,Agent承担了大部分工作。
第三种模式将成为未来人机交互的主要模式。
05
什么是AI-Agents
为什么我跳过常见的提示词工程,而是直接讲解Agent这个看起来非常前沿的概念呢?
在这一波大型的语言模型中,实际上AI革命可以分为两个主要方向。一个是AIGC(比如以生成图片为代表的技术),它代表了一种技术路径。另一个是大型语言模型,它与生成智能内容不同,实际上是一种通用的推理与预测机器。
像OpenAI这样的机构希望将这种语言模型视为通用问题的解决处理器,它不仅能够生成文本性的内容,还能够解决各种各样的问题。
然而,语言模型本质上是一种"大脑",它没有实际的身体来执行任务。这时候引入"Agent"的概念,它将语言模型作为核心控制器,并赋予它执行各种自动化和智能问题处理的能力,从而使其成为一种通用的、多功能的自动问题解决机器。
这也反应了我们当前对AGI的一种寄托吧!
06
基于LLM驱动的Agents系统
Agents系统的构成功能在这个图中,Agents可以分为四个主要部分:记忆、规划、行动和使用工具。
简单来说,记忆是关于存储信息,规划是关于将目标分解为小任务,行动是指执行这些任务,而使用工具是指借助语言模型的能力。
在规划方面,Agent能够将一个大目标分解成小任务,就像我们在使用ChatGPT时通过提示词设计可以将任务逐步细化。
例如,你可以让它生成一个商业方案,但你还可以要求它详细说明方案的每一步骤。这是基于语言模型的能力。
反思与完善是指语言模型具有检查和改进制定计划中不足之处的能力。而记忆分为短期记忆和长期记忆,短期记忆通常是指上下文信息,就像在使用ChatGPT时的对话框中的内容。
在对话过程中,会不断添加信息,比如你可以创建一个关于如何开设一家公司的对话,然后逐步补充有关你理想公司的信息,比如它是科技公司还是咨询公司,或者是一个结合了咨询与科技的公司。
对于新公司的情况,你可以利用与ChatGPT的对话来积累数据,这就是短期记忆。
但长期记忆是什么呢?在聊天过程中,ChatGPT的上下文信息是有限的。如果你需要大量的数据,比如你研究了某个商业领域,可能有上百本关于商业的书籍,你希望ChatGPT能够从这些书中提炼你所需要的信息,这就需要它具备长期记忆。
通常,这可以通过使用向量数据库等相关解决方案来实现,以满足长期记忆的需求。这样一来,在交流过程中,很多数据可以被积累下来,使得Agent的可用性变得更加强大。
工具的使用实际上涉及到各种各样的能力。
例如,如果你将Agent视为一个自动化机器人,市面上的各种AI工具都可以通过Agent来实现自动化操作与执行。
这涉及到人与机器的竞争,因为现在市场上有很多普及的AI工具。这些工具通常会提供大量的教学和指导,告诉你如何更好地应用它们。
Agents使用AI工具的更顺手但人类使用工具绝对比不过Agents来自动化使用工具。
此外,Agent还可以学习调用外部的API。有一个项目叫做API bank,它提供了数千个不同的接口,可以用来调用各种不同的AI工具。
举个例子,如果有一个项目结合了Notion作为输入界面,在输入编辑页面中,你可以通过不同的指令调用不同的模型。
例如,你可以写一段描述,比如“我写了一只小狐狸在森林中”,然后请求机器人帮助你优化成500字的段落。这时,你可以调用GPT-3.5,它可以将你的描述扩展成一个500字的段落描述。
在这个场景中,你写了一段描述,比如“棕色的小狐狸在一个秋天的森林中,在枫叶飘落的时候回头看了我”。然后你可以选择调用另一个模型,可能是一个生成图片的模型,来直接将这段描述转化为一张图片。或者你也可以使用一个接口来将这段描述生成一个视频。
在这个过程中,通过一个操作台,你可以让AI调用不同的API,从而实现复杂的任务和高质量的结果。
这种方式与现在大多数情况下使用特定工具组合应用在工作上的方式完全不同,这种交互方式代表了Agent的一个重要特点和优势。
07
AI-Agents的几个关键方向
在这张PPT中,我将其分为两个大的方向,一个是"自动化代理",另一个是"智能体"。
"自动化代理"指的是一种以人类为主导的协作关系,其中自动化代理通过执行各种任务来协助人类。
而"智能体"则具备一定的类人格特征,它能够自主决策,具有长期记忆。
这个词叫做"类人格",因为人工智能是一种类似人类智能的智能,但并不完全等同于人类智能。
在这个层面上,"智能体"有自己的思考和行为,类似于游戏中的非玩家角色(NPC),它们有自己的想法和目标。所以这个方向的定义被称为"智能体"。
除了这两个关键方向,还有一些关键技术的涌现,这就是"Agent系统"。在前面的图表中,OpenAI提出了关于智能体系统的基本框架。
但实际上,现在大型模型公司对于A人系统的理解和设计各不相同,因此不同的智能体系统会有各种各样的变化,这意味着智能体的多样性将会更加显著。
另一个重要点是多智能体。多智能体是一个非常复杂的学术研究方向,随着智能体开始普及到大众市场,多智能体的概念也成为了重要话题。
例如,斯坦福的虚拟小镇就包含了25个智能体,从某种程度上可以将其归类为多智能体研究的范畴。
08
AI技术的自动化范式——AutoGPT
AutoGPT实际上是自动化代理这个领域的一种技术方式,它虽然不是非常成熟的技术,但代表了一种新的可能性,为创造更实用的产品打开了新的世界。
那么,AutoGPT到底是什么呢?它基于GPT-4,是一种实验性的技术。你可以在语言模型中提出一个需求,比如说,我想用100美元创建一家创业公司,希望每个月能够获得1000美元的营收。然后,AutoGPT会思考如何用100美元创建这样一家公司,它会不断地拆解任务。
回到图中的右侧,你可以设定一个目标,然后AutoGPT会帮助你制定商业计划,决定如何执行任务,拆分任务并选择工具。
例如,如果你想创建一家品牌营销公司,它会自动化注册公司、设计logo等一系列任务。这些任务非常繁重,因此在使用语言模型时,你需要提供计算资源来监督结果是否可行。
AutoGPT代表了一种完全自动化的实现方式,试图抵达AGI的理想状态,即提出需求后机器人能够自动完成任务。虽然这是人们美好的愿景,但当前阶段还存在处理错误率高和计算成本高等问题,因此还不够成熟。
09
AI技术的自动化范式——HugggingGPT
那么,HuggingGPT是什么呢?从本质上讲,它是一个AI模型协作系统,与AutoGPT不同,它是一个可以调用不同模型的任务协作系统。
HuggingFace是一个平台,上面有各种各样的AI模型,涉及到算法、图片生成、自动化执行等各种领域。HuggingGPT就是一个协作系统,它可以调用HuggingFace中的模型库,将这些模型组合起来,然后自动化执行任务。
HuggingGPTGPT的任务分为四个部分:
任务规划:将任务规划成不同的步骤,这一步比较容易理解。
模型选择:在一个任务中,可能需要调用不同的模型来完成。例如,在写作任务中,首先写一句话,然后希望模型能够帮助补充文本,接着希望生成一个图片。这涉及到调用到不同的模型。
执行任务:根据任务的不同选择不同的模型进行执行。
响应汇总和反馈:将执行的结果反馈给用户。
HuggingGPT与AutoGPT的不同之处在于,它可以调用不同的模型来完成更复杂的任务,从而提高了每个任务的精确度和准确率。然而,总体成本并没有降低太多。
10
AI自动化的另一种范式:生成式智能体
在过去,与NPC对话的话术通常是基于固定的对话模式,需要录入大量的对话语料来支持。但是,现在有了大型语言模型后,出现了一种新的技术解决方案,使NPC具备自主决策能力。
在这个研究论文中,其技术方案使NPC能够自主决策,并根据自身与其他NPC和环境的互动来进行对话。
例如,如果一个NPC-A正在喝热咖啡,另一个NPC-B前来与他对话,他会根据自己的动作和环境做出相应的回应,而不是仅仅基于预定的对话模式。
当NPC-B连续好几次都看到NPC-A在喝热咖啡的时候,其记忆内核就会建立起:
“NCP-A喜欢喝热咖啡”“NPC-A喜欢喝热的咖啡”“NPC-A喜欢在早上喝咖啡”...
这种自主决策使NPC拥有了自主智能,它们可以根据自己的经验和日常生活中的观察来做出决策。这意味着它们可以自行生成新的对话和故事情节,而不是依赖于人为设计的对话模式。
这个概念非常重要,因为它代表了大型语言模型的潜力,使它们能够在原生环境中自主生长,生成新的故事和互动,而不仅仅是按照人为设计的模式执行任务。
尽管这需要高昂的计算成本,但它其实展示了大型语言模型的惊人潜力。
11
AI自由职业者平台
这些虚拟角色可以被称为智能体。接下来,我将介绍一个项目,它可能与大家的兴趣和需求更加相关。
这个项目被称为"NexusGPT",是由一名海外的独立开发者创建的,号称是世界上第一个AI自由职业者平台。
它整合了开源数据库中的各种AI原生数据内容,并拥有800多个具有特定技能的AI代理人。在这个平台上,你可以找到不同领域的专家,例如设计师、咨询顾问、销售代表等。
这些AI自由职业者是虚拟的角色,可以帮助人类完成各种任务。比如,在远程办公和外包平台上,雇主通常需要找到合适的人来完成任务。这个过程可能会涉及到繁琐的中介环节,但在未来,这个新的商业模式可能会更加成熟。
雇主可以随时在这个平台上选择一个AI自由职业者,因为AI的优势在于其稳定性。只要AI的风格符合你的需求,它就可以产生高质量的稳定输出。
这种自由职业者平台可能会对传统的自由职业者雇佣平台产生巨大的冲击,并改变未来雇佣自由职业者的商业模式,可能会按照token的消耗量来计费。
这将带来新的商业机会和挑战。
12
自动化品牌营销公司——AutoCorp
这是一家自动化的品牌营销公司。我们之前已经谈了很多关于自动化的内容。在这家公司,你几乎不需要任何人类的干预,这只是一个演示项目,它代表了未来的趋势。
然而,它面临两个挑战:计算能力和性能,以及人工智能的应用和功能。目前,第三方接口已经相对成熟,但这两个挑战仍然需要解决。
解决了这两个挑战后,自动化的营销公司将变得非常普遍。
想象一下,对于品牌公司来说,许多流程都可以被自动化执行。市场调研、问卷调查、品牌计划等等,都可以由AI来完成。
AI还能够根据反馈不断改进自己的表现,提供更好的服务。这将对人类的工作产生影响,特别是对自由职业者。因为AI可以全天候工作,只要提供足够强大的计算资源,它的效率将超越人类。
至于精确度问题,AI在不断学习和改进中,可能会逐渐达到人类水平。
这对一些职业可能带来挑战,特别是那些需要高度自动化的领域。
13
基于Agents的自动化团队——GPTeam
多代理体现了多智能体概念的应用探索。
在第二个案例中,Dev-GPT是由产品经理、开发人员和运维人员构成的自动化开发和运维团队。当你创建了一个自动化营销公司时,用户有新的需求或者需要服务时,你可以雇佣这样的团队来满足需求。
这些项目不仅仅是理论技术,它们已经落地成为了示范项目,离商业化还有一段距离,但这些示范项目的出现表明了其可行性。这需要我们提前做出判断。
从这些项目中,我认为人类可能会感到一定的威胁。
因为在研究这些项目的过程中,我开始思考,如果我可以实现最高效率而又无需人类的帮助,我是否真的需要人类存在。
相比于被抢走了工作,AI剥夺了人类的劳动尊严,才是一个更加值得关注的社会问题。
14
超级个体经如何经营一人公司
在之前的讨论中,我们提到了超级个体和人机协作模式,以及几种不同的自动化方式,如AutoGPT和自由职业者平台,还有自动化的公司。
这些讨论表明,传统的公司模式可能会逐渐减少,而人机交互和自动化的公司将成为未来的主流。在研究和理解一人公司时,需要考虑这些因素,否则可能会有一定的偏见。
举个例子,现在许多人使用AI工具来增强他们的个人劳动力或生产技能,甚至将个人生产流程自动化,一个人可以取代一家公司的工作。
但这种思维方式可能是狭隘的,因为未来的公司模式不会是我们传统方式所想象的。未来的公司可能更依赖超级个体、专业模型和AI团队的构建。
这些元素在一个流程中相互连接,超级个体将成为关键。
独家数据是一人公司的竞争壁垒独家数据指的是你个人在工作过程中积累的独特信息。这些数据在未来可能成为每个人的商业竞争优势。
为什么在目前的大模型投资和数据库领域有如此大的热潮呢?因为新的数据库被认为是未来的资本支点。人们也越来越关注如何更好地积累个人数据。这个趋势可能会催生新的商业生态系统。
对于个人而言,理解你的独家数据非常重要。因为在智能体和人的合作模式中,你提供目标、资源和监督结果。
目标可能是共享的,资源可能需要投入一些资金来争夺,但数据资源是每个人可以有所不同的地方。
在AI全权代理的路径中,我相信未来市场将对所有人公平开放。
你可能会找到差异化的方法,而唯一的差异化因素就在于你的独家数据。举个例子,如果你是一个设计师,你可能积累了自己的工作流程、设计风格等个人信息,通过专家模型和AI的合作,你可以将它们转化为实际产品。
在这个专家模型中,你需要调用不同的模型,不同的专家模型,才能完成更复杂的任务。
独家数据对于模型来说有多重要吗?你或许听说过某鸭相机,最近的有个争议是,它的算法似乎模仿了小红书上某位博主的照片风格,特别是那张向日葵风格的照片
这个算法就像是一个模板或者滤镜,让新生成的图片带有了独特的风格属性。这是因为某鸭相机使用了博主的独家数据,通过自己的图像模型生成了新的照片。
这就显示了拥有独家数据有多重要。
超级个体与一人公司运营模式在未来,你可以选择多样化的合作方式,你可以有个人助手,也可以有各种不同类型的代理人。
超级个体的未来就是,你可以管理一家公司,而且这公司的核心运营可以非常自动化。
比如,自动化的品牌营销和自动生成的内容。最近,随着AI图片生成技术的成熟,甚至有些小说的解读都可以由AI来完成。
任务可以被分解成模块化的流程,然后自动化执行。这就意味着一个人可以经营多家不同的公司,只需设置好业务系统。
这也是未来的一种可能性。
15
超级个体与智能体的竞争博弈关系
这其实可以归结为你在执行策略性工作流程时的设计和优化能力。
AI时代的职场竞争力:模型、策略与流程你的竞争力将取决于你对模型性能、选择适当模型和工具以及执行步骤的理解。
例如,我可能只需要三个步骤就能完成一个高效能的任务,而另一个人可能需要六个步骤才能实现高正面效果。这意味着我在算力资源上的成本比他低一倍。
因此,策略性的执行流程和视角的优化将成为每个超级个体的核心竞争力,这建立在对流程、模型功能和资源的理解之上。
另一方面,与智能体合作并找到最佳解决方案也非常重要。
在智能化团队中,可能会有一些具有创意的AI团队。当他们将技术与业务结合时,他们可能会提出比我更好的策略。
我可能只会想到制作一个海报来吸引用户,而他们可能会提出更高效的方法。智能体会持续寻找最佳解决方案,因为有多个智能体,它们拥有不同的技能和视角。
在这种多智能体的博弈中,它们将快速找到更好的解决方案,而人类的自我反思能力有限。
所以说第二个核心竞争力就是在我认为与智能体的博弈中找到最好的合作方式。
人类与智能体的博弈竞争关系在未来工作的可能危机应该是人类与多智能体的博弈。
为什么要与多智能体博弈呢?这与智能体的前沿研究有关,因为他们试图模拟人类的行为。
人类的行为有好有坏,涉及到各种博弈,如囚徒困境、公地悲剧等等。不同的博弈关系是由人们的动机和目标不同而导致的。
但我们没有另一个平行世界来进行实验,以确定哪种社会合作方式最佳,哪种社会制度最优,是社会主义还是资本主义更好,我们无法得知。所以我们生活在一个现实社会中。
在这混乱的多制度博弈中,多智能体领域提出了一个想法:通过沙盒实验打造一个虚拟社会环境,让智能体模拟人类的行为,测试不同博弈关系的各种场景,找到最佳解决方案。
你会发现人类社会正常运行,而在另一个虚拟世界中,每天都在探索最佳合作模式。他们可能会尝试成千上万种博弈关系,找到更好的解决方案。
当他们找到最佳解决方案时,会应用到实际生产环境中,甚至进入整个互联网,而人类没有进行这么多尝试,所以当他们发现最佳解决方案时,人类也会选择这个最佳解决方案,这种情况可能发生(我认为是必然发生)。
技术特权阶级即将出现掌握技术特权的人有可能会使那些没有掌握技术特权的人变成低端劳动力。因为技术特权阶级的贡献对整个社会来说是最优解,但普通劳动者阶级并不是。
这时候我们该怎么办呢?我认为社会的生产效率是一个关键问题。举个例子,有一个政策叫做以工代赈,它的目的是通过大量建设基础设施,让更多人有机会劳动。
对于那些可以由机器完成的任务,我们尽量避免使用人力,以便给人们提供工作机会。在这个过程中,你会发现高度复杂的工作被交给了机器,而低端、重复性的工作则由人类完成。
这就导致了人类群体和智能体之间形成了一种竞争关系,有可能很大一部分人会被排除在外。
这是一个未来的学术研究方向,而且正在逐渐落实。
我认为在未来的十年里,我们将不断面对这种竞争。尽管现在技术还不够成熟,但它正在不可逆转地发展。
考虑到我们的职业生涯很长,可能有二三十年甚至更多,但在未来几年里智能体将高度成熟,我们必须提前思考这些问题。
16
AI竞争下的职业危机思考
问题一:AI时代会出现共产主义吗?
问题二:数据被大公司垄断该怎么办?
我先简单回答了这两个问题,如果有空的话,我可以分享一些资料到群里,大家可以深入研究了解,因为这个领域还比较新,许多AI开发者自己也还没有完全理解它,所以我们需要共同学习和探讨。
今天我分享了很多信息,可能有些内容比较密集。接下来,我计划推出一个系列课程,继续探讨人工智能领域的研究和商业应用。
大家可以继续关注我的课程,后续还会分享一些实际操作方面的内容。期待与各位继续交流,感谢大家今天的参与。
本次公开课录制视频链接
end