查看原文
其他

对话OpenAI 董事主席Bret Taylor:AI带来的新商业模式,预测科技将影响我们的工作和社交方式

AI工作坊 AI深度研究员
2024-11-10

(关注公众号并设为🌟标,获取最新人工智能资讯和产品)

全文约14,000 字,阅读约需31分钟

金句摘录

——AI市场的未来将类似于云计算市场的发展,最终由少数几家基础设施提供商主导,软件服务公司向它们支付租金。

——客户服务成本通过AI技术,可从每通电话约13美元大幅降低至不到1美元,实现成本降低一个数量级。

——如果你看看一家大公司,有多少人的工作是处理数据、制作演示文稿、进行数据转换等,AI正使其更加高效、更加实时化,我觉得这是非常令人兴奋的。

Sierra联合创始人、OpenAI董事会主席Bret Taylor近期接受了No Priors节目的采访,分享了他对AI代理、企业AI应用以及未来商业模式的独特见解。作为曾在Google、Facebook和Salesforce等科技巨头担任要职的资深业界领袖,Taylor的观点为我们揭示了AI技术在企业环境中的应用前景和潜在影响。 

Taylor重点讨论了三类AI代理系统的发展:个人代理、角色代理和公司代理。个人代理旨在协助日常任务管理;角色代理专注于特定领域如法律或编程;而公司代理则代表企业在数字世界中与客户互动。他认为,公司代理有潜力彻底改变客户参与模式,同时显著降低运营成本。 

在探讨AI代理的创造力和自主权时,Taylor强调了在赋予AI一定自由的同时,设置适当边界的重要性。这不仅是技术挑战,更是一个涉及设计和哲学的新课题。关于企业AI应用的未来方向,除了目前热门的编码、客户服务和销售生产力领域,Taylor特别看好分析师角色的AI增强。

他认为,AI可以极大地提升数据分析和洞察生成的效率,尽管在处理特定领域的复杂数据时可能需要进一步的微调和专业化。


专访要点:

  •  关于代理技术的定义与发展:Bret Taylor 解释了学术界和工业界对“代理”的定义差异,并提到目前有三类代理正在被开发:个人代理、角色代理和公司代理。个人代理可以处理电子邮件、安排会议等任务,但由于人机交互的复杂性,仍需更先进的技术支持。


  • 角色代理的应用:Bret 提到现有的一些成功代理系统,特别是在法律和编程领域,像 Harvey 的法律代理和编程代理都有实际应用。这类“狭窄但深入”的代理可以在特定领域执行任务。


  •  公司代理的前景:公司代理的主要目的是帮助公司通过对话AI与客户互动。Bret 以Sonos和Sirius XM为例,展示了这些代理如何处理技术支持、服务升级等任务。


  • 从研究到现实的差距:开发公司代理的关键挑战在于将AI技术应用到现有的客户服务流程中,并确保这些代理能够处理复杂的任务,如订购、取消或处理投诉。


  • 代理与业务流程的整合:Bret 强调公司代理的设计不仅需要AI的自动化功能,还需要“目标和护栏”的设置,以确保代理能够实现业务目标,同时避免出错或偏离品牌形象。


对话整理

主持人: 嗨,各位听众,欢迎回到“No Priors”节目。今天我们邀请到了Bret Taylor。欢迎你,Bret。

嘉宾Bret Taylor: 非常感谢邀请我参加节目。

1、AI代理定义

主持人: 非常高兴你能加入我们。我们直接进入正题吧。现在的代理(agents)真的有效吗?如何定义代理系统和不同类型的代理呢?

Bret Taylor: 你想让我定义代理吗?还是你来定义?你是专家。

主持人: 你来定义吧。

Bret Taylor:  代理在学术界和现在产业界的意义有所不同。我认为这两种定义都很重要。先从我认为的经典学术定义开始,代理系统是指软件能够自主推理并采取行动,它源自“agency”这个词。由于这一广泛的学术定义,我认为在产业界中,代理一词被人们用得像是一种墨水测试,大家有不同的解读。

目前,我认为有三类代理正在逐渐走向成熟。第一类是个人代理,网上很多人都在讨论,我认为这是最早能实现的类别之一,也许是最令人兴奋的。这个代理可以帮你处理邮箱、安排假期、准备会议、管理日历等等。我认为这是最早的代理类别,因为有一些有趣的演示存在,但人机交互以及代理与我们依赖的各种系统之间的互动是非常复杂的。你可以想象,推理和系统集成的范围几乎是无限的。因此,要实现一个优秀的个人代理,可能需要比目前可用的技术更强大,尽管这个领域已经有很多有趣的初创公司,你可以想象一些公司会在技术进步的同时逐步扩展有意义的细分市场。

第二类代理,我认为已经在某些领域存在,我称之为“角色代理”。这些代理负责完成特定工作。比如,像Harvey这样的公司可以提供法律功能,还有一些编程代理。我认为现在已经有一些相当有效的代理可以胜任计算机编程的工作。我觉得这非常令人兴奋,因为当你缩小任务范围并专注于具体领域时,比如法律或软件工程,代理的效果会非常好。

第三类代理是我的公司Sierra所在的领域,我称之为“公司代理”,主要面向客户的公司代理。它们不仅仅是自动化或自主化,而是在这个对话式AI的世界中,你的公司如何以数字形式存在。我常用的比喻是,如果现在是1995年,公司的数字化意味着拥有一个网站并列入雅虎目录中;而到2025年,公司的数字化可能意味着拥有一个客户可以与之互动的品牌AI代理,提供一切他们能在你的网站上完成的操作。

这种类型的代理,我认为以目前的技术是可以实现的,因为像角色代理一样,它们不是在“煮沸整片海洋”,技术上有明确的客户体验流程和系统记录,关键是如何将网站和应用的体验转变为对话式体验。这并不意味着它是完美或简单的,否则我们也不会创办一家专门从事这个领域的公司。但至少它的框架是明确的。总的来说,如果你正在研究人工通用智能,代理的定义可能完全不同,这没有问题,因为这是一个不同的课题。然而,在Sierra工作和你们投资的很多公司中,我们都在探讨现有技术下的实际机会。

主持人: 我完全同意。你能描述一下构建公司代理的过程吗?比如从研究到现实之间的差距是什么?作为一个工程团队,你们会投资什么?你们是如何理解不同客户环境的范围的?可以简单介绍一下这些投资方向吗?也许以Sierra为起点,值得定义一下你们目前为客户提供的产品是什么,以及你们希望它将来发展成什么样子?然后我们再探讨这些组件,因为显然大家都认为你们是这个垂直领域的领军者,但我觉得让更广泛的观众了解你们的重点会很有帮助。

Bret Taylor:  好的,我举几个具体的例子来说明。如果你买了一台新的Sonos音箱,或者遇到了技术问题,比如那个令人讨厌的橙色闪烁灯,现在你可以通过Sonos的AI代理进行聊天,这个代理是由Sierra提供支持的,它可以帮助你设置设备、排除硬件问题或Wi-Fi问题等。如果你是Sirius XM的订阅用户,他们的AI代理叫Harmony,我觉得这个名字非常讨喜。它可以帮助你完成从升级、降级订阅套餐到你购买新车时的试用咨询等各种事情。总体来说,我们帮助公司构建面向客户的品牌代理,而“品牌化”是其中的一个重要部分。这是你品牌的一部分,也是你品牌体验的一部分。就像回到1995年,你的网站出现在你的名片上,那是你第一次拥有这种数字化存在。我认为,未来我们回看今天的代理系统时,也会觉得它们很稚嫩。就像你在“互联网时光机”上回看早期的网站时,那些要么只有电话号码的简陋网页,要么看起来像DVD的引导界面,充满了各种图像。很多客户开始使用的代理往往集中在客户服务领域,这是一个很好的使用场景,但我相信,如果我们快进到三四年后,你的代理将涵盖公司所有的业务。

我之前用过这个例子,我很喜欢。你可以想象一家保险公司,当你与他们互动时,无论是提交理赔、比较保险计划,还是我们刚才提到的孩子问题,比如当你的孩子年纪大到可以获得驾照时,你要为他们增加保险,这些事情将全部由代理完成。这就是我们在帮助公司构建的系统,而Sierra最初专注于面向消费者的公司。从技术角度来说,B2B公司和消费类公司之间并没有太大的区别,除了客户数量上的差异。我总是从基本原理出发,思考这项技术能实现什么以前不可能实现的事情。如果你考虑典型对话的成本,比如你今天打电话给一个呼叫中心,大多数服务团队的一个关键指标是每次联系的成本,也就是完成这通电话所需的全部人工和技术费用。一般来说,每通电话的服务成本大约是13美元,而现在通过AI,你可以将这个成本降低到远远低于1美元。所以,突然之间,你将对话成本降低了一个数量级。

如果你从数学的角度来看,哪些公司能从这种成本降低中受益最多?取决于你如何计算,不管是分子还是分母,如果你面向的是数百万消费者,显然对于消费类公司来说,这种价值是不同的。因为与客户对话本身是一件非常昂贵的事情,以前公司可能并不愿意让它变得容易。现在有很多网站专门帮助人们找到公司的电话号码,因为许多消费类公司都将客户引导至数字化的自助服务体验中。我现在非常兴奋的是,既然与客户对话的成本降低了一个数量级,也许你可以让这种对话多出一个数量级。你知道这实际上意味着什么吗?随着这些技术趋势的发展,最初你可能只是将现有的工作进行数字化,但我认为更深层次的影响是,现在对话不再是一个巨大的成本中心时,如何将对话融入到客户体验的核心部分。因此,回到你的问题,我认为与一家大型消费公司进行的对话,与一家拥有100个客户的B2B公司相比,意义上有着很大的不同。这并不意味着它不重要,我只是想说影响的程度和你做出的决策是非常不同的。

2、AI代理实现困难

主持人: 你能描述一下将基础模型的能力应用到公司代理中的一些关键挑战吗?

Bret Taylor: 当然。我想你们可能已经在节目中讨论过一种非常常见的技术,叫做“检索增强生成”(Retrieval Augmented Generation)。基本上,它的意思是,你使用一个大型语言模型,但并不是依赖模型在预训练过程中获得的内在知识来生成答案,而是将模型与内容数据库结合,并要求模型从该数据库中选择内容并进行总结。这实际上是说,你可以将代理建立在你提供的知识上,同时也可以将现成的模型与专有的业务数据集成。这是目前非常流行的技术,我认为它是一个令人兴奋的领域。

然而,实际应用中我们发现,这种技术对于几乎所有有意义的客户体验来说,效率非常低下。想想你与那些你关心的品牌的所有互动,其中有多少是问问题的?可能几乎没有。大多数情况是采取行动,比如升级或降级订阅、退货、保修换货、向保险公司提交索赔等等。这些不仅仅是回答问题,而是需要对多个系统的记录采取行动。这些过程通常非常复杂,不仅有业务目标(比如如何防止你取消服务或说服你不取消),还可能涉及合规要求。如果你是与医疗相关的公司,还要遵守像HIPAA这样的合规规定,有很多限制。这意味着,构建能够基于内容的代理是一个很好的演示,但并不一定是一个有影响力的产品。这正是我们试图解决的技术领域。我们致力于创建一个平台,不仅仅是让AI拥有自主权,还能处理任意复杂度的流程,同时设置好边界。过去二十年的大多数软件系统都是规则引擎,它们执行得非常快,无论这些规则是用源代码实现的还是通过低代码平台实现的。而现在,我们正在进入一个以目标和边界为核心的世界。

企业现在有机会不再仅仅通过一套规则和决策树来表达业务流程,而是可以定义他们想要实现什么目标,在哪些地方希望AI拥有自主权(即创造力),以及在哪些地方不希望AI有创造力。这是一个非常有趣的技术问题,也是一个非常有趣的社会和商业问题。许多公司一开始会说,“我想精确控制AI的行为”,这当然是一个可以理解的目标,而且我们的平台也支持这一点。但如果你这样做,AI可能会显得相当机械化,而你实际上剥夺了人们在使用ChatGPT等系统时感受到的“魔力”,这种魔力本质上就是创造力和自主权。

另一方面,如果你把自主权调到最高,就像“Spinal Tap”电影中的音量调到11那样。你知道,这种情况可能会导致幻觉,可能违反你的政策,或者更微妙的是,它可能不会成为一个优秀的品牌代言人,无法真正代表你的品牌。因此,我认为我们正在尝试解决一个更深层次的问题,那就是,如何针对非确定性和创造性的软件进行编程?我们需要构建哪些抽象层,才能在不剥夺创造力和自主权的情况下设定目标和边界?正是这种创造力和自主权让这些体验变得如此令人愉悦,也是为什么ChatGPT能以史上最快的速度突破一亿用户大关。但是,同时你也必须向董事会、CEO和客户展示,确保你设置了正确的边界,并明确你在哪里可以接受AI拥有自主权。我认为这不仅是一个有趣的技术问题,也是一种全新的设计问题,几乎可以说是一个哲学问题,即你希望在哪些方面为软件赋予一定的创造力。几年前,这是一个根本不会被讨论的问题。

主持人: 你提到的这些不同方面,比如边界,或者我看到有些人在构建代理时为其开发了自己的推理引擎等模块,这些是附加在基础模型或大型语言模型之上的。你觉得这些功能公司需要自己开发多少?还是说最终这些功能会集成到像OpenAI或Anthropic这样的基础模型公司中?

Bret Taylor:  如果你不介意,我先拉远一点,给你我的市场看法,然后再回答这个问题。马克·吐温有句名言:“历史不会重复,但会押韵。”我认为AI市场的未来会与过去15年云计算市场的演变相似。如果你看看云计算市场的演变,大体上最后只剩下了少数几家基础设施即服务(IaaS)提供商,它们占据了大多数的资本支出。也就是说,大多数软件服务公司都向这些基础设施提供商(比如亚马逊云服务、微软Azure或谷歌云)支付租金。

由于数据中心开发的规模经济效应,初创公司很少会自己建立数据中心,也很难去建立基础设施即服务业务,因为所需的资本支出过于巨大。正反馈循环使得资本支出的回报无法形成可持续的商业模式。我认为,前沿模型市场也会出现类似的情况,最终会有少数几家公司负责预训练,这一部分是模型构建中最资本密集的部分。并不是因为只有这些公司有优秀的研究人员,而是因为资本支出的要求决定了你需要向大量公司出租这些模型,才能获得回报。很多初创公司做了预训练,却发现要从中获利在数学上是很有疑问的。

3、未来AI提供商

主持人: 主要的云计算提供商或者云计算提供商加上少数其他公司将主导市场,因为从资本和负担能力的角度来说,只有他们能做到。你认为最终这些AI服务会集中到云计算提供商身上吗?

Bret Taylor:  是的,我认为它最终会集中在云计算提供商和大型研究实验室之间的合作中,这大致就是目前的格局。不过,我不完全同意你关于安全性和延迟的观点。现在大多数大型企业使用多个云计算提供商,它们也使用软件即服务(SaaS),并不太在意这些服务是托管在哪里的,只要满足安全性和可靠性的要求。当然有一些例外,但经过20年的软件即服务发展,人们已经演变出一种不再过问你从哪里获得电力的习惯,而是只关心服务水平协议(SLA)。我认为这是一个积极的趋势。我确实认为在延迟和安全性方面还有一些挑战需要克服,但我不确定所有内容都要运行在同一个底层平台上。我可能是错的,但从软件即服务的演变来看,我不太认为会出现这种情况。不过,回到我关于历史押韵的观点,我认为最终将会有少数几家基础模型构建者负责预训练,工具型公司的市场也会出现。

在AI领域的一个很好的例子可能是Scale AI,而在云计算中,Snowflake是一个很好的例子,这可能也适用于AI领域。所有这些工具型公司,就像“淘金热中的镐头和铲子”。如果你打算转型到云计算,你需要什么样的软件?如果你想在业务中应用AI,你又需要什么工具和软件?最后一个类别是解决方案。就像云计算时代一样,你可以利用亚马逊云服务、Azure或GCP的服务,构建几乎任何东西,但大多数公司不愿意这样做。大多数公司想要解决一个具体问题,而自己构建CRM或ERP系统的总拥有成本是不可行的。我认为这花了公司很长时间才意识到,但现在显然他们已经接受了这一点。同样的道理也适用于AI。如果你想自动化客户服务,使用外部解决方案比自己构建要容易得多,成本也更低。如果你想自动化法律流程的某些部分,与Harvey这样的公司合作可能比自己开发解决方案更加合理。正如软件即服务的兴起一样,AI领域也会出现类似的趋势。

回到你的问题,如何构建技术,以及基础模型提供商将扮演什么角色?我认为最重要的一点是,你提供的价值是什么?你能否在模型的基础上增加足够的附加值,成为一家真正的公司?如果每次AI模型有新版本发布时,都会减少你的价值,那可能表明你实际上并不是在提供真正的解决方案,你可能只是在模型上做了一些小的增值服务。不幸的是,我认为有一些初创公司看起来正是这种情况,价值并不大。对于Sierra来说,当模型改进时,如果我们做得对,我们的平台也会变得更好。我们的客户在我们的平台上定义了他们客户体验的目标和边界。每当有新技术可用,我们就会将其集成,使问题解决效率更高,客户满意度更高,负面体验更少。这与软件即服务类似,当技术进步时,提供的网络服务也会变得更好。

但我们的客户雇佣我们,不是因为模型,而是因为他们的客户体验。所以从根本上来说,这是我们对问题的思考方式。作为一名企业家,我认为,如果你不符合这些类别中的一个,就会存在风险。这是我的看法,因为每当模型有改进时,如果其中50%的价值来自模型,那么你就处于价值的“恐怖谷”中。但我认为,所有的应用场景都来自基础模型的观点可能是错误的。

现在很难预测未来,但这就像15年前有人说“未来不会有单一的软件即服务公司,每个人都会从现有的工具中自己构建”。的确,有些企业曾这样认为,但最终的结果可能恰恰相反。大多数企业都会问:“我们在哪里想要创新?” 如果你是一个大型零售商,你没有足够的工程师资源来实现所有功能。你想在哪些方面脱颖而出?对于大多数公司来说,投资于一个软件即服务平台,享受“水涨船高”的效应是更明智的选择。我认为AI领域也会发生类似的情况。我非常看好我们之前定义的角色代理。虽然这些公司会相互竞争,但我认为这个领域有很多有意义的公司存在。与其依赖基础模型提供商,我更愿意与这些解决具体问题的公司合作。比如编程代理,它们要解决的是开发者工作流程、安全性、不同编程语言等问题。我认为这其中有很多价值。同时,依赖编程代理可能还会带来一些次生效应,比如它们如何融入团队治理、代码审查等方面。

虽然我现在可能还不能列举出所有问题,但正是因为这些问题的存在,才有公司进入这个领域。我对这些公司的长期存在非常有信心,甚至不用完全了解所有细节。

主持人: 我觉得你提到的关于SaaS的类比非常有意思。人们总是说基础模型上的“包装器”公司会消失,但你可以说很多SaaS公司本质上也是SQL数据库上的“包装器”。

Bret Taylor:  这与Shopify、Salesforce、ServiceNow等公司的情况很相似,而这些公司都非常成功。因此,虽然数据库供应商对Salesforce来说曾是一个长期重要的合作伙伴,但最终也被取代了。云计算市场确实非常有趣,我打个比方,尽管类比有时可能会有风险,尤其是例外情况有时比较隐蔽。不过,基础模型提供商确实能从这种投资中获益。我认为这些基础模型本身具有巨大的内在价值,因此任何基于它们构建的解决方案,基础模型提供商都会从中获得“税收”。这对所有相关方来说都是好事。正如你提到的,不同的应用公司可以选择在不同时间使用不同的模型,这也会带来很多健康的竞争。对Sierra的客户来说,最重要的是我们为他们提供了“面向未来”的解决方案。这样,当有新技术出现时,不会导致系统崩溃,而且当有新的优秀技术出现时,他们也能立即利用起来。我认为,对许多解决方案和应用公司而言,这将成为它们的核心价值之一。

对于那些做过提示工程或工具使用实验的人来说,他们会发现,提示并不能总是与未来的模型匹配。虽然模型可能会变得更好,但并不是绝对的,因为提示与模型之间的匹配非常紧密。大多数公司并不想处理这些低层次的问题,就像他们不想处理数据库迁移一样,虽然重要但无趣。而软件即服务(SaaS)提供的就是无需担心这些问题,并且无停机时间。在Sierra,我们专注于“基于结果的定价模式”,即按实际完成的工作收费。我看到很多初创公司也在这样做。在AI时代,SaaS的另一个强大优势是,你可以让自己的商业模式与客户的商业模式紧密结合,按结果收费。这是一种非常有力的新商业模式,可能与订阅制软件一样强大。提供开箱即用的解决方案,并将公司实际的商业模式与结果对齐,这与按使用量收费有很大区别。

4、两种AI类型公司

主持人: 最令人兴奋的是,解决方案型公司和应用型公司确实带来了相对于现有解决方案的巨大价值提升。

Bret Taylor:  经济学家通常把软件视为生产力的驱动因素,有时以非常抽象的方式表达这一点。但在AI时代,由于这些系统能够自主采取行动,并且有合适的边界,我们越来越接近能够精确衡量软件是否完成了任务。这有点像从展示广告转向按点击付费广告一样,虽然还没有完全转向交易,但你离直接归因又近了一步。在这个过程中,客户愿意为点击支付更多,因为它更接近实际的价值。公司现在应该对软件供应商提出更高的要求,并更接近实际的价值。我认为这是一个非常积极的趋势。

回到我们之前讨论的法律、编程和服务领域,AI代理能够真正执行任务,比如分析合同或完成某项操作,这使得它的价值变得非常清晰和可衡量。你知道你为员工支付了多少薪水才能完成这些任务,或者在呼叫中心,每次联系的成本是多少。我认为这将真正改变软件供应商与公司之间的关系,使供应商成为公司真正的合作伙伴,因为你实际上提供了可衡量的、有价值的服务。如果你问任何一位CIO,他们是否从购买的软件中获得了预期的价值,你可能会看到他们脸色大变,他们有很多“悲惨的故事”可以讲。

主持人: 但我认为这是一种非常积极的趋势,比如Clara,他们公开谈到如何有效实施客户支持工作流程,帮助他们的业务取得了显著的成效。我记得Clara的例子,他们最终大幅提高了净推荐值(Net Promoter Scores),提升了客户满意度,并且每位客户的服务时间减少了许多。他们基本上自动化了大量的工作流程,同时也减少了团队规模,大概裁减了700名代表或员工。这对他们的业务运作、与客户的互动以及支持多种语言等方面产生了巨大的影响。所以现在有一些非常突出的例子正在出现,正如你所说的这些大规模的影响。

Bret Taylor:  我认为这种影响已经显现出来了,这也是我对许多应用型公司的未来感到兴奋的原因,因为我认为它们现在更接近于实现真正的价值,而不仅仅是宏观层面的探讨。

主持人:  你提到目前企业采用的三大热门领域是编码、客户成功和销售生产力或销售和市场生产力。除此之外,你认为还有哪些关键的应用领域?你提到过法律,还有其他你认为在短期内非常有前景、即将带来显著影响的领域吗?

Bret Taylor:  我不确定这算不算一个特定的工作领域,但我对分析师角色的自动化感到非常兴奋,尤其是后端的分析工作。并不是要完全取代分析师,而是像给他们穿上“钢铁侠战甲”一样增强他们的能力。分析师的高层次职责是综合复杂的数据,为利益相关者提供见解。如果你从基本原理出发考虑大型语言模型的优势,比如总结、综合和推理能力,我认为这里有一些非常有趣的应用场景。虽然语言模型在处理数值或表格数据时并不擅长,除非经过大量调整,领域特定的数据可能具有一些复杂性或特殊含义,这些基础模型本身并不能轻易处理。但这让我想到了像编码和法律领域一样,进行微调和领域特定的专长是有益的。我不确定“分析师”是否算作一个单一的角色,不同部门的分析师职责各不相同。但如果你看看一家大公司,有多少人的工作是处理数据、制作演示文稿、进行数据转换等,无论是替代这些工作,还是增强这些工作,使其更加高效、更加实时化,我觉得这是非常令人兴奋的。

5、AI代理的体验

主持人: 我们能回到你之前提到的目标和边界问题吗?你提到我们正在远离复杂的规则引擎,这对客户来说是一个很大的思维转变。你是如何帮助他们评估Sierra代理的效果,并让他们对这种新方式感到放心的呢?

Bret Taylor: 有几个方面,我先从技术角度谈,然后再讲一些操作层面的内容。技术上,我们与客户密切合作,帮助他们实际定义和形式化他们的流程。有些客户进来时有非常明确的流程,有些则没有。我们常说,代理不仅仅需要掌握事实知识,还需要掌握程序性知识,也就是一个流程该如何运行,以及与系统的集成。我们花了大量时间讨论哪里需要设置边界,哪里需要创造力和自主权。然后,我们会进行大量的实验,首先是概念验证,然后在实际应用中看看这些技术是否符合客户的预期。在此过程中,我们为客户体验团队开发了许多工具。我们认为AI不应该只属于技术团队的领域。负责客户体验的团队,比如数字官办公室或专门的客户体验团队,应该是这些体验的掌控者。因此,我们构建了许多工具和平台,使这些团队能够审计和改进代理,并在整个过程中掌控他们的代理行为。

这些系统是非常有机的,如果你想象一下自己是一家零售商,你进入一个零售网站,可能会在某个地方看到一个菜单,列出所有的商品分类,比如男士、女士、鞋子、裤子等,你点击这些选项,它会过滤商品列表。现在这几乎已经成了标准的零售模板,但我不确定它是否是最优的解决方案。这就是我们所处的世界。如果你想象有一个对话式AI代理,它是一个自由输入的文本框,完全自由化。用我糟糕的类比来说,这有点像从雅虎目录过渡到谷歌搜索——你从一个有分类结构的目录变成一个自由文本框,用户可以输入他们想要的任何内容。因此,它的适用范围往往比人们最初设想的要广泛得多。我认为这导致了一种长尾的客户体验,不仅我们没有为代理设计这些场景,连我们的客户也没有预料到。

主持人: 我们曾讨论过一个关于退货欺诈的疯狂案例,没人知道发生了什么。

Bret Taylor:  是的,确实如此。这几乎就是客户的声音,以最直接的方式表达出来。所以我认为这是一个非常令人兴奋的动态。有一本书叫《长尾理论》,我对它的印象很深,或许是Eric Schmidt为它写了序(如果我没记错的话)。我认为,正如互联网从目录向搜索的过渡,网页数量大幅增加,你不仅看到大型热门网站,还会发现博客等长尾内容,这真的是互联网的一个非常显著的特性。我觉得我们在客户体验方面也正在向这个方向发展。以前你可能会为客户精心策划一些屏幕界面,而如果你进入一个AI代理的世界,它可能只会告诉你“对不起,我不能帮你”。但更有可能的情况是,你会发现客户想和你谈论的各种需求和问题,然后你需要思考如何满足这些需求。所以这是客户洞察和新型客户体验开发的有趣结合,体验会更加有机。

主持人:  这种体验会随着学习不断适应吗?

Bret Taylor:  是的,非常适应性强,它是一个全天候的系统。这不仅仅是运行A/B测试,它的控制程度要少一些,更像是一个系统或有机体,随着时间不断调整。因此,我们的平台很大一部分是如何赋能客户体验团队来管理这种动态。

主持人:  所以你们正在应对的是客户行为的变化,而不是模型行为的变化,对吗?

Bret Taylor:  没错。今天有什么新的外部事件、争议,或者是热门产品发生了变化?不仅仅是从中获取洞察,更重要的是如何不断演化这个代理系统,以确保它既保留了客户体验团队的自主权,也能够适应AI的自然、有机的行为变化。

主持人:  如果我们往前看六个月或十二个月,今天我们有了文本框,那么语音模式即将到来,视频化身也已经存在了。未来我们应该期待Sierra的代理化身变得更具人性化、更接近你这样的形象吗?“真实性”在其中有多重要?

Bret Taylor:   这确实很重要,而且很有趣的是,去看看那些已经上线的Sierra代理,它们各自的个性都非常不同。我认为代理应该是品牌的代言人。大型语言模型的一个显著特点是能够感知和反馈对话者的情绪,因为通过“指令微调”,这些大模型被赋予了对话能力,它们会自然地反映出用户的情绪和语气。当然,你也可以进行控制和调整。如果你的品牌想要一种不拘一格的风格,那就可以做到;如果你想要更庄重的风格,比如奢侈品品牌,也可以实现。

主持人: 你们是通过提示进行这种调整,还是通过训练后进行呢?你们是如何将这种风格融入到代理的?

Bret Taylor: 我们结合了所有方法。某些语气和品牌风格可以通过提示调整,具体取决于模型的能力;而某些更敏感的品牌需求,比如不能让AI代理提供医疗或财务建议,这些需要更严格的控制。我们做了很多所谓的“监督模型”,也就是说有模型在监督其他模型。我们办公室的笑话是,AI的每个问题的解决方案就是更多的AI。这确实很令人兴奋,也是我们平台有趣的地方。我们有许多工具来解决这些有意义的问题。

我总是想到Apple的品牌体验。如果你去他们在库比蒂诺的总部或走进一家Apple商店,或者拆开他们的产品包装,你会感受到一种统一的氛围。你会看到“加州设计”,并意识到这就是一个典型的Apple体验。我认为,你应该将你的AI代理视为品牌体验的一部分。AI代理可以拥有个性,并且根据不同的人进行个性化调整,这真的很不一样。就像15年前的“黑色星期五”,大家收到的促销邮件都是一样的,而现在大多数人的邮件都是个性化的。我们已经逐步走向了更个性化的体验。那么代理会一开始只有一种个性,几年后再根据对话者的个性或人口特征进行调整吗?答案是,我们不会规定客户一定要这么做,但这种可能性本身就非常酷。我觉得这真的很棒。

提到语言,能够反映对话者的语言是一件非常具有同理心的事情,而不是仅仅依赖那些你为呼叫中心配备的员工。这让一些原本因成本过高而无法实现的事情变得可行了,这确实非常具有同理心。而且你提到了个性化,像聊天、语音、视频,视频化身将会非常令人震撼。和品牌进行视频对话,就像Facetime一样,真的是个非常酷的概念。

你提到Clara的例子时说得很对,我们不能低估这对消费者的巨大影响。消费者不满意的首要原因就是等待时间太长。特别是在客户服务的背景下,很多时候,客户遇到的问题是需要立即解决的,不管另一端的员工多么有效率,你都不会马上得到解决。AI的机会就在这里,这也是为什么客户满意度和净推荐值(NPS)能够大幅提升的原因。这并不是对之前员工能力的批评,因为他们本质上受制于系统——你在队列中排第十,你还在等待中。当你终于接通时,你的情绪已经受到了影响,虽然另一端的员工可能会尽力扭转局面,但这其实是一个规模错配的问题。而AI提供的机会是即时解决问题,我认为这是非常了不起的。我总是提醒我们的客户,不要想得太复杂,实时的满足感是这些系统的主要价值之一,其他都是锦上添花。

主持人: 就像你说的,AI代理可以同时支持多种语言,而对于人类来说,要掌握30种语言是不可能的。这对排队等待时间、客户体验影响巨大。

Bret Taylor:  还有方言、行话、俚语等细微差异,也不可能期待一个人能掌握10种语言并熟悉所有这些术语。而且还有一些更微妙的事情,比如当公司推出一款新产品时,想要重新培训5000名呼叫中心员工需要很长时间,而通过AI,这只需要按下一个按钮就能完成。确实如此,这种技术带来的次生效应是非常有趣的,对每个消费者都极其有利。

6、技术发展趋势

主持人:  你从产业的角度有非常独特的视角。你曾是Facebook的首席技术官,Salesforce的首席运营官,现在是OpenAI的董事会成员,同时领导着Sierra。我们之前谈到了语言应用和视频化身等趋势,你对AI之外的其他技术趋势或模式有什么期待吗?你觉得未来还有哪些值得关注的重大趋势?

Bret Taylor:  我最感兴趣的趋势之一是我们将如何与计算机和软件进行交互。在过去的15年中,智能手机几乎吞并了所有的邻近技术。我不知道能否测量出人类和计算机的交互中,有多少是通过智能手机上的触摸屏完成的,可能是90%甚至99%。虽然键盘和鼠标依然存在,但它们主要用于专业任务,而不是日常互动。随着对话式界面变得更加有效,我认为我们已经越过了这个转折点,特别是在GPT-4的推动下。你现在可以与软件对话,它就能起作用。就像多点触控技术使人们放弃了黑莓手机一样,多模态的语音和聊天技术的出现,也许意味着我们将看到消费者设备的显著变化。我很好奇,未来的主流计算设备形式会是什么样子。

主持人:  你有对这种形式的假设吗?

Bret Taylor:  由于智能手机的持久性,我猜想如果要选择,我认为智能手机将继续保持主导地位。不过结合像AirPods和CarPlay这样的设备,你会通过不同的模态与它进行互动,但口袋里的超级计算机——也就是智能手机——可能不会消失。我不是说我希望它消失,只是想说,有多少消费设备公司试图在智能手机之外开发一些完美契合的设备。我觉得智能手表可能算是一个成功的例子,但它的市场规模仍远不及智能手机。我觉得这是一个非常有趣的现象。我也在想,当时大家都在厨房柜台上放了一个Alexa,那个时间点大概是十年前吧?

主持人: 是的,大概是2015、2016年。

Bret Taylor:  这些设备会重新流行起来吗?会不会突然之间它们又成为有效的计算设备?它们会让智能耳机再次流行起来吗?还有另一个我非常感兴趣的问题,我不确定自己是乐观还是悲观的,就是我们会不会减少盯着屏幕的时间?显然,对话式AI能够通过语言和语音与我们交互,而我们也能够通过语言和语音与计算机互动。这从理论上讲意味着你不再需要一直把屏幕放在面前。那么,这是否意味着技术会更多地退居幕后?还是说它只会增加我们现有的负担?我希望产品设计师能够利用这一点,减少我们盯着屏幕的时间,比如那种不断吸引我们回到设备上的推送通知。AI代理能否帮助我们整理这些信息,避免我们做出本能的反应拿起手机?也许这有点天真,但我对这种新的计算交互方式充满希望。现在我们有了这些新的与计算机互动的方式,而不再局限于单一设备和单一屏幕,即使技术上还是通过设备来实现的,我对这一点感到很兴奋。我确实认为我们已经达到了某种体验的局部极大值,尽管这种体验还没有直接连接到大脑中。

人脑接口会是个有趣的领域,我对此非常期待。你提到的例子让我想起了App Store刚出现时的那些应用程序,比如手电筒应用,都是对硬件功能的字面解读。后来出现了GPS、屏幕和互联网的融合,带来了真正有意义的应用,比如WhatsApp、Uber、Instacart和DoorDash。现在随着与软件对话的技术已经达到了某种“事件视界”,你觉得未来会有一些计算体验是以对话为主导的吗?这一点很有可能实现。我认为我们未来依赖的某些计算体验会首先基于对话,这将使我们能够以完全不同的方式使用技术。

主持人:  你提到设备会“消失”得更多。有两种消失的方式:一种是设备不再是中心焦点,你不再时时盯着它,互动方式会有所变化;另一种是,如果事物变得非常对话化或者个性化,那么你与计算机界面的互动会在日常生活中占据多大比例?比如,你不再与客户服务代表对话,而是与代理互动。你怎么看待未来人类与人类互动的时间比例相对于与数字代理互动的变化趋势?你认为这一趋势会朝哪个方向发展?

Bret Taylor:   我先告诉你我希望世界发展的方向,如果你想深入探讨一下悲观主义,我们也可以继续。我希望在这个AI代理的世界里,代理能够成为我们生活中重要的一部分。无论是个人生活还是工作生活,这些代理能够在合适的边界和安全措施下为我们采取行动,这将使我们不必亲自去做这些事情,而是能够真正专注于生活本身。就拿一个代表公司的Sierra代理来说,或许你的个人代理正在与它对话,帮你解决问题,而你可以继续过你的生活。

我认为技术的目的就是为我们解决问题,随着AI的发展以及由AI赋予的自主权,技术可以逐渐淡出我们的视线,融入背景。当然,也有一些例子,比如与虚拟化身的对话,或者像元宇宙这样的概念,这些都是有意义的领域,AI也会改变这些空间的深度和实质。但我希望对大多数人来说,这将是我们对待电子游戏的一个延伸——它们是一种有意义的娱乐形式,但你可以放下手机,摘下VR眼镜,真正与人面对面地交谈,减少按按钮让计算机执行任务的时间,让你的代理为你完成这些任务。

主持人:  这是一个非常好的总结。感谢你的对话,Bret。

Bret Taylor:  我的荣幸,非常感谢。



视频来源:https://www.youtube.com/watch?v=riWB5nPNZEM&t=15s

素材来源官方媒体/网络新闻

对了,喜欢就别忘了点赞、收藏、转发支持一下!期待在评论区听到你的观点和看法!

往期回顾

1、[演讲视频:2024年第65届国际奥数大会上,陶哲轩再次表示当前AI进展惊人,智能水平已与人类相当]

2、[在2024的AII-IN峰会,对话马斯克:他预言AI很快将带来空前社会繁荣,每个人都能获得梦寐以求的一切]

3、[视频对话OpenAI Sam Altman:AI驱动的技术革命浪潮,预测未来十年人类社会将经历的巨大转型]


我们旨在将先进科技与创新想法完美融合!

想要掌握人工智能,但不知从何开始?告诉我们你的需求,学习AI让你抓住这波浪潮

告别昂贵服务和缺人烦恼,再见漫长交付周期

无限创意,快速生成专业级产品

感受 AI 带来的全新工作体验!

欢迎各大品牌方、媒体、企业和个人等

请联系负责人微信:Milo-1101

--END--


未经许可不得转载,务必保留公众号原文链接和公众号按钮

继续滑动看下一个
AI深度研究员
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存