查看原文
科技

扎克伯格深谈最强大模型:回应公开信「点名」苹果,未来智能体的数量将比人类更多

用 AI 发电的 APPSO
2024-07-25

今天凌晨,Meta 发布了目前最强大的开源大模型 Llama 3.1。与此同时,扎克伯格也接受了「The Rundown AI」创始人 Rowan Cheung 的采访,进一步地讨论了 Llama 3.1 以及他对 AI 发展的看法。在对话中,扎克伯格直接回应了自己在公开信中「点名」苹果的原因,也分享了为什么 Meta 决定走开源模型的路线以及未来的商业模式。他认为,从长远来看,开源模型创造的生态比封闭模型更安全,而 AI 智能体,终将会如电子邮件和社交账号一样,成为企业必备的工具:
「最终,AI 智能体甚至可能会比人类还多,人们会以各种方式与之互动。显然,这也是一个巨大的商机。」原文链接
https://www.youtube.com/watch?v=Vy3OkbtUa5k
Rowan Cheung:马克,非常感谢你来做这次访谈。今天 Meta 发了重磅 AI 模型,你能概述一下发布的内容及其重要性吗?马克·扎克伯格:当然可以。很高兴参与这次访谈,我是你的忠实粉丝。今天我们发布的是 Llama 3.1,我们发布了三个模型。这是我们首次发布 4050 亿参数的模型。这是目前为止最复杂的开源模型。和一些领先的封闭模型相比,它很有竞争力,在某些领域上的表现甚至还超越了封闭模型。我非常期待看到人们如何利用它,特别是现在我们的社区政策允许人们使用 Llama 作为教师模型来进行蒸馏和微调,基本上可以用它创建任何其他模型。除此之外,我们还将 4050 亿参数模型蒸馏成了更新、更领先的 700 亿和 80 亿参数模型。这些模型的性能也非常好,性价比也很高。我很期待看到大家如何使用这些模型。我认为这是开源 AI 的重要时刻。我想了挺长一段时间,我认为开源 AI 会成为行业标准,我认为它会遵循 Linux 的发展路径。在 Linux 流行之前,有很多公司想着有自己的封闭版 Unix,当时没有任何复杂的开源项目。人们会觉得,封闭开发模式是唯一一种可以做复杂产品的开发方式。起初,Linux 的立足点是建立在它更便宜,而且开发者可以定制化的基础上。随着生态的发展,它有更多的审查,变得更安全、更高级。更多的伙伴在 Linux 基础上建立了更多功能,最后让它变得和其他封闭 Unix 一样好用。现在,我认为 Llama 3.1 有机会成为开源 AI 标准,使开源成为 AI 行业标准。即使它在性能上还没有超越封闭模型,但在成本和可定制性上有很大的优势。我认为这些是开发者们会利用的优势。我们正在专注搭建一个合作伙伴生态系统,围绕着它,我们将看到很多不同的功能被搭建起来。Rowan Cheung:我看到了所有的基准测试,结果令人难以置信。显然,这是第一个 4050 亿参数的开源前沿模型。有没有哪些具体的实际应用案例,是你特别期待人们会用这个模型来构建的?马克·扎克伯格:我最期待看到的是,人们用它来蒸馏和精调自己的模型。就像你所说的,这是第一个开源前沿级模型,但它不是第一个前沿级模型。之前已经有其他具有这种能力的模型。人们会想要直接在 4050 亿参数模型上进行推理,因为我们估计它比 GPT-4o 便宜 50%。对于很多人来说,这能带来些影响。然而,我认为这个模型真正新颖的地方在于,它是开源权重的,能够将其蒸馏成任何你想要的大小,用于合成数据生成,作为教师模型使用。对于未来,我们不认为它会是属于单一事物的。就像,OpenAI 的愿景是搭建一个「大 AI」,Anthropic 和 Google 也有类似的愿景。但那从来不是我们的愿景。我们的愿景是未来应该有许多不同的模型。我认为每个创业公司、大企业、每个政府都想拥有自己的定制模型。当封闭系统比开源好很多时,使用封闭模型的确更方便。虽然开源模型可以自定义,但在性能上还是有差距。现在情况不同了。开源模型在性能上的差距基本上已经追上。你会看到更多人有动力去定制和构建适合自己需求的模型,用自己的数据训练,合适自己规模的模型。他们也会有工具去这样做,因为 Amazon 的 AWS 和 Databricks 等公司正在构建完整的服务套件,用于蒸馏和微调开源模型。在我看来,这是现在的新情况。我们很期待这个趋势能被推进到什么程度。这是世界上前所未有的新能力,因为以前没有一个开源或开源权重模型达到过这种复杂程度。Rowan Cheung:这的确是一件大事。你们将如何教育开发者使用这些工具?更广泛来说,Meta 是否有计划或策略去向世界科普开源模型和它的重要性?马克·扎克伯格:在 Llama 3.1 之前,Meta 在这方面投资的根本原因是,我们要确定自己能用上领先的模型。由于我们的历史,特别是移动端的历史,我们不想依赖某个竞争对手的基础技术。所以我们为自己构建了模型。在 Llama 3.1 之前,我们本能地认为,如果我们开源,它会吸引来一个社区围绕它成长,扩展其功能,使其对所有人更有价值,包括我们自己。因为最终,这不仅仅是一项技术,它是一个生态系统。为了让它对我们更有用,还需要一个广泛的生态系统。Lama 3.1 带来的一个大变化是,我们不再只是为自己构建,然后扔出去让开发者使用,而是更积极地建立合作伙伴关系,确保有一整个生态系统的公司,都可以用这个模型去做有趣的事情,并以我们无法做到的方式为开发者服务。我们不是云服务提供商,不是 AWS、Google 或 Azure,所以开发者不会来找我们构建他们的东西,但我们要确保所有这些云服务商都能够很好地使用这个模型。这不仅涉及到托管和推理,还包括一些新功能,比如蒸馏和微调,这些功能在封闭模型中不太容易实现,所以我们必须与合作伙伴进行具体工作来实现这些功能。与此同时,也会有像 Groq 这样专注于超低延迟推理的公司。我很开心能把它交到 Groq 手上,他们现在在用它来建新东西。还有一系列企业,比如 Dell、Scale AI、Deloitte 或 Accenture,他们与全球企业合作进行技术部署。我认为这些公司会帮助构建定制模型。无论是大企业还是政府,很多公司都希望拥有自己的模型并能训练自己数据。不少公司不愿意通过 API 将数据传给 Google 或 OpenAI,并不是因为这些公司存在隐私问题。那更像人们爱用 WhatsApp 端到端加密那样,他们希望在结构设计上就是安全的,数据也可以保留在自己手上。我认为这方面也会有一个市场建立起来。我对此非常兴奋。这次我们在建立生态系统方面采取了更积极的态度,因为我认为这是它成长并对每个人创造更多价值的方法。Rowan Cheung:我喜欢你们与开发者社区的紧密联系。我自己也是社区的一员,知道大家确实需要这些私有和本地模型。接下来聊聊你的公开信,除了 Meta 的公告,你还发表了一封信,第一部分重点介绍了开源对开发者的好处,感觉说得很准。你能多谈谈开源 AI 对社会的广泛影响吗?马克·扎克伯格: 我的观点是,开源是实现一个好的 AI 未来的重要因素。AI 会带来很多生产力和创造力的提升,希望还能帮助我们做研究等等。我认为,开源是确保 AI 可以惠及所有人,让人人都能使用的重要部分,而不是让 AI 仅仅锁在少数大公司手中。同时,我认为开源将是更安全、更可靠的 AI 开发方式。现在有一种关于开源安全性的争论 ——「开源真的安全吗?」我的看法不同。我认为开源不仅安全,还比封闭开发更安全。我们可以将风险分为「无意」和「有意」两种。「无意」的风险是系统以某种方式失控,这也是大多数科幻小说中 AI 失控的情景。我认为开源在这方面更安全,因为有更多的审查、更透明。所有开发者使用它时,也会有安全指引和安全工具,也有很多审查和测试压力,就像传统的开源软件一样。和封闭模型相比,问题会被更快地发现和解决。对于「有意」的风险,分为小规模的个体或团体的恶意行为,和大规模、有大量资源的恶意行为。我认为这两者有不同的应对策略。对于小规模的恶意行为,我认为权力平衡非常重要。我们在管理社交网络时,有很多恶意行为者尝试在我们的网络上做坏事,我们用更先进的 AI 系统来识别和阻止他们。这和政府和执法部门在社会中维持秩序的方法类似。虽然有一些无赖分子在犯罪,但警察和军队的资金更多、资源更多,我认为在这里也类似。我认为需要的是广泛部署开源,如果封闭就有风险无法做到这一点。当开源时,所有有大量资源的大机构都可以部署这些系统,从而抑制恶意行为者。在面对规模更大的竞争对手时,人们也会担心,如果你开源了模型,如何确保竞争对手不会用它?但我认为这种观点忽略了一些事情。那就是这一切的前提是,我们仍处于领先。我们的优势在于开放和去中心化的创新,而不是只有大公司或实验室,还有初创公司、大学、个人黑客等。如果采取封闭的方式,我们甚至有可能无法再领先。其次,考虑到模型容易被窃取,现实是任何科技公司都难以长期确保模型安全。我的观点是,我们应该用开源来开发全球领先且最强健的生态系统。Rowan Cheung:我们再谈谈开源 AI 的好处。你在信中提到,开源 AI 可以加速创新和经济增长。这是否已经在发生?它在未来又将如何进一步发展?马克·扎克伯格:我觉得,有个情况是,无论未来 AI 如何发展,它都会带来加速。也有一个情况是,开源 AI 会带来特定的发展好处。在提升效率和加速经济发展上,我觉得 AI 比其他任何单一技术都拥有更大的潜力,它可以提升每个人的创造力,生产更多有趣的东西。我尤其希望它能帮助科学和医学研究之类的东西。然而,今天很多人没有资源去精调或搭建自己的先进模型,只能依赖大实验室的模型。我认为你应该给创业公司、黑客、学术界和大学用上最先进的模型,作为一个基础去搭建,修改或蒸馏成更小的模型,可以在笔记本电脑,手机等设备上使用。我觉得这将带来大量发展和进步。而且,无论现在还是未来,还有很多国家甚至都没有能力去建造自己的大模型,因为它们的成本很快都要达到数十亿美元。但有了这些开源模型,国家和企业可以用更少的资源进行训练,为人们提供更好的服务。这将带来巨大的平等效应。我认为这是非常正面的。我们收到最多致谢的地方不是科技界,而是希望使用这些技术但缺乏技术能力的国家和企业。一旦他们有了这些模型,训练自己的模型就相对容易了。所以,这是一件非常了不起的事情。Rowan Cheung: 我喜欢这一点。还有一件事,我对你在信中直接点名苹果和它们封闭的形式感到有些惊讶。你能进一步讲讲苹果在这方面对 Meta 和其他公司的阻碍吗?马克·扎克伯格: 我在那边想讨论的,我的观点更多是哲学层面的,关于它如何影响了我建造事物的思维方式。我不知道苹果会如何发展 AI。他们有些开发是开放的,有些是封闭的。我并不认为自己是开源的领导者,我只是在这个情况中认为开源模型会成为标准,对世界有利。我不是说苹果在 AI 上一定会走错了方向。过去 10 到 15 年,那对我们来说是一个有深远影响的经历。我们在竞争对手控制的平台上构建自己的服务,出于不同的原因,它们会限制我们可以做的事情。它们会收各种「税」。我们曾经也做过一些研究分析,我们觉得,如果不是因为各种看似随意的规则,我们的盈利能力应该会更好。我觉得很多其他的公司也对此有所体会。老实说,虽然钱这方面也很烦人,但对我来说,那不是最重要的事情。让我最崩溃的是,当你觉得自己开发了对社区有益的功能,却因为某家公司想限制你,以便提高自己的竞争力,因此导致你无法发布这些功能。现在我对 AI 的担忧并不是苹果,而是其他公司,以及这一切会如何发展。从某个角度来看,我的意思甚至不是说他们是坏人。而是封闭系统会逐渐被各种力量推向限制。这就是为什么我认为一个健康的生态系统应该像互联网一样开放,但更强大。在移动互联网发展过程中,封闭模式赢了,对吗?苹果也获得了大部分的利润。虽然 Android 手机总数量更多,但苹果在手机上的盈利更多。我认为人们因此觉得封闭系统更好,这里有点偏见了,因为其实事情发展是更长期的循环。iPhone 在 2007 年推出,已经快 20 年了。这是一个长期的循环,但我们很容易忘记,封闭模式并不总是胜利者。如果回到 PC 时代,虽然很多人不认为 Windows 是完全开放的,但与苹果的操作系统和设备绑定的方法相比,Windows 的生态系统更开放,而且它的确赢了。对于下一代的平台,包括 AI 以及我们在 AR、VR 方面的工作,Meta 是站在建造开放生态系统那一边的。我们建立开放的生态系统,不仅是作为封闭生态系统的替代品,我是希望行业可以恢复到开放生态系统是领先的状态。我认为这是可能的,我们在 AI 和 AR、VR 方面取得了良好的进展,但这也是我个人和哲学上的追求,因为我感觉过去 10 到 15 年封闭模式对创造力有所限制。Rowan Cheung:对于你提到的,让行业恢复到开放生态系统属于领先的情况,我想深入讨论一下。显然,Llama 3.1 刚刚发布,它在关键基准测试中甚至超过了一些最先进的封闭模型,这本身就是一个奇迹。但在你的信中,你还提到 Llama 4 有望成为行业最先进的模型。你对 Llama 4 有什么特别期待的吗?马克·扎克伯格: 噢,你也知道,我们才刚刚推出 Llama 3.1,谈 Llama 4 可能有点早。但我们已经准备好了计算集群,数据集也准备好了,我们对架构有了大致的了解,并进行了许多研究实验来优化它。我确实认为 Llama 4 将是在 Lama 3 基础上的又一个重大飞跃。我们还是有很多进步的空间。譬如,这也是 Llama 的第一个「.1」版本发布,我还希望推出多模态模型,虽然我们在这方面遇到了一些挫折,但希望在未来几个月内可以在欧盟以外的地方推出。但现在谈 Llama 4 可能有点早,但它肯定会很棒。管理公司的一大有趣之处是规划计算集群和数据路径,不仅是Llama 4,还有未来的四五个版本。因为这些数据中心、供电、芯片架构和网络架构的建设都是长期投资。虽然这回答好像没有回答到你的问题,但我的确是非常兴奋的。Lama 3.1 值得至少一周时间来让大家消化发布的内容,然后再谈未来。Rowan Cheung:完全同意,接下来几周人们也会为 Llama 3.1 能做到什么而感到激动。但很高兴听到 Meta 已经在为 Llama 4 做准备。在这方面,你能多谈谈你对未来 AI 甚至是 AGI 的长期愿景吗?马克·扎克伯格:我很乐意从技术和产品两个方面谈这个问题。我们刚刚主要谈了模型,所以我先从产品说起。我们的愿景是应该有很多不同的 AI 和 AI 服务,而不是一个单一的 AI。这也是为什么我们会选择开源的方式。同时这也影响我们的产品路线图。我们有 Meta AI,表现很好。我的目标是让它成为世界上使用最多的 AI 助手,我认为我们正在朝这个方向前进,可能会在年底前几个月实现这个目标。我们的商业模式使我们能够构建世界上最先进的模型并免费提供给所有人,这是一大优势。在我们所有的应用上,都能很轻松地用上。更重要的是,我们专注于让每个创作者和小企业都能创建自己的 AI 智能体,使每个人都能在我们的平台上创建自己想要互动的 AI 智能体。想象一下,这是一个巨大的空间,全球有数亿小企业。我觉得其中一个最重要的是,要用相对小的工作量来完成智能体构建。一家公司可能只需要几个步骤,就能设置出自己的智能体,进行客户支持、销售、与客户沟通。就像现在每个企业都有电子邮件、网站和社交媒体一样。我们希望为所有这些企业提供支持。未来可能会有数亿甚至数十亿的小企业智能体。对于创作者也是如此。我们平台上有超过 2 亿人认为自己是创作者,主要使用平台来建立社区,发布内容,视其为工作的一部分。他们都面临一个基本问题,即没有足够的时间与社区互动。AI 智能体可以帮助他们解决这个问题,让社区能够与之互动。每个创作者都可以将其社交媒体信息整合进来,训练系统反映其价值观和商业目标,然后人们可以与之互动,几乎像一个艺术品一样。此外,我相信人们还有很多种不同方式去创造智能体,让智能体完成不同任务。我认为我们将生活在一个有数亿甚至数十亿 AI 智能体的世界中。最终,AI 智能体甚至可能会比人类还多,人们会以各种方式与之互动。这是产品愿景,显然这也是一个巨大的商业机会。这也是我们希望从中盈利的部分。我们不希望只是通过售卖模型本身的使用权限来赚钱。但是,我们不是一家云服务公司,我们将通过搭建最好的产品来赚钱。要做最好的产品,拥有最好的模型是重要一环,开源生态系统的建立会帮助我们做到这一点。这也是为什么这对我们来说非常有价值,构建高质量产品并取得最佳商业成果,通过建立开源社区实现这一目标。这也是为什么这与我们的哲学一致。我们不相信会有一个大的 AI,无论是产品还是模型。我们基本上相信要有广泛的多样性,不同的模型,每个企业和人都会想要自己定制的东西。我认为这会很有趣,也是这个领域有趣的一部分。Rowan Cheung: 很高兴看到 Meta 将技术直接整合到产品中。为数十亿用户免费提供前沿级 AI 模型是个大事。最后一个问题是关于人们的质疑。上世纪 90 年代,人们对互联网充满怀疑,但最终反对互联网的观点几乎变得不合理。现在 AI 似乎也处于类似的轨迹上。你认为我们是处于早期阶段吗?也就是,将来反对 AI 的观点是否会跟现在看当初反对互联网的观点一样?你认为哪些因素对改变这种看法至关重要?马克·扎克伯格: 人们对新事物的担忧有不同的方式。财务上,我非常清楚互联网在成功之前经历了一次大泡沫破裂。所以,虽然最终那些长期看好互联网的人是对的,但有时事情的发展比预期的要慢,需要有耐心。我也意识到这个情况。即便我对 Llama 3、Llama 4、Llama 5 的潜力感到非常兴奋,我也觉得它们将转变成更好的产品。现实是,我们很难提前知道某个东西是否足够好,你可以将它变成一个数十亿人使用的产品,以及要到什么时候,它才可以成为一个大生意。我们都在投入大量资本训练这些模型,所以人们可能会长期亏损。但也许这一切会更快发生,这很难说。另一个方面,人们更多是担心这对他们生计的影响。这也是我认为开源方法、许多不同模型、每个企业和创作者都能个性化和定制自己 AI 的重要原因。如果这一切发展成只有少数公司受益,人们只是使用这些产品,可能会喜欢 AI 助手,但如果这不能在某种程度上帮助所有人,最终会产生反弹。我花了点时间思考,回顾了 Web 2.0 发展历程,也在考虑在 AI、AR、VR 等新技术中,我们要怎样才能不仅仅创造出繁荣的产品,去支持经济增长,还能创造一个更好、更可持续的政策环境,使更多人感到受益并支持这个系统。我们在社交媒体方面做得还算不错,但从反馈来看,在 AI 和新技术上需要做得更好,以减轻人们对生计和生活影响的担忧。Rowan Cheung: 没人能比你说得更好了。Mark,非常感谢你参与这次访谈,也感谢你和 Meta 为 AI 社区所做的一切。马克·扎克伯格: 很高兴能参与。我也非常期待看到人们会建造出什么。



继续滑动看下一个
APPSO
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存