视频访谈节目：OpenAI创始人Sam Altman亲述GPT-4o细节,展望科技浪潮下新生存模式!

Original Milo-jk AI深度研究员

2024-11-09

在 ChatGPT-4o 发布当天，Sam Altman与Logan Bartlett分享了ChatGPT-4o的幕后细节，并提出了他对人工智能未来的预测。

Logan Bartlett 是 Redpoint Ventures 的软件投资者，Redpoint Ventures 是一家总部位于硅谷的风险投资公司，资产管理规模为 60 亿美元，投资于 Snowflake、DraftKings、Twilio 和 Netflix。

在节目中，Altman 深入探讨了 OpenAI 的愿景，讨论了实现 AGI 的时间表，并探讨了人形机器人的社会影响。他还表达了他对人工智能个人助理的兴奋和担忧，强调了当今人工智能领域最大的机遇和风险等等。

视频时间轴

(00:00) 简介

(00:50) 领先 OpenAI 的个人影响

(01:44) 揭开多模式人工智能的面纱：技术的飞跃

(02:47) 多模式人工智能的令人惊讶的用例和好处

(03:23) 幕后花絮：让多模式人工智能成为可能

(08:36) 展望人工智能在沟通和创造力方面的未来

(10:21) 人工智能业务：货币化、开源和未来方向

(16:42) 人工智能在塑造未来工作和体验方面的作用

(20:29) 揭穿 AGI：迈向高级人工智能的持续旅程

(24:04) 探索科技进步步伐

(24:18) 可解释性在人工智能中的重要性

(25:11) 探讨人工智能道德与监管

(27:26) 人工智能及其他领域的安全范式

(28:55) 个人反思和人工智能对社会的影响

(29:11) 人工智能的未来：快速起飞的场景和社会变革

(30:59) 应对个人和职业挑战

(40:21) 人工智能在创意和个人身份中的作用

(43:09) 人工智能时代的教育系统适应

(44:30) 用先进的人工智能思考未来

视频文字整理

Sam Altman详尽地探讨了GPT4o应用和AI发展，所以整理出了一万多字的内容。这为有兴趣深入了解此领域的同学们提供了丰富的信息和见解。

如果你觉得阅读长篇大论比较费时，大家可以直接观看这段视频，不仅可以节省阅读时间，还能直观地感受访谈氛围，

简介

我们已经有了很长时间关于语音控制电脑的想法,但对我来说,使用起来从来都不自然。而这一次不同,无论你怎么称呼它的流畅性、灵活性等等,我都无法相信自己是如此热爱使用它。欢迎来到Logan Bartlett的节目,在这一集里,你将听到我与OpenAI联合创始人兼CEO Sam Altman的对话。

如果这是你第一次收听Logan Bartlett节目,这是一个我与科技领袖和投资者讨论他们在经营或投资科技公司时获得的经验教训的播客。与Sam的这次讨论有些不同,我提出了许多与人工智能相关的问题,以及OpenAI未来的发展方向,鉴于这是如此热门的新闻话题,以及Sam对这个人工智能前沿领域的看法,你将听到我们的讨论内容。

领导OpenAI的个人影响

在过去4到5年里,经营OpenAI,很多人问我生活中最不同寻常的变化是什么?发生了很多变化,但最奇怪的一点可能就是我无法在公共场合保持基本的匿名状态了。

我想如果提前考虑到这一点,我会说这将是一件很奇怪的事情,但我当时并没有真正考虑到。这是一种非常孤立的生活方式,感觉很奇怪。你相信人工智能和这家公司的前景,所以你难道没有考虑过作为领导者的衍生影响吗?我当时并没有考虑到这样的事情,比如说这家公司会变得非常重要,我可能无法在自己的城市里正常去餐厅就餐了,这太奇怪了。

多模态人工智能的面纱

今天（2024年5月13日）早些时候宣布了一项新的进展,是多模态AI:GPT4o,其中代号是Omega符号,就是"O"这个字母。是Omni(全方位)。它可以跨文本、语音和视觉工作。你能谈谈为什么这很重要吗?因为我认为这是使用电脑的一种令人难以置信的新方式。我们已经很长时间有了语音控制电脑的想法,我们有过Siri,在那之前也有过其他产品,但对我来说,使用起来从来都不自然。

而这一次不同,由于多种原因,无论是它所能做到的事情、操作速度、加入了其他模态、语调的自然性,还是你可以让它"说快一点"或"用另一种声音说话"这种灵活性,无论你称之为流畅、柔韧还是其他,我都无法相信自己是如此爱上了使用它。斯派克·琼斯会为此感到自豪的。

令人惊讶的多模态人工智能用例和好处

我只用了大约一周的时间,但有一个出乎意料的情况是,当我完全专注于工作时,将手机放在桌子上,然后在不必切换窗口或改变我正在做的事情的情况下,将它作为另一个渠道使用。

我原本可能需要停下手头的工作,切换到其他标签页,在谷歌上搜索一些东西,然后点击浏览,但现在我可以继续当前的工作,同时直接提出问题并立即获得响应,而无需切换我在电脑上正在查看的内容,这是一个出人意料的很酷的体验。

幕后:实现多模态人工智能

我们一直梦想有一天能戴上一副AR眼镜或其他设备,就能像在现实世界中说话一样,看到事物发生变化,但可能会因网络延迟而变得更加困难。但对于这个产品来说,200到300毫秒的延迟感觉非常流畅,在很多情况下比人类响应还要快。但是我现在还不确定。我确实学到了一件事,那就是人工智能和惊喜是不太搭配的。尽管传统科技公司会以某种方式推出新产品,但我们可能需要采取不同的方式。

我们当然仍可以称之为GPT-5并以不同方式推出,或者直接使用其他名称,但我们还没有完全弄清楚如何为这些产品命名和确定品牌。从GPT-1到GPT-4的命名还算合理,但显然GPT-4也在不断改进,变得越来越好。我们还有一种想法,即可能存在一种底层的"虚拟大脑",它可以根据不同情况思考得更多或更少,或者可能是不同的模型,但也许用户并不关心它们是否不同。所以我认为我们还没有完全确定如何为这一切进行产品营销。这是否意味着,与过去相比,为了在模型方面取得渐进式进展所需的计算量可能会减少?我倾向于认为,无论我们获得多少计算资源,我们都会全部利用。现在我们正在获得令人难以置信的效率提升,这一点非常重要。我们今天推出的一个了不起的功能显然是语音模式,但也许最重要的是,我们使它如此高效,以至于可以免费提供给任何想下载使用ChatGPT的人,其服务水平超过了目前世界上最好的模型。

与GPT-4和GPT-4 Turbo相比,这是一个显著的效率提升,而且我们在这方面还有更多可以提高的空间。我听说你曾表示,ChatGPT本身并没有真正改变世界,但它可能只是改变了人们对世界的期望。是这样吗?我认为你很难在任何经济指标上发现ChatGPT真正带来了生产力或其他方面的提升,也许客户支持或某些领域除外。如果你查看全球GDP,你能在ChatGPT推出时发现明显的变化吗?也许不能。但是否有一个时间点,你认为我们将能够确定它对GDP的影响呢?我不知道你是否能够指出哪一个具体模型造成了影响,但我认为几十年后回顾历史,我们会发现在某个时候出现了转折。

在未来12个月内,你认为哪些应用领域或领域最有前景?我当然可能有偏见,因为这与我们在这里所做的工作有关,但我认为编程是一个非常重要的领域。你最近花了一些时间讨论高度专门化模型与能够真正进行推理的通用模型之间的区别。我相信通用模型才是最重要的,在这方面,对于那些专注于非常狭窄数据集和与之相关的集成的人来说,最重要的是什么?如果模型能够进行通用推理,如果它能够发现新事物,那么无论它需要处理什么新类型的数据,你都可以输入,它就能够处理。但反过来则不行,将多个专门化的模型组合在一起是无法实现泛化推理的。从这个角度来看,编码特定模型的意义可能不太大。我想更准确地说是,找出真正的推理能力才是最重要的,然后我们可以将它应用于各种场合。

展望人工智能在沟通和创造力方面的未来

在未来两年,自然语言似乎是一种相当不错的交流方式。我对这个总体想法很感兴趣,那就是我们应该设计一个人类和人工智能可以以相同方式共同使用的未来。因此,我对人形机器人比其他形式的机器人更感兴趣,因为我认为当前的世界是为人类量身定制的,我不希望它被重新配置成某种更高效的东西。我喜欢这样的想法,即我们可以用非常人性化的语言与人工智能对话,它们甚至可能也以这种方式相互交流,虽然我也不确定。但总的来说,我认为这是一个值得推进的有趣方向。你最近说过这样一句话的意思,也许模型最终会被商品化,但最重要的可能是将模型个性化,针对每个个人量身定制。

我理解正确吗?我不太确定,但这听起来似乎是合理的。除了个性化,你认为对于终端用户来说,正常的业务界面和易用性是否最终会成为赢家?这些肯定很重要,它们一直如此。我可以想象还有一些其他情况,比如某种市场或网络效应会产生影响,我们希望我们的智能代理能够相互通信。不同的公司就像应用商店里的应用一样,但我总的想法是,商业的一般规则仍然适用,每当有新技术出现时,人们总是会认为旧规则不再适用,但这几乎总是错误的观点,创造价值的传统方式在这里依然有效。

人工智能的商业化:货币化、开源和未来方向

是的,我认为就像许多其他类型的技术一样,开源将占有一席之地,托管模型也将占有一席之地,这很好。我不会问任何与此相关的具体细节,但据报道你们正在寻求筹集大量资金。我认为《华尔街日报》是一个可信的报道,说是为了为晶圆厂投资动员资金。半导体行业的台积电和英伟达一直在积极扩张以满足对人工智能基础设施的需求预期。你最近曾表示,你认为世界需要更多的人工智能基础设施,然后你说需要更多得多的人工智能基础设施。你是否看到了需求方面需要比目前台积电和英伟达提供的更多的人工智能基础设施的迹象?

首先,我相信我们将找到办法大幅降低提供当前系统的成本。其次,我确信随着成本降低,需求将大幅增加。第三,我确信通过构建更大更好的系统,需求将进一步增加。我们都应该希望智能的代价如电费一样便宜,变得非常丰富,人们可以将其用于各种用途,甚至不会考虑是否需要,比如"哦,你知道我是否需要它来阅读并回复我的所有邮件",或者"你知道我是否需要它来治愈癌症"。显然,你会选择治愈癌症,但理想情况是你希望它都能做到,我只是想确保每个人都能拥有这种智能。我不需要你在这里评论你自己的个人努力,尽管如果你愿意的话,请告诉我。对于Humane和Limitless等一些不同的物理设备助手,你认为它们犯了什么错误,或者你认为用户采用度可能还没有达到预期?

我认为这只是一个早期阶段。我一直是各种计算机的早期使用者,我曾经非常喜欢小型TC1000,就像我大一的时候,我觉得它太酷了,虽然离iPad还很遥远,但方向是正确的。然后我买了一台Trio,我当时是一个很不酷的大学生,我有一台旧的Palm Trio,那时没有其他孩子拥有,离iPhone还很远,但我们最终还是实现了。这些东西给人一种很有前景的方向,但需要经过一些迭代。你最近提到,一些建立在GPT-4之上的企业将被未来的GPT"扫荡",这是你的原话。我想请你能就此阐述一下,第二,你认为哪些特征的"AI先行"企业会在GPT不断进步的过程中存活下来? 目前为止,我发现唯一有效的框架是,你可以建立一家押注于下一个模型不会太出色的企业,或者押注模型会进步并从中获益的企业。

如果你为某个用例投入了大量工作,这超出了GPT-4的能力,最终你让它勉强工作,但随后GPT-5出现了,它可以完美处理这个用例以及其他任何事情,你可能会为之前在那个仅仅勉强可行的用例上付出的努力而感到遗憾。但如果你的产品总体上表现尚可,人们发现了一些使用场景,但你并没有投入大量工作去使某个具体的用例成为可能,随后GPT-5或无论我们怎么称呼它的出现,整体水平都大幅提高,你就会获益于全面的提升。我的建议是,在大多数情况下,你并不是在建立一家人工智能企业,你是在建立一家利用人工智能技术的企业。在App Store早期,有很多应用填补了一些非常明显的空白,后来苹果修复了这些问题,你就不再需要从应用商店下载手电筒应用了,它已经成为操作系统的一部分,这是必然会发生的事情。另一方面,像Uber这样的公司虽然是由智能手机的出现所启发,但确实建立了一个非常可靠的长期业务。我认为你应该努力成为后一种类型的公司。

我可以举出一些现有企业利用你们的技术来符合这种框架,在某种程度上来说,你认为还有哪些新颖的概念可以成为像Uber这样被人工智能彻底改造的对象吗?它不一定是一家真实的公司,也可以是一个有趣的想法或玩具概念,只要你认为它被彻底改造的可能性很大。对于这些案例中的许多情况,我确实会押注于新公司。人们经常举的一个例子是尝试构建AI医生或AI诊断医生,人们说我不想在这方面创业,因为梅奥诊所或其他公司会做这件事。但我实际上会押注于一家新公司来做这样的事情。除了上述观点外,对于那些希望为这种颠覆性变革做好准备的CEO们,你还有何建议?我会说,要相信智能服务会每年变得更好更便宜,但这对于赢得胜利而言只是必要非充分条件。

那些实施这一变革需要数年时间的大公司,你可以超越他们,但是每一家关注这个领域的初创公司也会这样做,所以你仍然需要找出自己业务的长期防御能力是什么。不过,现在的竞争环境比以往任何时候都更加开放,有新的令人难以置信的事物可以去做,尽管如此,你仍然需要通过辛勤工作来创造价值,只不过现在你可以通过更多方式去做。

人工智能在塑造未来工作和体验方面的作用

我以前从未想过五年内可能会出现或成为主流的新型工作职责。人们总是问哪些工作将会消失,问哪些新工作会出现反而更有趣。让我想一想...我可以谈论一些我认为不太有趣或不太重要的事情,但我努力想找出一些可能有数亿人从事的领域。新型艺术、娱乐,以及更多以人为本的人际联系方式,我不知道这些工作的具体职称会是什么,但我认为即使五年内不会完全实现,对极富创意的现场人际体验也会有很高的需求。我们暂时还无法给它们命名,但我可以预见这将是一个全新且非常庞大的领域。

OpenAI最近一轮公开融资的估值在900亿美元左右,在实现通用人工智能(AGI)之前,您认为有哪一两个里程碑事件将推动OpenAI成为万亿美元公司?我认为如果我们能够继续以目前的速度改善我们的技术,并找到方法持续推出优秀产品,收入也像目前这样持续增长,我们就会一切顺利,尽管我无法给出具体数字。目前的业务货币化模式是否能创造万亿美元的公司估值?我的意思是ChatGPT的订阅模式对我们来说非常管用,出乎意料的好,我本来并不会下这个赌注,也没有信心会像现在这样成功,但结果确实很好。在实现AGI(无论该术语真正意味着什么)之后,我们是否能向AGI询问货币化模式会是什么形式?那可能会是不同的模式。是的,应该可以。

我们也许在11月份看到,现有的OpenAI结构让人们对某些事情有所保留,我们无需再次细数。你曾谈及将随时作出调整,您认为未来应当采取什么样的适当结构?我认为我们很快就可以谈论这个问题了。我们一直在努力进行各种讨论和头脑风暴,希望在今年能够讨论这个问题。当拉里(Larry Page)和布雷特·泰勒(Bret Taylor)被提升为董事时,我一直在等待你们的电话,但最终没有收到。我认为,关于人工智能的一些先入为主的观念,比如你提到的货币化模式等,我们都有过一些想法。你曾谈到,显然最先受到影响的是体力劳动,接下来是白领工作,然后是创意工作,但事实上在某些方面似乎恰恰相反。你是否发现了其他一些与预期完全相反的情况? 这绝对是我最大的意外发现,就是你提到的那一点。我没有料到它在法律工作方面如此之早就表现出色,因为我认为那是一个非常精确和复杂的领域。

但是,最大的意外无疑是我们观察到,在体力劳动和创意认知劳动方面,情况恰恰相反。

揭秘AGI:通往先进人工智能的持续之路

什么样是"人工通用智能(AGI)"这个术语?因为我意识到这不再是一个时间点的问题。当我们成立公司时,特别是在这样一个变化如此之快的领域,我有太多天真的概念。我当时天真的想法是,我们最终会达到一个时间点,在那之前我们没有AGI,之后我们就拥有了,会出现一个真正的不连续性。我仍然认为存在一个真正的不连续性的可能性,但总的来说,我认为它看起来会更像一条连续的指数曲线,关键在于年复一年的进步步伐。

我们可能无法就何时达到AGI的具体月份或年份达成一致,但即使就此达成共识也比看起来更难。毫无疑问,GPT-4还达不到几乎任何人都会称之为AGI的门槛,我也不指望我们的下一个重大模型就能做到。但我可以设想,我们离开那一步只差一两个或一小部分创新理念,再加上一些规模扩大,我们就会觉得这已经有所不同了。我认为对此保持警惕很重要。我们是否可以设立一个现代版的"图灵测试",就像巴特利特测试那样,当通过这个门槛时,你就会说"嘿,这就是AGI了"?当它能够比OpenAI所有研究人员加在一起还要出色时,我会觉得这是一个非常重要的事情,感觉可能或者应该被视为一个不连续性。你觉得我们离这个目标近吗?也许还不太近,但我不会完全排除这种可能性。

在实现AGI的道路上,你看到的最大障碍是什么?听起来你认为当前的规模法则还有一段时间的运行空间,能维持未来几年吗?我认为最大的障碍是新的研究成果,这是我从互联网软件领域转向人工智能领域后不得不学会的一件事,那就是研究进度与工程进度不同,通常意味着需要更长时间,但有时也意味着进展会比任何人预期的都要快得多。

探索科学和技术进步的步伐

科学和工程史上还有许多其他例子,也有很多我们提出的理论从未发生,或者比我们预期的晚了数十年甚至数百年,但有时确实进展很快。

用历史上的例子来解释可能是最好的方式。我可能会搞错数字,但我相信没人会试图纠正你。哦,肯定会有人纠正的。中子理论最初是在20世纪初提出的,可能在20年代首次被发现,随后在30年代开始了导致40年代原子弹诞生的相关研究。从对中子这个概念一无所知,到能制造出原子弹、彻底改变我们对物理学的直觉,这个进程非常迅速。

还有一些不太纯科学的例子,比如著名的关于莱特兄弟的引语,我也可能记错了数字,但假设是在1906年,他们认为要等50年才能实现飞行,结果在1908年就做到了,差不多是这样。

人工智能中可解释性的重要性

不同类型的可解释性,一种是我是否能够理解网络中每一个机械层面的工作原理;另一种是我是否能从输出结果中看出逻辑缺陷等。我对OpenAI和其他机构在这个方向上所做的工作感到兴奋,我认为可解释性作为一个更广阔的领域看起来很有前景且令人兴奋。我不会要求你现在就具体阐述,我想当你们准备好时会有相应的公告,但你认为可解释性是否会成为人工智能被主流采用的必要条件,也许在企业内部之类的场合?

GPT-4在这方面已经相当不错了。是的,这是公平的评价。也许有几件事人们会询问或指责你,指责这个词可能有点太强了,但人们对此存有怀疑,其中之一是,你似乎在"人工通用智能"这个问题上进行权衡,一方面对此感到兴奋,但另一方面也似乎有一种个人的担忧,担心是你、OpenAI单方面做出决策来驾驭它,这导致了一些呼声,呼吁建立一些由民选领导人而不是你来做决策的政府机构。

探索人工智能伦理和监管

我认为,对于目前的人工智能能力水平加以严格监管是一个错误。但是当模型达到一定程度,我相信它们将对世界构成重大的灾难性风险时,那么建立某种监管可能就是一件好事了。关于在何种程度设置这些门槛,以及如何进行测试,这确实需要权衡。完全阻止这项技术的巨大利益,不让那些想在地下室训练模型的人这样做,将是一件非常糟糕的事情。但你知道,我们对核武器制定了国际规则,我认为这是一件好事。

那些被指责为"监管俘获者"的风投,他们属于哪一类呢?在这个AI监管问题上,你认为他们没有看到潜在风险的哪些方面? 我认为他们整体上并没有真正思考过"通用人工智能"这个问题。那些大声疾呼"监管俘获"的人,不久前还在完全否认人工智能的可能性。我为他们的立场表示同情,因为监管对技术行业的影响确实是负面的,看看欧洲的技术产业就知道了。

但我认为,我们正在走向一个临界点,超越这一点后,我们所有人的感受可能都会有些不同。

人工智能及其未来的安全范式

开源模型本身在某些方面会带来固有的危险,目前还没有,但我可以设想会有这种可能性。我听过你说,从某些方面来说,安全性是一种错误的框架,因为它更多是关于我们明确接受的风险,就像航空公司一样。安全性不是一个非黑即白的问题,你之所以愿意乘坐飞机,是因为你认为它们相当安全,尽管偶尔会发生坠机事故。至于称一家航空公司为安全需要达到什么标准,这是需要讨论的问题,不同人有不同看法。

这是一个当下的热点问题,因为整体上飞机的安全性已经变得令人难以置信地高,但安全并不意味着再也不会有人在飞机上丧生。类似的,在医疗领域,我们非常关注副作用,有些人会出现不良反应。还有安全性的隐性方面,比如社交媒体或其他可能产生负面影响的事物。是否有什么情况会导致你在安全范式上采取与继续推进不同的行动?

个人思考和人工智能对社会的影响

我作为一位播客的好友,如果不问一个关于快速爆发的问题,我会觉得疏忽职守。我很好奇,有许多不同的快速爆发场景,而我们今天指出的一个限制因素就是缺乏人工智能基础设施。我猜如果有研究人员开发出一种针对当前transformer架构的修改,能够极大地减少所需的数据和硬件规模,更像人脑那样,我们是否可能看到一种快速爆发的场景发生?当然有这种可能,即使不需要任何修改也是如此。这可能不是我认为最可能发生的路径,但我并不忽视它,我们有必要在可能发生的情况中考虑它。

我认为事情最终会变得更加连续,即使加速了。我们不太可能在一天晚上拥有相当不错的人工智能,第二天就醒来发现真正的超级智能。但即便快速爆发发生在一年或几年内,从某种意义上来说也算是快速的。还有一个问题是,即使你获得了这种非常强大的通用人工智能,它对社会在第二天、第二年或第二个十年会产生多大影响?我的猜测是,在大多数情况下,它不会在第二天或第二年就产生影响,但在十年之内,世界将发生巨大变化。社会的惯性在这里是一件好事,是有益的。

应对个人和职业挑战

Elon啊,股权和十一月的董事会结构,这些可能是那三个,哪一个会让你回答很多次?你最不喜欢哪一个?我是说,我并不讨厌任何一个,只是我对任何一个都没有新的东西可说。

嗯,我想我不会特意说那个股权的问题,因为我觉得你已经用足够多的方式回答过了,尽管人们似乎还是不喜欢那种"足够多的钱就是一种事物"的回答。是啊,如果我赚了一万亿美元,然后都捐掉了,它就会符合人们的期望,或者说符合通常的做法,哦,也有另一个想法,试着以某种方式做到这一点。是的,相对来说没什么,我只是说大多数赚了很多钱的人都是那样做的。那么,在追求AGI之外,我的动机是什么?我想大多数人会安慰自己,哪怕我有一个更高的使命,我仍然可以为之获得报酬。现在,每天来上班,你从中获得最大的成就感是什么呢?听着,我一直这样告诉人们,我现在愿意做出很多其他生活上的权衡和牺牲,因为我认为这是最令人兴奋、最重要的,也是我将永远接触到的最好的事物。现在是一个疯狂的时代,我很高兴这种情况不会永远持续下去。就像你知道的,某个时候我会退休到农场,回想起这段经历会觉得很亲切,但会说哦天哪,那真是压力重重、漫长而又令人压力重重的日子。但这也令人无比振奋,我真不敢相信这是发生在我身上的事,这太神奇了。

不知道有没有一个单一的时刻是最超现实的,就像你无法在城市里外出那个例子一样?在过去的几年里,是否有一个单一的时刻让你感到哇,我真不知道,我猜你曾经做过与比尔盖茨的播客吧?如果我现在拿走你的手机,上面会有很多有趣的人吗?在过去几年里,是否有一个独特的超现实时刻,让你觉得如果我有多一点心理空间后退的话,这一定会疯狂到家了?每天都会有一些事情,让人觉得"哇",就像在水中的鱼那样。是的,有点那种感觉。在所有那件11月的事情发生之后,你知道的,不管是当天还是第二天,无论如何,我收到了10到20条短信,来自世界各地的总统、首相等等,而奇怪的部分并不在于这一点。奇怪的是,我当时只是像回复"谢谢"之类的话,觉得这很正常,然后我们经历了这四天半的疯狂紧张时期,真是太疯狂了,几乎没怎么睡觉,也没怎么吃东西。"

精力水平非常高,非常清晰,非常专注,但就像你的身体处于某种奇怪的肾上腺素充能状态很长一段时间。然后就在感恩节前一周,所有这一切都发生了,真是太疯狂了。在星期二晚上,一切都解决了。你取消了我们的播客,对不起,我通常不会取消任何事情。不管怎样,在那个星期三,就是感恩节前的那个星期三,阿里和我开车到了纳帕,然后在一家餐馆停下来吃东西,那里的东西很不错。在开车的路上,我意识到自己已经好几天没吃东西了。突然之间,一切又变得正常起来,就像我们平时周末会做的那样,开车去某个地方。我要了四份重淡菜,像油炸重淡菜那样,还有两份牛奶昔,全都是我自己的份。我坐在那里吃,感觉非常满足。就在我吃东西的时候,一个国家的总统又给我发了条短信,说抱歉打扰了,祝贺什么的。那时我突然意识到,所有这些人都给我发过短信,这并不奇怪。奇怪的是在中间我才意识到这一切真的发生了,而这本应是一种非常奇怪的经历,但对我来说并不奇怪。所以那是我记忆最深刻的一个时刻。是的,这很有趣。

我的看法是,人类适应几乎任何事物的能力比我们意识到的都要强大得多。无论好坏,你都可以很快将任何事物视为新的常态。在过去的几年里,我多次领悟到了这一点。但我认为这说明了人性的一些非凡之处,这对于我们来说是件好事,因为我们正面临着这种巨大的转变。你一定还记得911事件后的情况,我当时在新泽西州的萨米特,我们小镇就失去了几十个人,但在经历了这场恐怖袭击之后,整个小镇团结一心,这种团结变得如此正常。我现在在以色列有些朋友,当你跟他们谈起这件事时,他们会说这太正常了。我说"但那里正在发生战争,一定很不真实吧?"他们会说"嗯,你还能怎么办呢?你得继续生活,去买东西吃。"这真是太神奇了,这些心理冲击因素到最后,我们仍然需要吃东西,需要与朋友交谈,等等。这确实令人惊讶,竟然可以发生这么大的变化。这真的是我最大的惊喜,感受到如此虚无缥缈的事物。当你考虑到模型变得越来越智能时,你认为人类仍然独一无二的是什么?你之前略有提及创造力这个元素。我多年来一直认为,人类仍然会关心其他人。

你知道,我在网上看到,每个人都说现在大家都会爱上Claude了,每个人都会有Claude这个女朋友什么的。我赌不是这样。我赌人类注定会长期关心其他人,以各种大大小小的方式。这可能听起来有些阴谋论,但你可能没听过太多关于人工智能的阴谋论,即使听到了你可能也不会在意。我们可能不会把看机器人踢足球作为主要爱好吧? 作为OpenAI公司的负责人,你制定了很多运营规则或框架,比如在YC是如何运营企业的。然后你也打破了其中的一些规则。在招聘方面,你是否会为这家公司招聘与你之前可能会招聘的消费互联网公司、B2B软件公司等不同类型的人才,尤其是在管理层级别?研究人员和产品工程师大多是不同的,布拉德·米洛尔或一些其他高管也属于研究人员,他们是与众不同的。但是OpenAI是否会招聘不同类型的高管,或者你在招聘时会寻找不同的特质? 我大多没有这样做。有时你会从外部招聘高管,但我是个坚定的支持者,如果你通常是提拔内部人员的话。单单提拔内部人员做高管可能是个错误,因为这可能会加强单一文化。所以我认为你需要引入一些新的非常资深的人才。但我们主要是培养内部人才,考虑到我们所做的事情与别的公司如此不同,这是件积极的事情。

在OpenAI的这段时间里,你是否有过一个决定,当时感觉是最重要的?你是如何做出这个决定的?很难只指出一个决定,但我们决定采取所谓的"迭代部署"的决定,即我们不会在秘密中构建AGI,然后一次性把它释放到世界上,这与普遍的智慧和其他人的计划相反。我认为这是一个非常重要的决定。当时我们觉得这是个非常重要的决定。如果另一家公司押注于语言模型,这也是一个重要的决定,当时也感觉是个重要的决定。我实际上不太了解最初押注于语言模型的来龙去脉,这是怎么回事? 嗯,我们之前在做其他项目,做机器人和视频游戏。有一个非常小的团队开始研究语言模型,伊利亚(Ilya)真的相信这个方向,相信所谓的语言模型。所以我们做了GPT-1、GPT-2,开始研究规模放大定律,放大了GPT-3的规模。然后我们下定决心,这就是我们要做的事情,当时看起来一点都不明显,事实并非如此。你最近提到的另一件事是,有两种AI方法。

人工智能在创意和个人身份中的作用

人工智能复制你自己,然后变成最聪明的员工?不是人工智能本身,而是你想如何使用它。因为显然我误解了,如果几年后你给我发短信,我想你要明确是你还是你的AI助手在给我发短信。如果是我的AI助手发的,那就像你知道的,把消息捆绑在一起,过会儿你会得到回复。或者,如果它可以轻松完成你可能会让人工助手做的事情,那也行,你会知道的。我认为将这些事物分开是有价值的,而不是觉得好像人工智能就是山姆的延伸,我不知道我是在和山姆还是山姆的AI助手交谈,但没关系,因为它们是一回事,是这个合并的实体。我认为会有山姆和山姆的AI助手,我也希望自己拥有这样的助手,我不想觉得这东西就是我的一种奇怪延伸,而是一个独立的实体,我可以与之跨越障碍交流。你可以看到,在音乐或创意领域,复制一个德瑞克或泰勒·斯威夫特的音频变得相当容易,我们可能需要某种形式的验证或某种中心化机构来验证,嘿,这确实是某某人的创意作品。

你可能也会希望在个人层面上有某种版本。是的,但就像你知道的,我是这样看待OpenAI的,我不喜欢那样,有不同的人,我让他们去做事情,他们就去做,或者他们让我去做事情,我就去做,但这不是一个统一的机器人。我认为这是我们都感到舒适的方式。那么,那是什么呢?你能将其与个人做出的分权联系起来吗? 哦,不完全是,我更多的是指,我的个人AI会是什么样子?明白了,我是否认为这就是我自己,它会接管我的电脑,做最好的选择,因为这是我,所以一切都会好起来,它会代我回复消息,你知道的,我会慢慢放手,它会慢慢变成我?还是我认为这是一个我可以与之共事的非常出色的人,我可以说"嘿,你能做这件事吗?做完后告诉我"。但我会将它看作是一个与我分离的存在?

教育体系在人工智能时代的适应

对于2030年或2035年左右的大学生这一批人来说,我认为最大的一点就是,人们不仅应该被允许使用工具,而且还应该被要求使用工具。当然,在某些情况下,我们希望人们以老式方式做事,因为这有助于理解。你知道,就像我记得有时在数学课上,有些题不允许使用计算器来做。但总的来说,在现实生活中你可以使用计算器,所以你需要理解它,但同时也要熟练使用计算器。

如果你上数学课从不用计算器,那你将来做工作时就会差一些。你知道,如果所有的OpenAI研究人员从不使用计算器,OpenAI可能就无法诞生,至少在电脑方面是这样。我们不会试图教导人们不使用计算器、不使用计算机,我认为我们也不应该训练人们不使用人工智能。它将成为未来从事有价值工作的重要组成部分。

思考拥有先进人工智能的未来

我时常会思考这个问题。我不会像幻想出现在《星球大战》未来城市般的飞行汽车那样具体地想象,但当一个人能够做成数百或数千个协调一致的人的工作时,这将意味着什么?当我们不用说是可以发现整个科学领域,而是给人一种感觉,就好像我们能发现整个科学一样,那会是什么体验?那会很酷。萨姆,谢谢你做这个采访。谢谢你的倾听,这是Logan Bartlet节目与OpenAI的首席执行官兼联合创始人Sam Altman的对话。如果你喜欢这次对话,非常感谢你点赞、订阅和分享给你认为可能会感兴趣的其他人。也欢迎下周继续收听,我们将与另一家重要科技公司的创始人兼CEO进行激动人心的对话。

谢谢大家的收听。

(音乐)(掌声)

(音乐)

往期回顾

1、[不能错过的发布会整理：OpenAI新发布GPT-4o多模态模型,实现语音视觉一体化,但也可能导致公司转型和人员失业]

2、[视频+万字实录：Sam Altman 在斯坦福创业者思维领导研讨会完整对话首次公开，涵盖你想了解的全部 AI 内容]

3、[从观望者到行动者的转变，红杉资本2024年AI大会指明普通人抓住AI机遇的路径]

我们的AI团队现向外界开放服务，旨在助力每个企业与个人引领时代潮流，将先进科技与创新想法完美融合!

告别昂贵服务费和缺人烦恼,再见漫长交付周期

无限创意风格,分分钟生成专业级作品

感受 AI 带来的全新工作体验！

欢迎各大品牌方、媒体、科技企业、知名IP等合作

合作请联系负责人微信：Milo-1101

--END--

继续滑动看下一个

AI深度研究员

向上滑动看下一个

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

视频访谈节目：OpenAI创始人Sam Altman亲述GPT-4o细节,展望科技浪潮下新生存模式!

视频时间轴

视频文字整理

简介

领导OpenAI的个人影响

多模态人工智能的面纱

令人惊讶的多模态人工智能用例和好处

幕后:实现多模态人工智能

展望人工智能在沟通和创造力方面的未来

人工智能的商业化:货币化、开源和未来方向

人工智能在塑造未来工作和体验方面的作用

揭秘AGI:通往先进人工智能的持续之路

探索科学和技术进步的步伐

人工智能中可解释性的重要性

探索人工智能伦理和监管

人工智能及其未来的安全范式

个人思考和人工智能对社会的影响

应对个人和职业挑战

人工智能在创意和个人身份中的作用

教育体系在人工智能时代的适应

思考拥有先进人工智能的未来

往期回顾

告别昂贵服务费和缺人烦恼,再见漫长交付周期

无限创意风格,分分钟生成专业级作品

感受 AI 带来的全新工作体验！

您可能也对以下帖子感兴趣

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

生成图片，分享到微信朋友圈

视频访谈节目：OpenAI创始人Sam Altman亲述GPT-4o细节,展望科技浪潮下新生存模式!

视频时间轴

视频文字整理

简介

领导OpenAI的个人影响

多模态人工智能的面纱

令人惊讶的多模态人工智能用例和好处

幕后:实现多模态人工智能

展望人工智能在沟通和创造力方面的未来

人工智能的商业化:货币化、开源和未来方向

人工智能在塑造未来工作和体验方面的作用

揭秘AGI:通往先进人工智能的持续之路

探索科学和技术进步的步伐

人工智能中可解释性的重要性

探索人工智能伦理和监管

人工智能及其未来的安全范式

个人思考和人工智能对社会的影响

应对个人和职业挑战

人工智能在创意和个人身份中的作用

教育体系在人工智能时代的适应

思考拥有先进人工智能的未来

往期回顾

告别昂贵服务费和缺人烦恼,再见漫长交付周期

无限创意风格,分分钟生成专业级作品

感受 AI 带来的全新工作体验！

您可能也对以下帖子感兴趣