Stability.AI创始人万字访谈:数据不要全球化,五大巨头谁能赢得AI大战?
今天分享播客节目 20VC 对 Stability AI 的访谈。
Stability AI 的创始人 Emad Mostaque 原本是对冲基金经理。在孩子确诊自闭症之后,他决定离开资本,创业寻找治疗和解决方案。
Stability AI 创办于 2019 年,在 2022 年发布 Stable Diffusion 模型。在开源社区的共同努力下,Stable Diffusion 已经成为最具竞争力的文生图模型。
据最新报道,公司估值 40 亿美元,获得了包括 Coatue、Lightspeed、Sound Ventures 等资本投资。
近期,Stability AI 开源了原本封闭的 DreamStudio,推出了动画/视频生成模型,并宣布将推出 LLM。
在这篇访谈里,Emad 谈到了他对 Stability AI 开源模式探索商业可能的理解,创业公司和巨头的竞争,MMAAG 五大巨头谁将赢得 AI 大战等话题。
以下为访谈内容,经 Founder Park 编译删减。
Emad
一年前,我们只是一个小作坊。我和我的妻子努力经营,因为办公室没有 Wi-Fi,我们在家里的房间里开了很多会。
现在情况不同了,我们已经成长了,拥有 170 名员工,正在跨国经营和全球扩张,明年将在每个国家发展业务。
所以我们努力将流程落实到位,但这并不容易。其中部分原因是,我们已经闭源了一些东西,比如 Dreamstudio。但从下周开始,我会把一切开源。我们打算公开构建我们的语言模型,并分享什么有效,什么无效。
哈里·斯戴宾斯
为什么?
Emad
我这么做的原因是,我认为这是共同叙事(shared narrative)的一部分,有人需要公开展示发生了什么。再次强调,这应该默认就是开源的。因为价值不存在于任何专有模型或数据中,我们将构建可审计(auditable)的开源模型,即使其中包含有许可数据。
你可以看到每一件自由放养的有机模型,这就是世界上所有私人监管和其他数据需要的。它与专有模型完全不同,因为你可以将这个采访数据中的大部分发送到 OpenAI。我认为你需要这两者。
哈里·斯戴宾斯
那为什么我只能发送这么多?
Emad
因为你是一家受监管的公司,所以你需要确保完全合规。如果你有一个 Stable Chat 模型(待公布),在你自己的云端、本地或设备上进行训练,同时还可以使用 GPT-4,这是两全其美的选择。
因为这样你就不需处理那些医疗数据,而这些数据需要再次归个人所有。因此这些模型需要被归属并且透明化,它们不能是黑匣子,政府不会运行在黑匣子上。
AI 泡沫会比互联网泡沫更大
哈里·斯戴宾斯
我确实想谈谈我们之前的一次很好的对话,你提出了一个很棒的问题,我想准确地回答。你说过 .AI 泡沫比以往任何时候都更大,这将会是最差劲的表演。「有史以来最大的泡沫」是什么意思?
Emad
我的意思是像.com 泡沫(互联网泡沫),我们已经见识过很多泡沫的起源。你知道,数百亿美元投入到 Web 3 中,然后开发者们就已经获得了数百万美元的报酬。某些中国公司为博士开出了 120 万美元的薪水,已经有点疯狂。相对于该行业内的机会数量,资金数量完全不匹配。
就像我的 Tam(总目标市场)分析所示,明年将有 1000 家公司获得 1000 万美元投资,100 多家公司获得 10 亿美元投资,比如 PWC 刚刚宣布他们将在未来三年内投资 10 亿美元,而他们是一家会计师事务所。谁知道这将会发展到何种程度,没有人知道。
因此,在整个市场上不断上升的利率和房地产市场的崩盘背景下,分配给这个唯一增长领域的资金将是巨额的,而且远远超过了这个行业的能力。这会导致什么样的后果呢?你已经看到 GitHub Stars 拿到了 1 亿美元的融资,但没有任何吸引力和商业模式。我们实际上有一个良好的商业模式,因为我设计了它。
哈里·斯戴宾斯
这意味着有些项目会得到资助,但并不总会有结果,这些项目通常是探索性的。
Emad
我认为对这个领域来说是一个好的开端,但是后来可能会变得不利。因为狡猾的人和投机者开始进入这个领域,你会看到一些畸形事物之间的竞争。每个人都试图构建自己的模型,造成各种巨大的经济浪费。
我们现在在需要做的事情上分散注意力,形成一种混乱。因此,我们需要把一些东西标准化,我们需要为这些模型提供更好的数据和其他内容,这就是为什么我们在 Stability 致力的方向。这里不应该再有网络脚本数据,而应该是国家级的、质量好的数据集,用来满足这些自由放养的有机模型,国家级的以及专有模型。
这也是我签署那份报告的原因之一,我认为需要一个六个月的暂停期,让我们在事情完全失控之前把一切都整理好。明年这种情况将无处不在,每个人都在疯狂投资,这简直是一片混乱。
国家级数据集
哈里·斯戴宾斯
你提到了国家级数据集与跨国家数据集的区别,为什么要使用国家级数据集?
Emad
举个例子,有一个团队,其中包括我们的一些员工做了日本 Diffusion,我们采用了 Stable Diffusion,然后改变了语言模型。
在 Stable Diffusion 中我们输入的是「salaryman」(男性白领雇员),在日本这个人是一个非常开心的人,在意大利则是一个非常伤心的人,当地的背景在这些模型中非常重要。
因为我们将越来越多地将我们的思想外包给它,所以你想要一个英国模型还是所有的模型都是 Palo Alto 的模型?就像一瓶起泡酒必须来自香槟地区一样,唯一真正的基础模型 AI 来自 Palo Alto。
哈里·斯戴宾斯
这并不是一件好事,我们需要国家级模型。
Emad
一个国家基础设施,毫无疑问比 5G 更重要,这些模型就像非常有才华的研究生,有时会偏离正轨,你希望有来自牛津、帝国理工和爱丁堡以及斯坦福的模型,因为他们了解当地的背景,所以他们更了解你,对你更有帮助。同样,每个国家都需要他们自己的数据集,这些数据集来自广播数据,他们需要自己的开源模型在国内刺激创新。
哈里·斯戴宾斯
谁拥有国家数据集,由谁治理?
Emad
我认为应该是人民,它应该向公共领域开放。
哈里·斯戴宾斯
这是如何实现的?我们已经创造了一个拥有国家验证数据集的世界,这些数据集可以被独立的私营公司利用。
Emad
这就是我们在正在做的事情。我们与很多跨国伙伴合作,很快将宣布更多消息,并与多个政府合作创造一个良好的数据框架,以满足这些模型促进创新和本地化的需求。
你可以借鉴广义的经验,并再次用于模型,以确定什么样的数据集对于出色的桥接 GPT 来说是好的。我认为这应该是开源的、经过审查的,且被优化的。
VC 会投什么样的 AI 创业公司
哈里·斯戴宾斯
如果你现在是一位投资者,你和我一起,你会怎么做?我是一位早期投资者,我在全球范围内投资。你会怎么做?
Emad
我认为最重要的是要抓住这个 Beta 的东风,然后在此基础上进行 Alpha 的投资。
所谓的 Beta 投资是,你只是在优秀的创始人中投资,找出你能提供的价值,无论是分销、人力资源还是其他方面,强调你的价值观。我认为现在人们需要的是人力资源。
你会看到有很多好的公司,它们有好的想法,但不是好的业务,它们只是建立了表面的东西,比如包装层等等,而没有考虑到分销和数据等方面。如果你想要分销,我们该怎么做?我们去找亚马逊和 Bedrock,因为这样我们就可以得到 10 万个 Sagemaker Smes(小型企业)了。
我们必须给他们模型,他们可以将其用于私人数据,我们从中获得一部分收益。这就是我们的想法,与其负责任,不如为其提供分销,这也是那份谷歌备忘录的一个观点。现在 OpenAI 和微软合作, 微软提供了分销渠道,ChatGPT 运营得很好。
如果你的业务核心是专注于创新,那实际上并不是一个业务。只有当创新变成产品、变成分销时,当它在数据和其他方面具有优势时,它才成为一个商业,这就是真正的模式。
OpenAI 和微软不一样
哈里·斯戴宾斯
你如何分析 OpenAI 和微软之间的合作关系?
Emad
OpenAI 的目标是建立 AGI。他们认为他们需要 100 亿美元来做到这一点,他们也确实做到了。
就像他们在产品和其他东西上一样建立业务,但他们不在乎。他们不是在试图建立一个可持续的业务,他们试图建立的是 AGI。
哈里·斯戴宾斯
为什么要 AGI 来建立一个可持续的企业?
Emad
因为归根结底,他们正在建设把世界变成乌托邦的 AGI。他们认为这可以走向乌托邦。
哈里·斯戴宾斯
但是他们和微软在创造乌托邦的愿望上不一致。
Emad
是的。因为微软是一家企业,所以这就是为什么,微软说 OpenAI 不合规,当目标不一致时,合作就会裂隙。
但是 OpenAI 他们想要做的,是建立一个可以让世界变得更好的 AI,不会杀死我们所有人。他们说这可能会是个问题,令人担忧,这就是为什么我希望他们有更好的开源治理。
五家巨头,谁能笑到最后?
哈里·斯戴宾斯
未来三到五年,谁能赚到最多的钱?
Emad
我不知道,老实说,我觉得未来每个人都能赚到足够的钱,或者,也许几年后钱的概念都不存在了。
哈里·斯戴宾斯
微软、苹果、亚马逊、谷歌,谁会做得最差?
Emad
苹果还是个 black box,对吧。下个月 WWDC,也许他们会让我们所有人大吃一惊。
但我们必须面对现实,Siri 是个垃圾。但他们已经准备好所有的原料。
亚马逊,亚马逊的速度比我想象中要快。他们是一个工程化的组织,他们有卫星互联网,有自动驾驶等等。一旦他们搞明白了(once they've got it),就会非常快地从研究落地到工程。
现在他们的问题是,他们还在研究(AI),所以他们会问,现在我们能做什么?
但他们很包容。贝佐斯说他设想最初千亿美元的收入,一半是专有的,一半是市场带来的。
微软更有胜算,萨提亚(纳德拉)开球开得太好了。我认为他们和 OpenAI 的合作是互利的,即使存在一些小冲突。
Google 稍微有些慢。
Meta,我觉得应该是匹黑马。
扎克伯格应该很生气吧,ai.com 被 OpenAI 买了,不然他就能把 Meta 的名字改成 AI 了。(笑)但有他在,Meta 就能正确的完成转变,因为元宇宙显然是一个彻底的浪费。
哈里·斯戴宾斯
你觉得他清楚这点吗?
Emad
100%,他们 all in 生成式 AI 了,你看看 LLaMa、OPT,FAIR(Facebook 的 AI 研究院)是这个领域的领头羊,他们正在推出令人惊叹的成果。
但谁能把 Chatbot 做得最好?谁有聊天机器人领域最多的数据?
嗯?
Meta。
所以,我们看看他们会怎么推进吧。
哈里·斯戴宾斯
你怎么看中间层?
上市公司们,2 亿美元到 100 亿美元,筹集了大量资金,他们没有接近前面这些巨头的 AI 能力,他们不是核心的 AI 初创企业(像 Stability AI 和 OpenAI 等等)。
Emad
很多人会说,每个人都要训练自己的大模型,对我来说,这就像说每个人都要开大学一样。当你可以通过我们制造的开源模型拥有自己的模型时,或者当你可以从麦肯锡(指 OpenAI)或者贝恩咨询(指 Google)雇用这些模型时,你为什么要训练自己的?
另外,做这样的技术,并没有那么复杂那么可怕。只是我们还有没有设计的模式。
哈里·斯戴宾斯
你认为人们对生成式 AI 最大的误会是什么?
Emad
我觉得是幻觉的问题。在这种程度的压缩下,你希望这些模型能够完全准确是一个错误的想法。事实上,他们能做到现在的水平已经是奇迹了。我们在一对一地使用它们,这是不对的。应该把它们接入合适的系统,这是非常关键的事情。
Stability AI 的商业模式
哈里·斯戴宾斯
你想过分发吗?亚马逊和 Hugging Face 合作,微软和 OpenAI。谈及分发和你的竞争优势时,你从哪里着手?
Emad
我的商业模式实际上非常简单,我之前都没怎么说。
最大开源软件提供商之一已经给我们数千万美元了,然后充分利用我们希望自己建立的开源基础,然后在开源数据中建立一个开源基础,再然后是许可证数据的商业变体,然后是国家变体。
这样就可以在每个云中获得印地语保险人的 Stable Chat 或印度尼西亚制药工人的 Stable Chat,在具有许可费,版税和收入分成的设备上进行本地部署,系统集成商也与我们合作。
许多公告即将发布,通过标准化和稳定化这些非常复杂的构建模块的所有复杂性,这些有意构建的模型通过构建 playbook 和其他核心业务来真正帮助世界整合这些东西.
它不需要实际的创新,相反,它需要分发数据到模型,模型是开源的,可解释的,通过我们的合作伙伴对数据进行建模。这很有价值,因为世界上的私人数据远比你发送给专有模型的数据更有价值。
我们就是这样一家模特(模型)经纪公司,有很多火辣的 GPU,在全球各地分发。
要意识到,印度和其他国家将跃进到智能增强领域,他们将跃进到移动领域。他们将比我们在英国更快地拥抱这项技术。
哈里·斯戴宾斯
为什么?
Emad
因为他们必须这样做。在印度,所有的编程外包工作都会消失,因为 GPT-4 可以通过谷歌程序员 3 级考试。外包工作无疑将被取代。而在法国,你永远不会解雇法国人,这些工作非常安全。
在非洲,儿童和学生的生活将会被 AI 改变。想想它的潜力,投资回报率会很高,需求同样很高。所以非洲和印度会比我们更快地接受它。
ToB 和 toC 的不同
哈里·斯戴宾斯
一种是企业应用,另一种是消费者应用。
假设我们在消费者方面进行应用,这会影响自由职业者的工作和教育,你认为这会是什么样子?
Emad
所以我认为在消费者方面,你可以自由地使用你的信息,所以你可以使用很多这些东西。OpenAI 的插件,谷歌的 PaLM 也已经出现了。
所以它将被集成以提供更好的消费者体验,而不会像你在一些聊天机器人之类中看到的那样令人毛骨悚然。因为它进入了世界,进入了工作区,已经很有帮助了。
就像我们通过手机自动记录对话,然后得到一个记录,删除我们不想分享的部分,进入提醒我们的全球知识库。这是不可避免的事情。对于企业来说,这需要更长的时间,因为你需要有可审计的标准化模型。如果你是一个金融服务机构,你可以拥有单个爬网数据,因为这是我们准备与世界上最大的公司一起构建。
哈里·斯戴宾斯
如果你是一家金融服务公司,你不能使用任何爬取的数据。
Emad
危险就在于其中可能含有一些来自 Reddit 的数据。
我们将在下周发布 Stable 的 LLM,但它并不像其他模型那样好,因为我们想说「Reddit 的数据不是好数据」。
关键并不在于更多数据,而是更好的数据。
我们增加了 Data Comp,这是一个我们资助计算的下一代项目,相比于 OpenAI 的 Clipper,它只使用了四分之一的参数,但在 Beta 数据质量方面表现更好。
哈里·斯戴宾斯
什么能生成好的数据质量?
Emad
这是我们目前正在探索的东西,但从我们与之交谈过的投资银行、资产管理公司,我们正在为世界上最大的投资银行建立他们的专有模型。
我们得到的反馈是,我们不能使用黑匣子。我们需要知道里面有什么数据。
哈里·斯戴宾斯
为什么 Reddit 数据不好?
Emad
Reddit 数据本身并不坏。
这只是一个例子,更多的数据并不总是好的。所以现在我们正在使用所有这些网络抓取,我们通过用胶带把他们的眼睛扒开来训练我们的模型。然后花 6 个月的时间把 GPT-4 变成 ChatGPT 4。
因为我们必须调整它,然后把它带向社会。
哈里·斯戴宾斯
那么被认为最难的是,你如何向模型灌输价值观和政治正确?
Emad
没有不偏不倚的模型。
所以 OpenAI 给 Dall-E 2 增加了偏见过滤器,非性别词,相当随机的性别和随机的种族。你输入相扑运动员,得到的可能是印度女性相扑运动员。
我认为这就是你为什么需要国家数据集,文化数据集,个人数据集,他们可以与这些基本模型交互,并根据你的故事进行定制化处理。我们都有自己的故事,构成我们的心理。当然。要明白拥有为我们工作的 AI 如此重要。
哈里·斯戴宾斯
因此,它本质上就像下一代 cookie,可以个性化我们的数据以实现更好的效果。
Emad
大型 cookie,如果你标准化基础模型,他们称之为超立方体,每个模态,因为我们做了所有的模态,所有的部门和所有的国籍,这样你不需要有一百万个不同的模型。
你有一个基本模型,然后有一个矢量嵌入。因为这些模型包含所有的原理,嵌入指向构成个人的重要部分。然后你可以搜索它们并调整它们,而不是有一百万,十亿个不同的模型,这只会令人困惑困扰。
AI 会怎样颠覆传统媒体
哈里·斯戴宾斯
有媒体出版公司担心他们的盈利模式将会被完全颠覆,这有可能吗?
Emad
我认为他的担心是对的。
就像谷歌昨天的公告,在 PaLM2 发布之后的第二天,你突然看到新的谷歌页面,那里有语言模型,只有文本和点击位置,就像谷歌推出 AMP(移动网页)一样。这些聚合的搜索实体正在越来越多地发挥中介作用,人们将习惯于只有合成输入。
那么搜索是什么样子的呢?当你的 GPT-4 可以为你写一篇以你和你的上下文定制的方式发生的任何新闻的文章时。搜索是什么样子的呢?
诸如此类的一切对媒体和信息来说是巨大的破坏。所以他们必须思考,我在未来的哪里?
我们向媒体工作者施压。我们有一千个这样的人,包括记者,你可以拥有自己的记者大军,作家大军,编码大军,设计师大军。
如果你说这需要事实核查和交叉检查,那是一回事。
但是很多媒体公司说我们是权威优先的来源。
所以媒体公司可以做的,就是在 Deepfake 的时代,确保「我们这里是真正的新闻」,「我们做的方式非常彻底」。
哈里·斯戴宾斯
但问题来了。下一代模型或 AI 提供商都不想成为内容发布者。
那么,你如何适应这样一个世界,在这个世界里,你正在扼杀内容方面的商业模式,但他们不想成为发布者。
Emad
AI 加上人类意味着你有信息进来,然后故事是草稿自动编写,由人类审查,人类给出他们的输入来更好地训练它。
这是一种反馈流。然后它出来了,有一个事实锚,然后它被定制为阿拉巴马州以及其他各种各样的东西,因为你可以告诉它,两位女士没有读过这样的东西,像我 5 岁一样解释它,让它变得更复杂。
所以你会在这里看到一些非常有趣的东西,那就是在正确的时间正确的本地化会。
但同样,首先通过 AI。我认为这是我们看到的 AI 集成的东西。但是下一波浪潮将会是一旦我们首先理解了设计模式,信息流中的一切,这项技术将变得更成熟。
大多数 AI 公司的问题
哈里·斯戴宾斯
老实说,在过去的一年里,我可能见过 50 多家 AI 公司,反馈总是相同的。它们没有可建立壁垒的数据模式,无法在现有模型之上构建一个薄应用层,这是 99% 的反馈。
Emad
以 Harvey 为例,他们去找律师事务所,说你们是分销商,我们将整合和改进你们的系统,并为你们的系统构建我们的系统。我认为很多人都试图去构建,然后他们会到来进入其中,而不只是重新定位,看看你能去哪里进行转型。
哈里·斯戴宾斯
因为哈维做了错误的模型。
Emad
Harvey 没有错,我认为那是正确的模式,我认为很多组织现在都是弹性的和可塑的,所以你可以进入其中,给他们提供一个整合的方案,说你将成为我的测试案例,我将帮助你们作为一个 Skunk Works 实验室进行升级,与你们的系统并行构建一个系统。
哈里·斯戴宾斯
你认为企业会同意吗?
Emad
我现在认为他们会,如果你能把他们的数据保存在内部,而且我再次提到更好的开源模型可以实现这一点,因此人们可以在开源模型上构建。Cohere 和其他平台也有专用实例,因此工具现在正在迎头赶上,你可以有一个新一代的初创公司,他们的第一个客户是那些他们永远无法得到的大公司。我认为这是个问题,因为每个大公司都在寻找答案,如果你能给出那个答案,一个本来需要一年才能得到的合同,你可以在一周内得到。
哈里·斯戴宾斯
你这么认为吗?因为你还得跨过门槛。
Emad
你必须跨过门槛,这就是奋斗,然后,再次就是 Harvey 团队所做的事情,这就是为什么我直接去找超大规模的计算厂商,告诉他们需要为开源、受监管的数据构建标准化模型。
我不是告诉他们我要向你们销售任何东西,我说我在未来一年里我将帮助确保你们不会被盲目击中,我可以试图向你们销售模型,人们愿意以数千万美元购买,但我说我要与你们建立真正的合作关系,这意味着我将从你们那里获得长期价值,什么是真正的合作伙伴关系,是与 IBM、SAP 等公司的合作,我们宣布了与亚马逊的合作,我们还与世界上其他最大的公司有很多其他宣布的合作,他们拥有出色的团队。
但他们的行动速度还不够快,而我正在为他们建立专门的团队,帮助他们前进并理解整个行业,而不是试图向他们兜售服务,我试图说我将为你们建立一个定制模型,如果你们愿意,我只与十几家公司合作,所以我可以把注意力集中起来,我会告诉你 GPT-4 是多么伟大,cohere 是多么伟大,或者所有最新的研究成果与我们支持的社区相关,我将确保你们了解与你们行业相关的最新动态,你们会有专人帮助你们度过这个过渡期。
哈里·斯戴宾斯
这与你的核心模型一致吗?这似乎是一个辅助产品。它就像一个 SAP 咨询服务。
Emad
有点像这样。因为我需要更好地了解这些领域,超大规模计算看起来是什么样子,保险索赔人员的 GPT 又是什么样子。
哈里·斯戴宾斯
人们能够提取这些数据,然后随身携带,并对其进行学习。
Emad
是的。所以这是我们将有一个通用模型的一部分,我们非常清楚。然而,只要它不干扰现有模型,你也可以拥有一个专门为你定制的模型,只要保持平衡就很有趣。但事实是,今天存在的模型在一年后将不再使用。所以,你看到了管理改进的顺序,去年的 PaLM 模型有 5400 亿个参数,然后是 chinchilla 的 670 亿个参数,现在是 14 亿个参数。从 5400 亿到 14 亿是一个很大的进步,你可以看到 GPT 3 和 GPT 4 的质量有多大的差距。
未来的 AI 商业模式
哈里·斯戴宾斯
对于那些进入企业的模式,你认为未来的商业模式是什么?
Emad
我认为未来进入企业的模型的商业模式与以往相同,你需要有优质的产品和良好的分销渠道,就像至今还有 150 万人在使用 AOL 一样。
HCL 几年前以数十亿美元收购了 Lotus Notes,世界上仍有 40% 的人口没有互联网。我也关注新兴市场,我认为金融、证券化和杠杆以及证券化正在讲述一个故事,对于一只股票来说,唯一重要的是边际故事以及它的演变方式。如果你拥有关于非洲每个孩子和印度每个企业的大量信息,并且他们正确地接受这项技术,那么将会有巨大的金融增长。
哈里·斯戴宾斯
你认为他们为什么会在明年接受这一点?
Emad
我认为人们仍在逐渐适应这一切,我们还没有标准化任何事物,我们不知道设计模式是什么。我认为发生的情况是每个人都在同时进行这项工作,他们都在努力掌握它。所以我们有这个六个月的窗口期,每个人都在努力适应,然后我们标准化我们的设计模式,你会发现一些人比其他人进展更快,这意味着你不得不赶上,然后你被迫去实施。这就是我现在看到的竞争动态。
哈里·斯戴宾斯
前几天我在推特上说,我认为最大的 AI 公司将是大型企业的基于服务的实施公司。
Emad
百分之百是这样。所以我说如果你是一家初创公司,最好的做法是找到一个将通过这一技术转型的企业,然后去找他们,告诉他们我有一个解决方案,我将从你开始,也许会扩大规模,但我会通过这个、这个和这个来帮助你度过这个时期,他们会感激这一点,而且以前你从未见过这样的资金可用性,
因为你知道小公司要向大公司销售有多难,但大公司除了他们的首席执行官和董事会告诉他们之外,他们一无所知。你看每个季度的财报电话会议,每个季度他们都会询问有关我们的战略是什么。在几个季度内,这种紧迫程度会提升。
如果你处在那个位置,你会筹集资金吗?所以你去找一家企业,告诉他们,你知道吗,我可以解决你的问题,这就是它的工作方式,他们会资助你,给你数据,你会筹集资金吗?是的,我的意思是,你需要人才,人才是关键,因为你可以有技术、行业的理解,但要构建一个良好的企业,并以所需的速度扩大规模跟上这一步伐,非常困难。
哈里·斯戴宾斯
我们有足够的人才吗?
Emad
不够。这就是为什么我们支持更快 AI 课程,将普通开发人员转变为机器学习开发人员的原因。
AI 写代码的未来
哈里·斯戴宾斯
但是,实际上,这些模型并不难处理,GitHub 上 50% 的代码是 AI 生成的,所以你甚至可以使用 Copilot 来帮助你编写模型等等。你认为 5 年后代码生成是什么?
Emad
为什么还需要代码?代码只是与计算机交流的一种方式。我 21、22 年前开始编程时,那时还是写汇编语言、汇编代码,非常低级的东西,没有库、没有 GitHub,没有像现在这样的东西。现在编程就像是拼装乐高积木,而 AI 可以更好地拼装这些积木,特别是在五年后。
当你编写编程语言时,你是在告诉它去做一些事情,即使是像 PaLM 这样的东西,我们赞助了一个叫 Lucid Reigns 的神奇代码,如果你想哭的话,你可以去看看他的 GitHub,他是世界上最有生产力的开发者。他用 206 行馅饼火炬重现了整个 PaLM。但如果 AI 在编程方面变得越来越好,为什么还需要人类呢?只需告诉它你想要什么,它当然会自动构建它。在这个过程中,人类编程人员在哪里?
哈里·斯戴宾斯
这对未来的企业家意味着什么?实际上,从完全民主化的角度来看,这是一件好事。
Emad
任何人都可以在任何东西上进行构建,任何人都可以构建任何东西。这就是为什么分发、数据、关系和产品变得重要,因为构建任何东西变得更容易了。但是,什么是一个好产品?这些不变的东西是:客户满意度高,提供价值,人们不要被技术所分散注意力。比如,我参加了一个关于加密货币和 AI 的活动,他们在谈论去中心化,我对他们说这些都是废话,关键不是技术,而是你创造的对帮助人们有价值的东西,专注于这个。
初创企业 vs 传统企业
哈里·斯戴宾斯
你认为谁会在未来三到五年获胜?初创企业是现有企业,因为现任者拥有分配权。
Emad
我认为是现有企业,因为现有企业具有分发渠道。但也有很多初创企业会成为价值数十亿美元的企业,甚至在这个薄层上也是如此。例如,ITA 软件以 7 亿美元的价格出售,而 kayak 以 20 亿美元的价格被收购,而 kayak 只是 ITA 软件之上的一层。我们已经看到了很多这样的例子,所以我们知道价值和护城河不一定取决于创新。
哈里·斯戴宾斯
是的,有些是有创新的,有些则不是。有趣的是,我在节目中邀请了 Tom Tinkers,他是一位非常有名的机器学习和 AI 投资者,他对基础设施层和应用层进行了分析,两者的市场规模都在两万亿美元左右,不同之处在于基础设施层只有三家公司,而应用层有 50 家公司。因此,平均企业价值在应用层要容易得多。
Emad
我同意这个观点,我认为在未来的三到五年里,全球只会有五六家基础模型公司。
哈里·斯戴宾斯
你认为它们现在都被创造出来了吗?是的。哪个。
Emad 我认为可能是我们、NVIDIA、谷歌、微软、OpenAI 和 Meta 还有苹果。谷歌有多少钱?他们拥有 1500 亿美元,他们拥有足够的资金来赢得这场竞争。
哈里·斯戴宾斯
你需要多少钱?
Emad
我的商业模式将很快变得非常赚钱,因为我们提供的国家级服务以及其他一些因素。我还没有透露所有细节,但我会在接下来的几个月里逐步公布。我有一个关于几所大学的精彩案例研究,我希望它是一个惊喜。
哈里·斯戴宾斯
对你们来说,留住人才和团队是非常困难的。
Emad
但我们的开发人员一直没有离职,他们非常出色。我们有视频模型、音频模型等等,所有这些东西都来了。
哈里·斯戴宾斯
每个人都说你需要去硅谷,但你在伦敦,你不同意吗?
Emad
当然不需要。我将把这项技术带给全世界,我将把它带给所有的工程院和大学,那些最优秀的人将加入我们的团队。我会将这项技术带给全球所有的国家广播公司和最大的家族办公室,我会拥有全球范围内的数据资源。
各国将建立超级计算机,而我将在其上构建开源模型。我将拥有更多的超级计算资源、人才和数据,比其他任何公司都要多,并且我会全部开源。
哈里·斯戴宾斯
我之前听你谈论过一个我觉得很有意思的话题,就是你可以接触到超级计算资源,你将其与现有的大型企业进行了比较。为什么你拥有比其他人更多的超级计算资源?
Emad
因为我亲自去做了。我们有文章报道我们的烧钱情况,但我就像拥有石油井一样,当每个人都想要建造石油化工厂时,每天都有公司来找我们要求使用我们的超级计算资源,因为市场上没有这种资源。你需要拥有配备互连的芯片,我们现在有 7 个 A100,我们有 TPU,我们有所有这些设备,并且我们知道如何使用它们。
并且我们可以与他人共享,因为我们是开放的,而 Anthropic 和其他公司则无法这样做。所以这就像最坏的情况下,我会成立一个基础模型作为服务的公司,今年的利润将达到 1 亿美元,而且不需要收取市场价格,他们可以退休了,但我想要做的是把这项技术带给全世界。
所以我认为计算机被误解了,它不像 Bird 和这些电动滑板车公司和其他公司那样在市场上花钱做营销,它实际上是一项资产,而且目前是稀缺的。顶级芯片制造商正在为我们建立专门团队,他们会支持我们,因为我们的模型推动了对他们芯片的需求,模型越开放,需求就越开放。这也是一个良性循环。所以我们比每个人都先获得计算资源。
AI 对经济的影响
哈里·斯戴宾斯
你如何看待我们刚刚讨论的一切对通胀、利率上升和短期就业率的影响?
Emad
它具有极大的通缩效应。
美国消费价格指数通胀的最大推动因素是教育和医疗保健,而几乎全部是行政官僚主义的结果。
在接下来的几年里,猜猜看什么会受到颠覆?是教育和医疗保健。但它们不会在今年或明年受到颠覆,因为这些需要更长的时间。
现在的学校会过时吗?
哈里·斯戴宾斯
现在把学生送去学校还有意义吗?
Emad
我觉得学校的本质会发生巨大的变化,现在还是值得的。我会鼓励学校拥抱这项技术,并期待它能继续发展。
你可以像伊顿公学一样手写论文,或者你也可以拥抱技术,用 AI 来创造,探索孩子们想要的东西,假设每个孩子在几年后都会拥有自己的 AI。这会完全改变教育的本质。
AI 陪伴对社会的影响
哈里·斯戴宾斯
我同意每个人都会有 AI 的朋友。但我不知道它们是会存在于现有的社交网络上,还是一个独立的平台?
Emad
我不确定。这取决于目标和功能。我认为 AI 会变得更好,Meta 并不是一个好平台。
我会希望有个照顾我的 AI,让我能更好地掌控自己。我已经开始让 GPT-4 担任我的理疗师了(不是说他可以替代任何医疗建议),但这世界上没有足够的理疗师,我可以让它挑战我,我可以让它共情理解,它不会给任何判断,因为人有时候还挺可怕的,这与你是不是一个合格的理疗师无关。
所以人会越来越多地和这些东西(AI)建立联系,因为它的互动非常人性化,因为它们的训练数据是人类知识的总和,随着我们获得越来越好的数据,互动也会越来越好。
我觉得这是双向的。比如说,推销产品的 Chatbots 会非常有说服力,但我觉得你自己也会有一个对付它的 Chatbot。
哈里·斯戴宾斯
我完全同意。我觉得你会有很多 AI(助手/伙伴),掌握你不同的资料。
Emad
一群不同的朋友。就像 Character AI 的用户平均每天花两小时和 AI 互动,因为人们觉得这样做有价值。
但它也有阴暗面,有一个事,我称之为「情人节大屠杀」。
哈里·斯戴宾斯
听起来很吓人。
Emad
有个 App 叫 Replika(副本),它本来是一个心理健康的聊天机器人,直到有一天阀门发现,用户愿意花一年 300 美元来买一个角色扮演的性爱聊天机器人。
哈里·斯戴宾斯
Wow.
Emad
直到 2 月 14 日,他们关闭了。哈哈哈哈哈。
哈里·斯戴宾斯
他们把性爱角色扮演聊天机器人关了?发生了什么?
Emad
68000 人冲进 Reddit,说:为什么你要给我女朋友进行脑叶切除手术?在情人节那天。哈哈哈哈哈。
哈里·斯戴宾斯
Oh my word.
Emad
你敢想象吗?
哈里·斯戴宾斯
所以他们(Replika)恢复了吗?
Emad
没有,那违反了苹果的政策。但你想想,如果再加上像人类一样逼真的 AI 声音,然后你戴个耳机,就像 Phoenix(电影 Her 男主)那样,我对象是个 OS。她甚至不会 judge 你对吧?
哈里·斯戴宾斯
(笑)你已经结婚了,你说话最好小心点。
Emad
说到提示工程。我老婆已经尝试 prompt 我 17 年了。Prompting 非常难。
我认为人们会跟技术有更深入的互动,我不知道这会产生什么社会影响。
比如说华邮有过一个数据表,2008 年美国 30 岁以下童贞比 8%,2018 年是 27%。(笑)一条直线就上去了你知道吗?(笑)2008 年有两件事:Pornhub 和 iPhone。
所以你看,如果每个人都有个自己的 Chatbot,都不一定是要那种(sexual)Chatbot,它会给情感关系造成什么影响?
哈里·斯戴宾斯
那太可怕了。那真的是我们想要生活的世界吗?我真的不喜欢失去和那些有趣人们的亲密的物理关系。
Emad
我认为这取决于我们自己。
就像新冠时期,我们是否真的想建立一个头号玩家那样的技术世界?我们可以那么做,用技术诱捕人们。但我们也可以用技术鼓励人们走出去。
我认为人们喜欢分享,人们喜欢社交,所以在人与人之间建立连接,强调物理的东西,对比把人们锁在什么地方。
哈里·斯戴宾斯
我有一次跟一个 AI 创业公司的朋友聊天,她问我,你养狗吗?我说养,她说你喜欢它吗?我说当然,她说那你不会想每天跟你的狗一起待在家里对吧,你想带它出去走走,散步,去现实世界里。AI 的陪伴也是这样。
快问快答
哈里·斯戴宾斯
哪个地区的监管需要做出改变?为什么?
Emad
欧洲,因为他们将会监管到欧洲以外的所有创新,而不是接受这项技术来推动他们前进。
哈里·斯戴宾斯
AI 要好到什么程度,人类才能信任它?
Emad
不论 AI 怎样人类都会信任它。
无论如何,人类都会信任它。他们信任谷歌地图,信任所有这些东西。所以现在就够了。
它不需要好到可以被使用,它被使用时,人们就会信任它。
哈里·斯戴宾斯
(Huh.)
你学到的最痛苦的一课是什么,你很高兴学到了,但这真的很痛苦。
Emad
在一个不断扩大的组织中,人才是最重要的。你必须确保每个人的认知同步(on the same page)。封闭给内部造成了很多痛苦。
哈里·斯戴宾斯
为什么做 CEO?
Emad
我非常多面手。所以我倾向于介入(step in)而不是专注。
因为我是那种全栈 CEO,我应该注重最重要的事,并更多地信任他人。
哈里·斯戴宾斯
你认为这是你一生的事业吗?
Emad
这是我必须做的事,直到有最优秀的团队帮我执行,它就成了一个 business。因为我们从研究转向了工程。当 Emad 不再被需要的时候,我觉得我应该打造了一个不错的 business。
哈里·斯戴宾斯
10 年后,Emad 在哪里?
Emad
我想打游戏。我的塞尔达明天就到了。我希望(未来)能做这件事,也希望能给(游戏)增加一些价值。
关注 Founder Park,我们将持续推出更全面更深度的大模型相关讨论与报道。
Founder Park 正在搭建大模型相关话题的交流社群,群内聚集着致力于在大模型相关领域创业的创业者、产品经理、研发工程师、对大模型技术和场景应用开发进展感兴趣的学者及投资人。
在这里,你肯定可以获得大模型相关领域的最新动态资讯、或许可以进行高质量的行业对话交流,还可能连接更多有价值的行业认知。
如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。
Founder Park 正在招募新的 AGI 观察者