老黄对话Databricks CEO:生成式AI将无处不在,如果你的行业没有涉及AI,或面临淘汰风险
近日,英伟达 的 CEO 黄仁勋在 Data + AI 大会上发表了演讲。主持人介绍了黄仁勋,并提到 Nvidia 目前市值已达到三万亿美元。黄仁勋与主持人讨论了 Nvidia 的发展、数据智能的重要性以及如何利用数据训练定制化的 AI 模型。他强调了企业数据是企业的金矿,并详细说明了 Nvidia 如何利用数据优化产品设计、供应链管理等方面。
在回答关于 AI 可持续性的问题时,黄仁勋指出,可以将 AI 数据中心设置在能源充足的地方,并强调生成式 AI 在减少能耗方面的潜力。他还提到了生成式 AI 在不同领域的应用,包括客户服务、物理 AI、生物 AI 等。
最后,黄仁勋鼓励企业积极参与 AI 的发展,不要等待观察,而是通过实践学习,抓住 AI 快速发展的机会。
对话文字版整理
Ali Ghodsi: 我非常高兴能介绍我们的下一位嘉宾,他其实是一位无需过多介绍的人物。现在,让我们欢迎世界上独一无二的"摇滚明星"CEO,英伟达的黄仁勋先生来到舞台上。
[音乐]
[掌声]
Ali Ghodsi: 非常感谢,太棒了,谢谢你能来。
黄仁勋: 谢谢。
Ali Ghodsi: 我想先谈一谈英伟达令人惊叹的业绩,知道,3万亿美元市值,这是你五年前就预想到世界会这样发展的吗?
黄仁勋: 当然,从一开始就是。看到这一切太棒了。
Ali Ghodsi: 对一位CEO同行,你有什么建议吗?我们该如何达到那样的高度?
黄仁勋: 无论你做什么,都不要去做GPU,好吗?
Ali Ghodsi: 好的,让我告诉团队我们需要撤出了。太棒了。今天上午我们花了很多时间讨论数据智能。我们的意思是,企业拥有所有这些专有数据,根据他们拥有的数据训练定制的AI模型。这有多重要?这是你看到的吗?这是我们需要投入更多的东西吗?你听到了什么?
黄仁勋: 每个公司的业务数据都是他们的金矿,每个公司都坐拥金矿。如果你有一个服务或产品的良性循环,客户喜欢这些服务和产品并给你反馈,你已经收集数据很长一段时间了,可能与客户相关,可能与市场相关,也可能与供应链相关。我们所有人都拥有收集了很长时间的数据循环,我们坐拥大量数据。但事实是,直到现在,我们中没有人真正能够从中提取见解,或者更重要的是,从中提炼出智慧。
我知道我们现在很兴奋,没错。我们在芯片设计中使用它,在我们的缺陷数据库中使用它,在创造新产品和服务时使用它,在我们的供应链中使用它。你知道,这是我们首次拥有一个业务,一个工程流程,它从数据处理、提炼开始,然后学习模型,部署模型,并连接起这个循环,收集更多数据。
Ali Ghodsi: 哇,是这样没错,对吧。
黄仁勋: 我们在公司中就是这么做的,这使我们有可能成为世界上最大的小公司之一。当然,原因是我们公司有如此多的AI在帮助我们,做着令人惊叹的事情。我认为每个公司都是如此,所以我觉得这是一个非同寻常的时代,一切都始于数据,始于Databricks。
Ali Ghodsi: 太棒了,非常感谢。我很好奇,你知道现在有一场关于封闭模型与开源模型的大辩论,开源能够赶上吗?两者都会并存吗,最终会不会被一个巨大的封闭源模型所主导?你是怎么看的,对整个开源生态系统你是怎么想的,它对LLM的发展有多重要,未来又会有多重要?
黄仁勋: 我们需要前沿模型,我们需要了不起的前沿模型。当然,OpenAI正在做的工作,谷歌正在做的工作,真的非常重要,它们在推动前沿,帮助我们发现什么是可能的。但如果你看看今年,今年最重要的事件可能都与开源有关,Llama 2,现在是Llama 3,MRAW,还有你们Databricks做的工作,DBRX,我是不是得说DBRX?
Ali Ghodsi: 对,DBRX。
黄仁勋: DBRX,我觉得DBRX真的很酷。之所以这么酷,是因为它激活了每一家企业公司,它让每个公司都有可能成为一家AI公司,不是吗?
Ali Ghodsi: 你自己也看到了。
黄仁勋: 我们看到这种情况无处不在。最近我们把Llama 3变成了一个完全容器化的推理微服务,现在可以下载了,你可以去Hugging Face,当然也可以去Databricks。现在它正在被全球几百家公司集成,这告诉你开源是如何激活每一家公司成为AI公司的。我们在公司里到处都在使用开源模型,我们也创建了一些专有模型,我们微调开源模型,用我们的数据和技能训练它们。所以我认为没有开源,就不会激活这整个全球运动,让每个公司都成为AI公司。我觉得这是一件了不起的大事。
Ali Ghodsi: 这太棒了。所以开放和封闭的模型都会存在,我们两者都需要,对吧?你说的是NIM框架吗?NIM,你是怎么做调查的?
黄仁勋: 是的,我们叫它们NIM。
Ali Ghodsi: 我们超级兴奋,你知道吗,我很高兴在这里宣布,我们将把DBRX放入NIM中,我们将在Databricks上提供服务,实际上我们未来开发的任何新模型都会这样。我们对此感到非常兴奋。
黄仁勋: 这实际上是一件了不起的事情。为了创建这些端点,这些API,这些大语言模型API,技术栈真的很复杂。你知道,这些模型很巨大,尽管现在看起来不大,但它们在计算上仍然非常庞大,计算栈非常复杂。创建一个这样的端点需要数百个依赖项。所以,我们创建了一个叫做英伟达推理微服务的东西,我们把所有的依赖项打包,我们对所有这些进行了优化。公司有一个工厂,里面有所有这些专家工程师在工作,我们把它打包成一个微服务,你可以在Databricks上享受它,你可以下载它并随身携带。
你可以用我们称为Nemo的微服务对它进行微调,并在任何你喜欢的地方使用它。它可以在每一个云上运行,可以在本地运行,你可以在任何地方享受它,这是一件了不起的事情。
Ali Ghodsi: 这太棒了,你甚至可以在本地运行它,我的意思是,你不必非得在云上,这真是太棒了。好的,当我们与客户交谈时,我们听到他们必须在内部开发这种专业知识,以定制模型,获得优势。你对此有什么看法?
黄仁勋: 我认为未来,看看现在世界上正在发生的事情,我们找到了一种方法,可以将几乎任何信息,几乎任何数据标记化,我们可以提取结构,理解并学习其表示,理解几乎任何类型信息的含义。当然可以是声音、语音、文字、语言、图像、视频,可以是化学品和蛋白质,甚至可以是机器人关节和操作,可以是方向盘关节驱动,我们几乎可以将任何东西标记化。正因为这些云数据中心实际上是在生产令牌,我们正在制造一些非常独特的东西。你第一次拥有了这个叫做AI超级计算机的工具,我们正在构建它,它在生产令牌,本质上是在一个专为这一工作而设计的工厂里生成令牌。
我们有能力大规模地制造智能,这是相当新的,这也是我现在几乎可以肯定,随着我们在各地为所有这些不同的行业建造这些AI工厂,我们正处于一场新的工业革命之初。我们不是在发电,而是在制造智能,我认为这将改变一切。
我们正在制造智能,每个公司当然都以特定领域的智能为基础。地球上很少有公司比Databricks更了解数据、数据处理、AI以及做这一切所需的基础设施。我们在工作中非常专业,我们的基础是关于特定领域的智能。每个公司都是如此,可能是金融服务,可能是医疗保健等等。
所以说到底,我们每个人都将成为智能制造商。如果你今天要成为智能制造商,你就有了人力资源,未来你将拥有AI人力资源,我们称之为AI工厂。每个公司都必须这样做,我们正在这样做,你正在这样做,我们看到大大小小的公司都在这样做。所以在未来,我们所有人都会这样做。当然,你从特定领域的数据开始,它就存放在Databricks的某个地方。你将处理这些数据,提炼并从中提取智能,你将把它变成一个飞轮,你将拥有一个AI工厂,我们所有人都会拥有。
Ali Ghodsi: 我完全相信这一点。我们感到兴奋的一件事是,你知道,我们做大量的数据处理,数据处理量巨大,我想我们每天处理大约4艾字节,你知道,每天在Databricks中处理4000兆兆字节。这是当今地球上最大的计算需求,处理数据,对吧?每个公司都在做。
黄仁勋: 没错。
Ali Ghodsi: 你知道,它实际上是高度可并行的,我们一次又一次地重复同样的操作。所以我真的非常兴奋能与你合作,真正将这种GPU加速带到数据处理中,这样我们就可以在核心数据处理上实现AI模型所经历的同样的革命。我们非常高兴能与你合作,在我们的Photon引擎中使用GPU加速,真正进入将GPU应用于核心数据处理的新时代。现在这些大规模工作流必须在CPU上运行,我们也把它们放在英伟达GPU上运行,对此我们非常兴奋。
黄仁勋: 是的,这是一个重大宣布。当今计算领域最重要的两大趋势是加速计算和生成式AI。英伟达和Databricks将合作,结合我们在这些领域的技能,将它带给你们所有人。
[掌声]
正如你所知,加速数据处理的工作是高度可并行的,但它真的很神秘,非常复杂。原因在于数据格式实在太多,有太多不同的分组和连接方式,数据争论(wrangling)是一套非常复杂的库,Spark是一个超级复杂的库套件。我们花了5年时间日以继夜地工作,终于有了一套现在可以加速Photon的库。这是一件了不起的大事,我们为此工作了很长时间,很多年了。现在我们要加速Photon,让你们所有人都能以更快的速度、更低的成本处理数据,非常重要的是,消耗更少的能源。
Ali Ghodsi: :非常有意义,这是一个巨大的进步。这很有道理,因为虽然它非常复杂,有很多边缘情况,但它是高度可并行的。你知道,它仍然是专门的,你并不真的需要通用计算,对吧?我们想要做的就是一次又一次地对艾字节级的数据做同样的事情,并不是我们在处理完全独特的艾字节级数据。所以我对此非常兴奋,我认为它真的有能力带来革命,真正带来更快的性能,降低成本,这将是令人惊叹的。
黄仁勋: 看看当我们能够如此快速地处理大量数据时会发生什么。这让研究人员有一天醒来就说,猜猜看,让我们把互联网上所有的数据都拿来,训练一个巨型模型吧,因为这不会花太长时间。如果没有加速,没有加速计算,没有人会想到要这样做,那将是极其昂贵的,需要太多时间。但现在,这已经是一件很普通的事情了。
所以你知道,我们将能够以更低的成本、更高的效率处理艾字节级的数据,从时间角度来看,想象一下你会有多少想法。就像,嘿,我们把公司所有的数据都拿来,训练我们的超级AI,你会去做的。那一天终将到来。
Ali Ghodsi: 我的意思是,这曾经是一个科幻的想法,把整个互联网,没人认为你能做到。我们需要硬件达到那个水平,基础设施到位,这样我们就可以专门化,现在你知道,每个人都在做。
黄仁勋: 所以我想换个话题,天哪,我太爱我自己了,开玩笑的,开玩笑的。
Ali Ghodsi: 我们也爱你。所以,我想换个话题。你知道,这场生成式AI的繁荣令人惊叹。但在早期,大多数企业都是从聊天机器人开始的,让我们建立自己的聊天机器人,根据我们的数据定制它,等等。但现在我们看到人们正在向更多更复杂的用例拓展。在未来,你最兴奋的AI新应用是什么?
黄仁勋: 对于在座的所有企业来说,影响最大的可能是客户服务。客户服务可能代表着数万亿美元的开支,每个公司都有,每个行业都有,每个公司都有。聊天机器人,客户服务的重要性,部分在于你可以实现自动化,但更主要的是数据飞轮。你想捕捉对话,捕捉数据飞轮中的参与度,这将创造更多的数据。
我们现在可能看到数据每5年扩张10倍,但我不会惊讶地看到,由于客户服务,数据每5年增长100倍。我们将把一切都连接到一个飞轮中,收集更多的数据,捕捉更多的洞察力,从中提取更好的智能,提供更好的服务。它甚至可能更具预测性,更具主动性,在问题出现之前,你就主动接触客户,告诉他们,这个东西即将到期,或者我们注意到你还在使用这个版本,等等,你主动接触客户,主动解决问题。就像预防性维护一样,我们将有主动的客户支持。
这将创造更多的数据,我们将推动这个飞轮。所以我认为,客户服务可能是对大多数公司最有影响力的超级强大能力,因为它收集的数据。但我们已经将一切标记化了。令我兴奋的是,我们正在生成化学品,生成蛋白质,碳捕获材料,碳捕获酶,还有正在设计的令人难以置信的电池。我们正在生成物理,物理AI。
最近,我们让区域天气预测的精度达到几公里。以前,要想预测到公里级,超级计算机需要增加大约1万倍的能力,而现在我们正在使用生成式AI来做到这一点。因此,物流将得到增强,保险将得到增强,当然,让人们远离危险也会得到加强。
物理事物,生物事物,当然,用于3D图形的生成式AI,数字孪生,为视频游戏创建虚拟世界,生成式AI无处不在。如果你的行业没有涉及生成式AI,那只是因为你没有关注,它无处不在。
Ali Ghodsi: 是的,我完全相信。我们将看到,没有任何领域不会看到这种应用,这很有意义,太令人兴奋了。这些新的前沿领域令人兴奋,对数据和AI有巨大的需求。你有什么想法,我们如何帮助企业开发更可持续的AI?
黄仁勋: 可持续性有很多不同的视角。可持续性之一与能源有关。记住,AI不在乎它上过什么学校。我们不需要把AI训练数据中心放在人口稠密、电网已经面临挑战的地方,我们可以把它放在没有挑战的地方。世界上有更多的能源,只是分布在错误的地方。我认为,我们第一次可以去捕获那些过剩的能源,将其压入AI模型,然后把这些AI模型带回我们可以使用的社会。这是一个主要想法。
另一个是,我记得AI不是关于训练,而是关于推理,关于AI的生成能力。你训练模型是为了使用它。当你考虑AI的长期效益时,我刚才给你举了一个例子,使用AI而不是超级计算机来预测天气。我们基本上了解天气预测所涉及的物理定律,我们不需要每次都从第一原理模拟它,我们要用AI生成它。通过使用AI生成它,我们不仅减少了所需的时间,提高了我们可以生成的分辨率,而且还将能量减少了数千倍,不是百分之几,而是数千倍。通过这样做,我们在设计你在手机中使用的芯片时也在做同样的事情。我们设计更高效的系统,消耗更少的能源。我们设计使用更少晶体管、更少硅、更少能源的AI。
因此,我认为AI从根本上让世界变得更加可持续。一个具体的例子是碳捕获。我们必须进行碳捕获,这毫无疑问。碳捕获需要大量的能源。但如果我们可以使用AI找到更好的碳捕获酶,找到更好的碳捕获材料,它可以吸收更多的碳,那么这些材料和这个过程将变得更加可持续。
所以我认为,从各个方面来看,无论是减少能源消耗,还是提高可持续性,AI都将发挥重要作用。我认为这是一个新的研究领域,我们将找到更多的方法,利用AI来减少我们的碳足迹,增加可持续发展。
最后再谈一下生成式AI。从计算机科学的角度来看,今天的AI之所以如此重要,是因为今天的计算体验在很大程度上是基于检索的。我们触摸手机,即使我们认为使用手机消耗的能量很少,但每次触摸它,它都会发送请求,激活世界各地的REST API,检索信息,点亮互联网,从所有这些不同的数据中心为你带回一点信息,根据推荐系统组合呈现给你。
而在未来,它将更加具有情境性,更加生成式,在设备上直接运行一个模型,一个小型语言模型,互联网流量将大大减少,并且会有更多的生成,配以一些检索来增强。计算的平衡将大大转向即时生成。这将节省大量能源,而且非常明智。
原因在于,想象一下,Ali问我的每一个问题,我都要跑回办公室,拿一些文件,带回来呈现给他,让他决定要从中提取哪些信息。相反,我现在正在用大约25瓦的功率生成所有内容。我们节省的能源将是巨大的,计算模型将彻底转变。
这种计算方式将节省大量能源。当然,我们将更有效地获得答案,而不是费力地梳理资料。但随后我们会有更多的问题,实际上这才是未来的大概念。与AI合作的大概念是提示。我们将有更多有趣的问题,因为我们将很快得到许多答案。所以这是一件非常了不起的事情,是令人兴奋的未来。
Ali Ghodsi: 好的,我最后一个问题,我们如何帮助这里的客户,帮助各组织从今天开始?最好的方式是什么?
黄仁勋: 你知道,我之前告诉过你,我认为Databricks的转折点,从数据处理扩展到数据治理和存储,然后纵向延伸到从数据中提取智能,我觉得这完全是天才之举。我忘了她的名字,但我认为饼干女士做得非常出色。
Ali Ghodsi: Casey。
黄仁勋: 对,Casey,别把她偷走了。
[掌声]
拜托,我觉得她做得太棒了。我们在后台,大家都想聊天,但我只想看她做演示。我觉得这个平台太不可思议了。你让人们可以轻松管理数据,提取信息,处理数据,争论数据。你知道,争论数据仍然是训练模型的一个重要部分。人们谈论训练模型,但在训练模型之前,你必须弄清楚什么数据,这关乎数据质量、数据格式、数据准备。所以我认为,你开始的方式就是来到Databricks,使用Databricks数据智能平台,对吧?
[掌声]
黄仁勋: 谁不会把自己的平台叫做DIP呢?这个名字太好了。你知道,DIP,Databricks DIP,听起来不错,我喜欢。它几乎和NIMs一样好。
Ali Ghodsi: 好吧,你可以把两者结合起来,对吧?你不必选择,去找个NIM和DIP吧。
黄仁勋: 我同意,为什么不呢?这就是做事的方式。你可以沾沾,我绝对会开始。无论你做什么,都要开始。无论你做什么,你都必须参与进来。你必须搭上这趟快速前进的列车。记住,生成式AI正在指数级增长。你不想等着观察一个指数级趋势,因为几年后你就会远远落后,这是难以置信的。只管上车,享受列车越来越快的过程,指数级地学习。你知道,这是那种你不能通过观察来学习的东西,你不想通过阅读来学习,你只能通过做来学习。这就是我们正在做的方式。所以,投入进来吧。
Ali Ghodsi: Ghodsi:这是很棒的建议,Jensen。这是令人惊叹的十年,感谢你所做的一切。我们一直是很棒的合作伙伴,期待着我们接下来的十年,一起迎接Databricks。
往期回顾
1、[在摩根大通中国峰会上,阿里巴巴主席蔡崇信强调:AI技术已达大学生水平,为我们带来前所未有的机遇]
2、[管理必修课:AI浪潮中英伟达市值再创奇迹,CEO黄仁勋视频分享AI时代管理者应具备的核心领导力]
3、[李飞飞领衔Stanford HAI发布全新500页2024人工智能报告,显示超过30%的工作岗位或被AI取代]
我们的AI团队现向外界开放服务,旨在助力每个企业与个人引领时代潮流,将先进科技与创新想法完美融合!
告别昂贵服务费和缺人烦恼,再见漫长交付周期
无限创意风格,分分钟生成专业级作品
感受 AI 带来的全新工作体验!
欢迎各大品牌方、媒体、科技企业、知名IP等合作
合作请联系负责人微信:Milo-1101
--END--