COMPUTEX2023 | NVIDIA CEO 黄仁勋发布面向各行各业的生成式 AI 平台
黄仁勋在 COMPUTEX 主题演讲上展示了多个新系统,软件及服务,以充分利用这个时代最具变革性的技术 —— 生成式 AI。其中,多数产品由 Grace Hopper 超级芯片提供支持。
COMPUTEX—2023 年 5 月 29 日—NVIDIA 创始人兼首席执行官黄仁勋在本次主题演讲中发布了多个平台。通过这些平台,企业可以把握住这一历史性的生成式 AI 浪潮,以革新广告、制造、电信等行业。
在近两个小时的演讲中,他介绍了加速计算服务、软件和系统,它们正在推动实现新业务模式和提高当前业务模式效率。
黄仁勋表示,“加速计算和 AI 标志着计算的革新”。
为了展示它的力量,他展示了一个文本提示,为他的主题演讲生成一首主题曲,可以像任何卡拉 OK 曲调一样演唱。
“我们现在正处于一个全新计算时代的转折点,加速计算和 AI 已经被世界上几乎所有的计算和云公司所采用,” 他表示,如今有 40,000 家大公司和 15,000 家初创公司使用 NVIDIA 技术,仅去年一年,CUDA 软件的下载量就达到 2,500 万次。
重磅发布亮点回顾
Grace Hopper 支持用于运行生成式 AI 的大内存超级计算机。
模块化参考架构推动实现 100 多种加速服务器配置。
WPP 和 NVIDIA 在 Omniverse 中创建数字广告内容引擎。
网络技术加速基于以太网的 AI 云。
NVIDIA ACE 游戏开发版通过生成式 AI 令游戏角色栩栩如生。
世界各地的电子制造商采用 NVIDIA AI。
新的企业 AI 引擎
黄仁勋发布了能够为企业提供超强 AI 性能的 DGX GH200 大内存 AI 超级计算机。通过 NVIDIA NVLink,这台超级计算机将多达 256 块 NVIDIA GH200 Grace Hopper 超级芯片整合到一个数据中心大小的 GPU 中。
黄仁勋宣布,GH200 超级芯片现已全面投产,它将节能的 NVIDIA Grace CPU 与高性能的 NVIDIA H100 Tensor Core GPU 整合到一个超级芯片中。
DGX GH200 提供 1 exaflop 性能与 144 TB 共享内存,比单个 NVIDIA DGX A100 320GB 系统高出近 500 倍。这让开发者可以构建用于生成式 AI 聊天机器人的大型语言模型、用于推荐系统的复杂算法,以及用于欺诈检测和数据分析的图形神经网络。
谷歌云、Meta 和微软是首批有望接入 DGX GH200 的企业,它们将探索这台超级计算机在生成式 AI 工作负载方面的能力。
NVIDIA DGX GH200 AI 超级计算机为生成式 AI 工作负载提供 1 exaflop 性能
黄仁勋表示:“DGX GH200 AI 超级计算机集成了 NVIDIA 最先进的加速计算和网络技术来拓展 AI 的前沿领域。”
NVIDIA 正在建造自己的大规模 AI 超级计算机 NVIDIA Helios。这台超级计算机将于今年上线,它将使用四个与 NVIDIA Quantum-2 InfiniBand 网络相连的 DGX GH200 系统,可提供训练大型 AI 模型所需要的数据吞吐量。
在本次大会上发布的数百个使用 NVIDIA 系统中,DGX GH200 最为瞩目。这些系统将共同为数百万用户带来生成式 AI 和加速计算。
黄仁勋宣布,将有超过 400 种采用 NVIDIA 最新版本 Hopper,Grace,Ada Lovelace 和 BlueField 架构的系统上市。这些系统将被用于解决 AI,数据科学和高性能计算领域的复杂挑战。
各种规模的加速
为了满足各种规模数据中心的需求,黄仁勋发布了一个用于创建加速服务器的模块化参考架构 NVIDIA MGX。系统制造商将使用该架构快速、经济地构建 100 多种不同的服务器配置,满足各种 AI、HPC 和 NVIDIA Omniverse 应用的需求。
凭借 MGX,制造商能够使用通用架构和模块化组件构建 CPU 和加速服务器。MGX 支持 NVIDIA 全部 GPU、CPU、DPU 和网络适配器系列,以及各种风冷、液冷机箱的 X86 和 Arm 处理器。众多制造商宣布将使用 MGX 创造新一代加速计算机。
Grace Hopper 推动 5G / 6G 发展
黄仁勋表示,NVIDIA 正在助力塑造未来 5G、6G 无线和视频通信。演讲中展示了通过 Grace Hopper 上运行的 AI ,将当今的 2D 视频通话转变为更逼真的 3D 体验 ,转换后的临场感令人惊叹。
黄仁勋宣布, NVIDIA 正在与电信巨头软银合作,在日本建立分布式数据中心网络,为提供新型服务奠定基础。它将在通用云平台上提供 5G 服务和生成式 AI 应用程序。
这些数据中心将使用模块化 MGX 系统中的 NVIDIA GH200 超级芯片和 NVIDIA BlueField-3 DPU 以及 NVIDIA Spectrum 以太网交换机提供 5G 协议所需的高精度计时。该平台将通过提高频谱效率来降低成本和能耗。
这些系统将帮助软银探索 5G 和 6G 在自动驾驶、AI 工厂、增强和虚拟现实、计算机视觉以及数字孪生方面的应用,未来甚至可能被用于 3D 视频会议、全息通信等。
加速云网络
此外,黄仁勋发布了专门用于提高以太网 AI 云性能和效率的网络平台 NVIDIA Spectrum-X。该平台将 Spectrum-4 以太网交换机与 BlueField-3 DPU 和软件相结合,相较于传统的以太网结构,AI 性能和电源效率提高了 1.7 倍。
NVIDIA Spectrum-X 可加速在传统以太网网络上可能会出现性能损失的 AI 工作流程
令游戏角色栩栩如生
生成式 AI 也影响着人们玩游戏的方式。
黄仁勋发布了 NVIDIA Avatar Cloud Engine(ACE)游戏开发版。开发者可以使用这项代工服务构建和部署定制化的语音、对话和动画AI模型。该引擎将赋予非玩家角色(NPC)对话技能,使他们能够以进化出的逼真个性回答问题。
NVIDIA ACE 游戏开发版包含 NVIDIA Riva 等 AI 基础模型,可检测并转录玩家的语音。NVIDIA NeMo 可根据文本提示生成定制化的回答并通过 NVIDIA Omniverse Audio2Face 实现动画化。
NVIDIA ACE 游戏开发版提供了一整套使令角色栩栩如生的生成式 AI 工具
加速 Windows 上的生成式 AI
黄仁勋介绍了 NVIDIA 和微软如何在生成式 AI 时代一同推动 Windows PC 的创新。
使用全新的和经过强化的工具、框架和驱动程序,PC开发者可以更加轻松地开发和部署 AI。例如用于优化和部署 GPU 加速 AI 模型的 Microsoft Olive 工具链,以及新的图形驱动程序,将大幅提升配备 NVIDIA GPU 的 Windows PC 上的 DirectML 性能。
这项合作将加强 1 亿台配备 RTX GPU 的 PC 性能,并继续扩大设备数量。这些 GPU 中的 Tensor Core 可大幅提升 400 多个 AI 加速 Windows 应用和游戏的性能。
推动全球最大行业实现数字化
生成式 AI 为价值 7,000 亿美元的数字广告行业带来新的机遇。
例如,全球最大的营销服务机构 WPP 正与 NVIDIA 一起在 Omniverse Cloud 上构建首个生成式 AI 内容引擎。
黄仁勋在一段演示中展示了创作团队将如何连接他们的 3D 设计工具(如 Adobe Substance 3D)并在 NVIDIA Omniverse 中构建客户产品的数字孪生。然后,他们可以凭借在来源可信的数据上训练并使用 NVIDIA Picasso 构建的生成式 AI 工具所提供的内容,快速制作出虚拟场景。WPP 客户可以使用制作完毕的场景生成大量广告、视频和 3D 体验,供全球市场和用户在任何网络设备上使用。
工厂铸就 AI 的未来
据估计,价值 46 万亿美元的制造业有 1,000 万家工厂,它们是工业数字化的重点领域。
黄仁勋表示:“全球最大的工业制造的都是实物。如果能够先以数字方式制造这些产品,就可以节省数十亿美元。”
此次主题演讲展示了多家电子制造商如何利用 NVIDIA 技术打造数字化流程,实现全数字化智能工厂的愿景。
这些企业通过 Omniverse 和生成式 AI 的 API 接口,以连接他们的设计和制造工具,从而构建工厂数字孪生。他们还使用 NVIDIA Isaac Sim 模拟和测试机器人,并使用视觉 AI 框架 NVIDIA Metropolis 实现光学检测的自动化。
最新组件 NVIDIA Metropolis for Factories 可以创建定制化的质控系统,为制造商带来竞争优势。该组件正在帮助企业开发先进的 AI 应用。
使用 AI 加速装配线
例如,在全球生产笔记本电脑、智能手机等 300 种产品的和硕,正在使用 Omniverse、Isaac Sim 和 Metropolis 创建虚拟工厂。该公司能够在虚拟工厂中的模拟环境测试各种流程,为其节省了时间和成本。
和硕还使用 NVIDIA DeepStream 软件开发套件开发智能视频应用,将吞吐量提高了 10 倍。
富士康工业互联网是这家全球超大技术制造商的服务部门,该部门携手 NVIDIA Metropolis 合作伙伴,一起实现其电路板质控检查点重要环节的自动化。
黄仁勋在一段视频中展示了广达的子公司 Techman Robot 如何使用 NVIDIA Isaac Sim 优化其生产线上的检测。实际上,这是在使用模拟机器人,来训练机器人制造出更好的机器人。
此外,黄仁勋还发布了一个新平台,以支持下一代自主移动机器人 (AMR) 车队。Isaac AMR 可以帮助模拟、部署和管理自主移动机器人车队。