英伟达掀起AI“革命”，黄仁勋谈AI的趋势、挑战与机遇

Vincent AI前线 2019-04-07

编辑｜Vincent

「我们不再是一个半导体公司，而是一个 AI Computing Company。」——2016 年，英伟达主办的 GTC China 大会上，英伟达创始人兼 CEO 黄仁勋如是说。

一年过去了，时间来到 2017 年，又是一年 GTC 大会。

去年的大会上，老黄为全世界带来了专为深度学习设计的推理加速器 Tesla P4 和 Tesla P40，以及专为自动驾驶和汽车人工智能开发的低功耗计算机 Drive PX2 for Auto Cruise ，GPU 计算正在成为一个大市场，不再局限于只是研究者使用，人工智能、VR、游戏、自动驾驶，这几大热门领域让 GPU 计算应用的领域和数量呈现爆炸式增长。

今年的大会，老黄会为我们带来什么样的惊喜呢？InfoQ 记者在 GTC China 2017 的现场，为你带来最快最全面的分享！

更多精彩文章请添加微信“AI 前线”（ID：ai-front）

黄仁勋依旧身着一件黑色皮夹克，皮夹克似乎已经是老黄的标志。掌声之后，黄仁勋登台，开始了名为《AI 的趋势、挑战与机遇》的演讲。

AI 已无处不在，两股力量正推动计算领域的未来。

黄仁勋在演讲中表示：

摩尔定律已终结，设计人员无法再创造出可以实现更高指令级并行性的 CPU 架构
深度学习正在引领软件和计算领域的变革。深度学习、大数据和 GPU 计算的结合则引爆了 AI 革命
NVIDIA 的 GPU 弥补了 CPU 的不足，加速处理高强度计算负载，为整个行业指明了前进的道路

他也在演讲中提到，摩尔定律已经是昨天的定律，是一种缓慢的定律，我们现在处于超级摩尔定律时代。

接着，他展示了绕着英伟达 GPU 而展开的 AI 生态系统，中国知名的科技企业诸如：百度、阿里巴巴、腾讯都已经在云服务当中部署 GPU，而国内知名的存储硬件厂商：华为、浪潮也都在使用英伟达的服务器。

另外，黄仁勋还介绍了英伟达推出的 NVIDIA.AI，适用于全球的开发人员，英伟达希望能够打造一个功能强大且高效的计算平台。英伟达将会全力推进“统一架构” CUDA GPU 计算。通过 Inception 计划，支持 1900 家初创企业。

TensorRT 3 推理引擎

接下来，黄仁勋发布了本届大会最重量级的产品：TensorRT3 推理引擎（TensorRT 3 Inference Engine）。

TensorRT 3 是一款针对人工智能应用生产部署的高性能优化编译器和运行时引擎，用于在生产环境中部署深度学习程序。它支持所有框架，且能够快速优化、验证并部署经过训练的神经网络，从而在超大型数据中心、嵌入式 GPU 或车用 GPU 平台上开展推理工作。

黄仁勋表示：“互联网公司正在加快脚步将人工智能注入被数十亿用户所采用的服务之中。因此，AI 推理工作量也呈指数级增长。NVIDIA TensorRT 是全球首款可编程推理加速器。借助 CUDA 的可编程性，TensorRT 将能够加速助推深度神经网络日益多样化、复杂的增长趋势。通过 TensorRT 的大幅度加速，服务提供商能够以经济实惠的成本部署这些计算密集型人工智能工作负载。“

已经有超过 1,200 家来自各行各业的公司开始采用 NVIDIA 推理平台，借助此从数据中获得全新洞察，并为企业和消费者部署智能服务。亚马逊、微软、Facebook 和谷歌、以及阿里巴巴、百度、科大讯飞、京东、腾讯等中国领先企业均已开始采用 NVIDIA 推理平台。

TensorRT 3 能够确保高度精确的 INT8 和 FP16 网络执行，每年能为数据中心运营商节省数以百万美元计的采购和用电成本。借助它，开发者只需短短一天就能完成神经网络的训练，打造一个比其训练框架快 3 至 5 倍的可部署推理解决方案。

之后，黄仁勋展示了两张图，一张是，4 个机架，160CPU，65KW；另一张是，1 个机架就行了，节省 50 万美元。这也是让老黄十分兴奋的一点：Save money！

AI 推理在数据中心的应用，最主要的作用是降低成本，V100 相较 CPU 加速了 40 倍。

“你买越多的 GPU，你节省的钱就越多。”——黄仁勋

省钱的 High 点过后，下面的展示内容又让老黄兴奋了起来。为了展示 TensroRT 3 的实力，他让工作人员现场演示了 CPU 与 TensroRT 3 同时进行基于 TensorFlow 的花朵识别模型，得到的结果如下图所示：

上图是 CPU 的例子

上图是 TensorRT 3 的示例。

区别一目了然，黄仁勋十分自信，因为 TensorRT 3 更快更强。

随后黄仁勋带来的是更多的用例展示，譬如在美剧《权力的游戏》播放过程中，通过语音输入一段对白，搜索系统会将这段对白转换为文字，然后直接跳转到有该段对白的片段。令人十分惊喜的一点是，在演示当中，几乎没有任何延迟，可见 TensorRT 3 的性能十分强劲。

演示之后，黄仁勋说道，目前中国的百度、腾讯、阿里巴巴、京东、科大讯飞，都已经采用了英伟达的推理平台。同时，英伟达联手海康威视，在智慧城市和智能安防领域准备一展拳脚。

自动驾驶

当然，大会上绝对少不了的内容就是英伟达在自动驾驶领域的发展状况。

黄仁勋表示，目前英伟达的自动驾驶计算平台已经可以支持 L3~L5 级的自动驾驶级别，开放的软件栈包含了深度学习、计算机视觉 SDK 等等内容。可以方便汽车制造商训练汽车 AI。同时，NVIDIA DRIVE 开放平台已经在支持 145 家自动驾驶初创公司研发自己的自动驾驶业务。其中包括两家中国的自动驾驶公司：景驰科技和图森未来。这两家自动驾驶领域的初创公司也都受到了英伟达的投资。

Xavier

2015 年，英伟达在 CES 上推出了用于自动驾驶开发的 Drive PX，2016 年，在 GTC Europe 大会上，Drive PX 家族中最高阶的计算机——Xavier 首次被公开，它的创新之处在于，整合了 CPU、GPU 以及 DLA（深度学习加速器）三大处理器的优点。

今年 5 月，在美国举行的 GTC 大会上，英伟达 CEO 黄仁勋宣布，为加速深度学习技术的普及和进步，将开源 Xavier DLA 供所有开发者使用、修改。初期版本将在 7 月开放，完整版本将于 9 月公开。

在今天的大会上，黄仁勋发布了全球首款自主机器处理器 Xavier，正式推出将在 2018 年第四季度。Xavier 实时运行并行算法，推理周围世界，最后进行规划。这是世界上最复杂的 SoC——将超级计算机变为一张芯片。

同时，黄仁勋宣布：京东 X 已经与英伟达合作，使用 Xavier 芯片，实现自主机器，未来京东的无人机、无人车等设备上都将搭载 Xavier 芯片。

与这款芯片同时发布的还有一个名为 Isaac Lab 的系统，用于模拟真实环境训练机器人，大会现场工作人员演示了如何使用该系统进行高尔夫和曲棍球的机器人训练。

总结

让我们回到文章开头的那句话：

「我们不再是一个半导体公司，而是一个 AI Computing Company。」

就在去年，黄仁勋在 GTC China 2016 上说出这句话。一年后的今天，英伟达带着无数 AI 相关的科技成果，印证了这句话：Tesla V100 、可编程推理平台 TensorRT 3，自动驾驶平台、自助机器超级 Soc Xviare、虚拟机器人训练环境 Isaac Lab。

不论是英伟达一直引以为傲的 GPU，还是近年来连续不断的在 AR/VR、无人机、机器人、图像识别、人脸识别、医疗成像和天气预测等多个领域的发展，我们有理由相信：黄仁勋让英伟达成为世界一流的 AI 公司的决心是十分坚定的，而英伟达要靠自己的实力开拓属于自己的 AI 生态系统也是有着无限的可能。

反向激励，在加速这个社会的黑化

平安信托深陷“爆雷”旋涡：终于尝到“偏爱”房地产的苦果

刀片电池存设计缺陷，或将导致几十万比亚迪车主自费更换or召回？

专家一会说要过“紧日子”，一会说“认为没坏就能用”是不对的

芒果TV十年：源自如日中天时的“诺亚方舟”计划