人工智能迎重大革新:英伟达30亿美元打造的新“核弹”来了!
“我是创作者……我是保护者……我是治愈者……”
伴随着一段几句科幻感的宣传片,一个机械女声宣告了自己的身份,“I AM AI”(我是人工智能)。欢迎刚落,身穿皮衣的黄仁勋登上了舞台,台下的开发者、研究员、创业者们,掌声雷动。
在这个 T恤和套头衫为主的科技世界里,黄仁勋绝对是个另类:和大多数极客型创始人不同,工程师出身又负责过市场的他更像一个摇滚明星,皮衣是他的标志性穿着,再加上极富煽动性的演讲能力,他是一个身上有着刺青的“叛逆” CEO。也只有这样的人,才能让自己在1993年成立的“老牌”公司,以及从事的并不性感的芯片产业,一次有一次站在聚光灯前沿。而现在,他又率先把下个世代的科技命脉——人工智能,握在了手里。
这位因为过去英伟达显卡发热实在太感人而被粉丝戏称为“核弹教父”称号的创始人,如今已经凭借 GPU处理器和数据中心,成为了当下人工智能时代的“基础设施”,自己也摇身变成了真正的“AI 教父”。
在英伟达主办的GTC大会上,这位 AI 教父像是摇滚明星一样,再一次面向现场的数千名观众,扔下了“核弹头”,把这个行业炸开了锅。
在这场大会上,谁都会忘记英伟达其实一家“游戏显卡”公司,来自游戏图形处理单元业务的营收占到了公司营收一半以上。但事实上,在整个长达2个小时的演讲里,只有在中间放出了《最终幻想》的一小个片段时,提到了游戏,其他时候,黄仁勋都在说两个词:AI 和 深度学习。
为什么深度学习和存在许久的 GPU 扯上了关系?就像黄仁勋说的, “人工智能带来了人类历史上最大的科技进步。”深度学习是一个人工智能开创性的方向,让计算机可以自己学习,这就极大地要求了处理性能的提升。事实上,由于GPU适用于并行计算(用上千个非常小的处理器组合在一起来共同解决问题),它可以用于非常密集的训练,非常符合深度学习网络的计算特征。所以,大部分的深度学习网络都是在 GPU 上运行。
这也让英伟达的股价在过去一年的时间里狂涨了300%!直接成为了标普里表现最好的一支股票之一,也让英伟达的营收连续暴涨,净利在上个季度翻番,在很多大公司都在疯狂砸钱投入人工智能的时候,赚了个盆满钵满。而英伟达也很有继续领跑的趋势,根据它公布的数据,现在英伟达已经参与了超过4万家公司和50万名开发者对神经网络应用的研究。
不过尽管 GPU 被证明非常适合并行处理,但是也有不少研究表明,最终业界还是会需要专门为 AI 设计的架构。早就看到这一点的黄仁勋怎么可能让英伟达光躺着数钱呢?尽管别家都还没能跟上,但他就已经带着英伟达率先往这个方向走了。
30亿美元打造的新“核弹”
在今天的演讲里,黄仁勋宣布推出了 Volta —— 一个可以说是现在地表最强的 GPU 架构,专门为人工智能和高性能计算打造,重新又掀起了一场(对手只有它自己)的性能大战。
尽管仍然被称为 GPU,但是 Volta 远不止于此。除了加强了 GPU 架构以外,英伟达还增加了640个新的张量内核,与标准GPU CUDA核心配合使用,为深度学习环境添加额外的处理能力。黄仁勋说,英伟达超过7000名工程师花费了超过3年的时间,才打造出了 Volta,来满足深度学习的需求,让工业界有机会去实现人工智能的颠覆性的潜力。
Volta 到底有多强?可以用数字来说话:作为英伟达第7代 GPU 架构,它是集成了210亿晶体管,具有 5120 个 CUDA 处理内核,可以和100台 GPU 在进行深度学习处理上的性能相抗衡;相比起前一代的Pascal ,它有了5倍的性能提升,而比起两年前才推出的Maxwell 架构,性能提升了15倍!
这个性能表现比起摩尔定律能预测的,直接翻了4倍。(事实上,在这个方面,英伟达永远都是在和自己较劲)。
开发者,数据分析师和研究员们都越来越依赖于神经网络来驱动他们所有的工作,比如自动驾驶,环境保护,农业生产甚至是癌症攻克都是如此。而由于网络变得越来越复杂,数据中心也需要提供更大的处理能力,他们需要高效地扩张,来支持基于人工智能服务的应用,比如自然语言处理的虚拟助手,个性化搜索和推荐系统等。
Volta 可以说意味着深度学习引擎的一个转折,从 原来的 GPU 或者说通用的处理器引擎,到一个接近专门的人工智能引擎。所以,而当黄仁勋掏出一个小小的处理器时,全场都激动起来:这样一个其实和 Apple Watch 大小差不多的芯片,就是第一个采用了Volta 架构的Tesla V100。黄仁勋甚至开玩笑说,他们在Volta 的研发上砸了30亿美元,这作为Volta架构的第一代产品,现在世界上还仅此一台的Tesla V100,价值就超过了30亿美元。
Tesla V100是基于Volta架构的产品,内置了5120个CUDA单元,核心频率为1455MHz,搭载16GB HBM2显存,单精度浮点性能15 TFLOPS,双精度浮点7.5 TFLOPS,显存带宽900GB/s。
此外,Tesla V100还增加与深度学习高度相关的Tensor单元,Tensor性能号称可以达到120 TFLOPS。如此“堆料”让Tesla V100拥有超过210亿个晶体管,核心面积达到了创纪录的815平方毫米,采用的是台积电12nmFFN工艺制造(其实是16nm深度改良)。
作为对比,上代旗舰Tesla P100不过只有3584个CUDA核心,拥有153亿个晶体管,核心面积610平方毫米(16nm FET+工艺)。同时,Tesla V100的二级缓存及寄存器大小也有所增加,L2缓存由Tesla P100的4096KB增加到了6144KB,每组SM单元的寄存器文件大小总数从14336KB增加到了20480KB。
英伟达表示,Tesla V100将首先用在用于深度学习超算DGX-1上,内部拥有8张Tesla V100计算卡,峰值计算性能高达960 TFLOPS,号称用8个小时就能完成TITAN X八天的工作量。黄仁勋宣称它可以代替 400 台服务器,还开发了深度学习专属 SDK,与Caffe2、TensorFlow等所有主要的 AI 框架合作。
价格方面,DGX-1的售价为14.9万美元,约合人民币102万元。
ISAAC机器人模拟器
除了 Volt,在机器学习方面,英伟达也是成果显著,比如此次公布的ISAAC机器人模拟器,则能模拟现实对智能机器进行训练,让研究人员可以在真正部署前轻松进行调试和迭代。
强化学习/增强学习(Reinforcement Learning)是机器学习的一个重要分支。AlphaGo用的就是增强学习。 需要建立一个世界模拟器(World Simulator),模拟真实世界的逻辑、原理、物理定律等,然后再将机器放进这个世界里不断训练。
英伟达的ISAAC机器人训练模拟世界就是一个类似的世界模拟器。在这个虚拟世界里,万事万物都遵循物理法则——比如物体运动、万有引力——但是不遵循时间法则。
在现实生活中,你想要训练一台机器学会打冰球,你要将这个冰球放在机器前面,一遍一遍地教会它,成千上万次的训练都耗费大量的时间。然而在虚拟世界里,机器可以在一秒内重复众多次这样的动作,不需要遵循现实世界中的时间法则。
而且你还可以同时训练一堆机器学习打球,然后找到里面最聪明的一个,将它的“大脑”程序复制出来,创建一堆同样的机器再继续训练筛选,听起来很像养蛊对不对……
而最可怕的是这个世界里不需要遵循时间定律,人类需要通过几百几千万年的进化才能够学会使用工具,而一个机器人只需要几个月甚至几天的训练时间就能学会打冰球,谁知道它们未来能学会什么……
深耕自动驾驶
在自动驾驶方面,英伟达此次还宣布与丰田展开合作,丰田将采用英伟达的能实现每秒 30 万亿次深度学习计算DRIVE PX 人工智能汽车计算平台。
此外,英伟达还与奥迪和奔驰建立了合作关系,该公司还是无人驾驶赛车比赛的重要技术合作伙伴。英伟达与丰田的合作成为科技公司、汽车厂商、零部件供应商在这一领域建立的最新联盟。
英伟达Drive PX超级计算机通过摄像头、雷达等硬件收集数据,然后使用人工智能技术帮助企业理解周围的环境,并做出反应。
“我们不仅在谈开发,还在谈如何将汽车推向市场。”英伟达汽车业务高级总监丹尼·夏皮罗(Danny Shapiro)说,“日本最大的汽车厂商现在也在使用我们的Drive PX平台。”
今年1月,英伟达和奥迪宣布将使用Drive PX帮助后者的无人驾驶汽车在2020年上路行驶。英伟达还与奔驰在今年1月共同宣布,双方将在未来12个月将一个项目引入市场。
丰田在无人驾驶领域采取双轨制度。该公司不仅在开发全自动驾驶汽车,同时也在设计所谓的“守护天使”半自动驾驶技术。
多人交互平台Holodeck
另外值得一提的是,黄仁勋还发布了一款VR多人交互平台Holodeck。
在视频DEMO中,几名英伟达同事一起在虚拟世界里,观看一台实时渲染的Hypercar(可以理解成超级跑车中的超级跑车),不光整台车的外壳与内部装饰的细节都清晰可见,而且这辆车的所有部件都被渲染出来了,透过车前盖,可以清晰看到引擎部件。
此外,这个虚拟世界是遵循物理定律的,当你伸手抓住方向盘时候,手指不会穿过方向盘。两人之间或者三、四个人之间也可以做牵手等的动作交互。根据老黄介绍,这款Holodeck最早在今年9月就会开放,具备三大特点:照片级真实的模型、遵循真实物理法则、适宜交流合作。
多人VR也是2017年里被大家看好的一大方向,英伟达并没有将Holodeck作为一款产品推出,而是将其开放SDK给大众使用,进一步推进多人VR的发展。从DEMO中我们可以看到,这款Holodeck非常适用于多位设计师一起观看并修正同一产品。
小结:
新的GPU(Tesla V100)、新产品(DGX-1)、新技术(Holodeck等、DRIVE PX平台)、黑科技(ISAAC机器人训练电脑)等等……今年老黄的演讲可谓是干货满满、诚意满满了。
难怪从黄仁勋的演讲开始,英伟达的股价就一直在涨,演讲结束后,英伟达的股价就涨到了16%,最后更是17.83%的涨幅收盘,市值涨到了720亿美元。
在5年内,GTC 参会者增长了3倍,今年达到 7000 人,开发者数量增长了 11 倍。其中包括50家世界最大的公司、10家世界最大汽车厂商、80家AI创企,25家VR创企等等,然而这还仅仅是开始。就像黄仁勋在演讲里霸气总结的,“我们每年在 GTC 上演讲,就是因为我们需要找到摩尔定律之后的路。GPU 计算的崛起在驱动人工智能的革命。我们来到这里,是因为只有这样,人工智能才能得以实现。”
编辑:芯智讯-林子 综合自:pingwest、智东西
合作伙伴不给力?联发科十核处理器Helio X20库存积压严重
行业交流、合作请加微信:xintiyan001
投稿请发至:yj@padnews.cn
芯智讯官方交流群:221807116