其他

世界超算大会归来,浪潮刘军说底色全是AI

2017-07-24 专注报道AI 量子位
李根 发自 凹非寺 
量子位报道 | 公众号 QbitAI

这是又一个“春江水暖鸭先知”的印证。

因为人工智能在全球范围内的持续火热,刘军和他的工作正在受到越来越广泛的关注。作为浪潮人工智能和高性能服务器产品部总经理,刘军是那批最先知道AI计算力需求和产品化升级的人。

实际上,“AI Frist”早已通过业务部门更名体现。在今年4月,刘军所领导的团队,正式从浪潮集团高性能产品部,改名为人工智能和高性能服务器产品部。按照浪潮内部的判断来:超算和人工智能的融合,已是毋庸置疑的趋势。

不过,即便已经有过这样的心理准备,在置身前不久2017国际超级计算大会的现场时,刘军还是被法兰克福展现的一切引得心胸激荡、感慨万千。

在表述这种现场印象时,他说这次一次AI为底色的前所未见的超算大会——即便去年人工智能专家吴恩达现场分享,超算和AI,也从未有过如此强烈且明确的融合。

除此之外,在分享2017国际超级计算大会法拉克福现场观感之余,刘军还向量子位讲诉了业内正在发生的一些潜在不同,比如首次跌出超算前三的美国,可能正在用另外的方式看超算、AI和云。

“云计算”也是法兰克福的又一重要风向标。刘军告诉量子位,今年AWS和百度云都在现场布置了展台——从记录来看,这是历史性的举动。

当然,连续多年参与世界超算大会,并见证了中国军团在超算竞技领域的8连冠,刘军也以一个连续亲历者的身份,向我们分享了更多世界超算大会见闻感受,以及这些表象背后硬件技术趋势的看法。

 人工智能和高性能服务器产品部总经理刘军

以下为量子位与刘军对话实录(经量子位编辑整理):

AI成超算世界大会底色 超算和AI融合加速

量子位:这次在法兰克福现场,印象最深刻的是什么?

刘军:感受最深的莫过于AI,毫不夸张地说:AI是这次超算世界大会的底色,超算和AI的融合也在加速。

量子位:议程上看,这次专门设立了AI Day,以前发生过类似的主题日吗?

刘军:是的,这次专门设立了一个AI Day。这也是我第一次听说为一个主题专门设置主题日进行展示和讨论,也是显示了大家对这事情非常重视。

实际上,这也是对超算正在发生的趋势的体现,比如在行业排名靠前的超算机器中,看到了绝大多数以GPU为代表的机器,其中日本研发的Cubumi,实际使用了GPU的Klast,构建了这样一个Klast。所以他把他命名为日本的 AI computer,就是日本的AI超级计算机。

这也是高性能计算和AI融合的一个表现。之前中间有很长一段时间,GPU在HPC上的日子并不好过,大家都要去很辛苦地改代码,而且被采纳的热情也不高。但现在AI又把GPU重新带回来了,而且日本人还专门以此为切入点,做了一个AI超级计算机,这可以看做AI+HPC的融合。除了Cubumi,日本人还自己立了一个项,说要做一个130P的AI超算。

量子位:这属于个例?还是现场可以感知到的行业共识?

刘军:我觉得日本可能走得稍微极端一点,但其他国家的团队都有这个共识。

像IBM也是这样的,IBM现在在推Power AI解决方案,实际上也用在IBM给美国国防部做的Summit机器,这个Summit机器如果今年下半年出来,峰值性能可能会超过250P,有可能超过我们的神威-太湖之光。

而Power处理器解决方案,使用的就是英伟达Link GPU来作为计算节点。所以它这个设计原本是给大规模HPC系统设计的,但现在也同样变成了适用于AI计算的超算,这在方向上跟日本人的是一致的。

今年浪潮也带去了类似的产品,我们在GTC发布的AGX2,再搭配英伟达的Link×100,就能同时兼顾AI计算性能和传统科学工程计算需求。好多客户对这个产品感兴趣,我们也在讨论这个解决方案,因为他们希望我们在给解决方案的同时,能够覆盖到传统HPC和AI计算的需求,这就要求我们不仅要在硬件上,还要在软件支撑、管理系统、应用的模式上,都把这种融合趋势结合起来。

量子位:所以这次2017国际超级计算大会的副主题其实就是AI?

刘军:对,这次感受非常深刻的就是到处在讲AI,整个AI和HPC融合的趋势越来越明显。比如IBM的展台,基本都在讲IBM的AI和Deep Learning的一些解决方案,告诉客户自己可以帮助他们如何去实现AI应用。

另外,Cray这样的厂商,原本做大规模科学工程计算的厂商,但今年也在讲HPC上面怎么跟数据分析,能够结合使用提供一个AI计算的平台。

最后,大会现场很多workshop、报告,也都在做AI在神经网络、深度学习和HPC结合方面的探讨。

量子位:这是从未有过的情况?

刘军:之前没有如此大规模的、整体底色为某一种技术趋势的大会。即便是在2016年,吴恩达到了现场做主题报告,也有一些AI领域的大咖过来,也没有今年如此火热,去年更像是开胃菜,今年每个展商都在展示自己的AI方面的产品,从产品来看也是前所未有的大爆发。

所以我整体感受是,这是关键性的一年,可能会让一些更大的事情发生,现在大家都在做这方面的准备,以及很深入很慎重的思考。

美国超算排名掉出前三引思考

量子位:这次世界超算比赛中国完成了8连冠,意外吗?

刘军:这次对结果不意外,一切很顺理成章。现在基本上从国内ASC到全世界较量的ISC,作为背后支持方和推动方,我们认为已经逐步建立起了信心。无论从中国比赛水平的挑战性,到相关队伍的能力,我认为现在我们都达到了全球顶尖,所以从ASC开始,无论是ISC还是SC,都会表现稳定、出色。

此外还有个幕后的小细节,这次中国参赛的两支队伍,一支清华、一支北航,他们在4月刚刚结束了ASC的比赛,实际中间用来准备ISC的只有一个多月的时间,其中还有准备机器、办理签证等各种各样的事情,最后还能以如此出色的成绩夺冠,可以试想背后的实力。

量子位:不过谈到实力,这次公布的全球超算TOP500中,美国第一次掉出了前三。

刘军:对,这是AI话题之外令人印象最深刻的地方,让人感到意外,也在现场引发了讨论,大家认为可能跟美国对超算的未来思考有关。

这次排名,第一名(中国神威-太湖之光)没变、第二名(中国天河二号)也没变,但第三名被瑞士超算中心的机器拿到了,美国的泰塔变成了第四名。

令人意外的主要是这几年来泰塔没太多实质动作,距离泰塔上一次夺冠已经5年了,期间它接连被中国赶超,现在被瑞士赶超,所以会让人更关注美国对于超算是不是有一些新思考。

当然,现在美国对超算也不能说没有部署,毕竟现在有Summit、Cliae和Orbloli,这都是性能在200P左右的机器。

但就在ISC2017会议开始前的周五,DOE发布了一个计划,称2.58亿美元支持六家公司做exascale研发,然后每家公司再一比一匹配研发经费,这背后可能让大家比较关注的是exascale研发涉及的新架构。

在新架构和一些应用需求方面,包括Deep Learning等AI的技术会不会对美国的下一代E级超算机器的设计、技术路线产生影响,就会变得格外引人关注。

我个人认为,美国人现在来思考这个问题,可能也是觉得如果继续按原来的技术路线走,那无外乎堆一个大机器出来,路线可能越走越窄,所以开始在有意识收缩一些漫无目的的资金投入,这方面可以明显感受到,依靠美国DOE生存的Cary公司,现在状况在变得困难,整个盈利能力都在下降。

所以美国这次全球超算排名跌出前三,可能背后的场面变化比台前表现更令人关注。其中涉及到不少对未来的思考,牵扯到新的体系结构,涉及AI和HPC的融合会对下一代超算产生的影响等。

这一点上,日本人比美国人干得更激进,已经一马当先了。他们直接号称自己做的超算机器是最绿色的AI超级计算机,不过日本在核心工作上感觉积累有限,下功夫的还是“绿色”之类的旁系,不像中美在核心硬机器上发力。

不过即便如此,这些涉及“AI”的动作,还是会让从业者产生很多思考,比如美国现在很多实验室,也在推出传统大型操作上面支持Deep Learning之类的,这就会带动更多人去想:下一代一级超算,是不是也要支持AI?怎么支持?怎么去做这些工作?

AI大背景或加速超算与云融合

量子位:这次听说百度和亚马逊等互联网公司也都去布展了?

刘军:对,这算是第三个令我印象深刻的见闻,就是HPC和云的融合,这次百度和亚马逊都是“云计算”方面的布展,而Cray也开始谈提供HPC One Cloud的服务,这算得上不小的改变,因为Cray之前大部分业务都是给客户做大定制和大机器,现在则转身说提供云服务。

你当然可以理解为面临经营挑战不得不作出的改变,但也要看到这可能是客户市场提出的需求——越来越客户正在思考,自己的业务什么时候开始上云、如何结合。

原来HPC和云结合,可能主要是基因这块,之前美国有30%-40%的深入基因研究的客户,在使用AWS做这样一些工作。

所以现在随着AI跟云结合的速度加快,也在带动HPC跟云结合的速度加快。之前是一些小客户做一些小训练,会直接在云端用AI服务,方便又快速,于是在进一步把新业务往云端迁移的时候,或许就会对再在线下建大规模HPC系统产生新思考:还有必要建这么大的机器吗?如果能都往云上去的话,是不是需要从结构上、系统上对行业有新的思考?

总结起来的话,AI带来的融合可能还不止于HPC和AI加速融合本身,可能也要把云和HPC融合考虑在内,这对下一代超算机器如何造,有非常重要的影响。所以我认为,今年往后应该会有比较大的事情、改变发生。

量子位:所以今年对超算行业来说,可能会是关键性一年,甚至是里程碑的一年?

刘军:我认为会是非常关键的一年,接下来应该会有较大的事情发生,我们通过现在行业里的思考和布局就知道,而且这些思考都是非常慎重认真的思考。

接下来还有在美国举行的AC大会,那时候规模会比现在大一些,到时候是不是这些预热性的思考会进一步落地,我们可以拭目以待。

【完】

交流沟通

量子位读者6群开启,对人工智能感兴趣的朋友,欢迎加量子位小助手的微信qbitbot2,申请入群,一起探讨AI。

想要更深一步的交流?

量子位还有自动驾驶NLPCV机器学习等专业讨论群,仅接纳相应领域的一线工程师、研究人员等

同样需要添加qbitbot2为微信好友,提交相应说明,符合条件后将被邀请入群。(审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者等岗位,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

 扫码强行关注『量子位』

追踪人工智能领域最劲内容


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存