超算动态!瑞士超算“阿尔卑斯”将采用NVIDIA基于Arm架构的CPU
导 读
2021年4月13日,一年一度NVIDIA GTC大会正式召开。在会上,NVIDIA发布了基于Arm架构的数据中心CPU——Grace。瑞士国家超级计算中心(CSCS)积极推动超算系统升级换代,将用新一代超算系统——名为Alps(阿尔卑斯)的超级计算机取代其当前在TOP500仍位列12位的旗舰超算系统Piz Daint。Alps超级计算机计划采用NVIDIA新推出的Grace CPU,预期可达20 Exaflops的AI性能,将于2023年正式上线。
▲
NVIDIA推出“Grace”
基于Arm架构的CPU
近日,在一年一度的NVIDIA GTC大会上,NVIDIA创始人黄仁勋正式宣布推出一款基于Arm的CPU——Grace!这款CPU以美国海军少将、计算机编程先驱Grace Hopper的名字命名。在宣布400亿美元收购Arm的6个月后,NVIDIA连发三款基于Arm打造的处理器,包括专为TB级加速计算而设计的NVIDIA Grace CPU、全新BlueField-3 DPU以及1000 TOPS算力的自动驾驶汽车SoC。
黄仁勋在会上介绍说,现在NVIDIA数据中心路线图包括CPU、GPU和DPU这三类芯片,而Grace CPU和BlueField DPU是其中必不可少的关键组成部分。每个芯片架构历经两年的打磨周期(周期内可能出现调整),一年专注于x86平台,另一年专注于Arm平台。
作为NVIDIA基于ARM架构的CPU,Grace引起了广泛关注,这是一款专为大规模人工智能和高性能计算应用而设计的CPU,NVIDIA认为,AI模型的数据量和规模正在成倍增长。当今最大的AI模型包括数十亿个参数,并且每两个半月就会翻一番。训练它们需要一个新的CPU,可以与GPU紧密结合,以消除系统瓶颈。据NVIDIA介绍,Grace CPU与NVIDIA GPU通过NVLink连接,性能将比目前最先进的基于x86架构和PCIe连接的NVIDIA DGX系统高出数倍。
Grace CPU预计将于2023年初上市。据悉,瑞士国家超级计算中心(CSCS)和美国能源部的洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)都将搭载该芯片打造性能强大的AI超级计算机。
CSCS用新一代超算“Alps”
代替旗舰系统“Piz Daint”
早在2020年,瑞士国家超算中心(CSCS)就启动了超算系统升级的项目,委托HPE研发以阿尔卑斯(Alps)命名的新一代超算系统,以取代其当前在TOP500仍位列12位的旗舰超级计算机Piz Daint。Piz Daint曾经在2017年两次获得TOP500榜单的第三名,一度是欧洲最先进的超算系统。
Alps超算系统构建将基于新的HPE Cray EX超级计算机产品线,该产品线使用下一代HPC架构,可有效处理海量且不断增长的复杂数据。它配置HPE Cray软件栈,可提供软件化定义的超算服务。根据GTC大会上的最新披露,Alps将采用最新发布的NVIDIA HGX超级计算平台(包括NVIDIA GPU,NVIDIA HPC SDK和基于Arm的NVIDIA Grace CPU)。
Alps的预期AI性能为20 Exaflops(20 Exaflops of performance for AI)。利用NVIDIA CPU和GPU之间的紧密耦合,Alps预计能够在两天内完成GPT-3(全球最大的自然语言处理模型之一)的训练,与目前全球领先的AI超级计算机——来自NVIDIA的Selene超级计算机(其AI性能为2.8 Exaflops)相比,速度将提高7倍多。
CSCS用户能够将这强大的AI性能应用到受益于自然语言理解的众多新兴科学研究中,例如分析和理解大量科学论文中的知识信息、产生用于药物发现的新分子等。
HPC+AI融合
“Alps”应用范围广泛
CSCS成立于1991年,致力于为高性能计算领域的研究开发和推广提供技术服务。通过开拓、运营和支持先进的超级计算技术来实现世界一流的科学研究。对于此次业务主机系统的升级换代工程,研发团队致力于为多领域取得突破性研究进展提供创新动力,包括气候模拟和天气预报、材料科学、天体物理学、计算流体力学、生命科学、分子动力学、量子化学和粒子物理学以及经济学和社会科学等。
此外,考虑到延续性,当前Piz Diant的超算用户将无需做大的调整,即可顺畅地甚至更便捷地使用下一代新系统。研发团队还在着力开发各类应用平台,保障资源高性能高可用。同时,支持工作流管理,使得研究者们不仅能进行计算模拟还可以对数据进行预处理或后处理,从而保障整个工作流程更为高效。
CSCS主任、苏黎世联邦理工学院计算物理学家Thomas Schulthess教授介绍到:“我们不仅是打造一台新的超级计算机。为了实现科学突破,我们正在分几个阶段来对整个超算中心进行改造,致力于建设面向服务的基础研究设施。Alps将使用基于云原生软件架构的HPE Cray EX超级计算设施来实现软件定义的基础架构,并使用NVIDIA的新型Grace CPU,将AI技术和传统的HPC融合到一个强大的数据中心基础设施中。”
NVIDIA创始人黄仁勋说:“当今诸多的科学研究挑战需要一种新型的超级计算机来应对。利用专门为大规模AI和HPC设备设计的新型Grace CPU,NVIDIA与CSCS将携手开辟一条崭新的道路:打造世界一流的、基于Arm的超级计算机,使一流的科学家能够利用AI的强大功能开展改变世界的研究。”
鉴于Arm架构芯片弹性、高效及节能的优势,过去两年,华为、亚马逊等都推出了基于Arm架构的服务器芯片。NVIDIA也称,计划将Arm架构优势扩大至云端运算、高效能运算、边缘运算及个人计算机等诸多领域。基于Arm架构的Grace CPU在新一代大型超算系统Alps的成功应用将是进一步扩展Arm生态系统的重要里程碑事件,在2023年该超算研发项目能否如期完成,我们拭目以待。
热门文章推荐
▲重磅!超算+先进原位实验驱动地球内部超离子态新发现
▲巾帼力量!超算中心主任卢宇彤教授荣获“全国三八红旗手”
▲“国考”放榜!天河二号为全国三级公立医院绩效考核提速
— — NSCC-GZ — —
参考来源:CSCS、NVIDIA、芯东西等
翻译&整理:万园园、万文
微信编辑:霍志昕
初审:王栋审核:万园园审核发布:李奈青