查看原文
其他

欧洲超算动态 | 三台E级超算先导系统细节最新披露

导 读

两年前,欧盟高性能计算共同计划宣布从欧盟成员国中选择了8个国家建设8台超算系统,拟打造“世界级”的超算中心,总预算高达8.4亿欧元。在最近一次专业论坛上,相关机构代表最新披露了8个超算系统中的3台E级超算先导系统的研制进展。新系统除了计算性能大幅提升之外,更加注重绿色节能环保,努力实现碳中和。

欧盟高性能计算共同计划(EuroHPC)资助的8大超算系统和超算中心建设如今已初见成效。其中,斯洛文尼亚的峰值计算性能高达每秒6.8 petaflops(千万亿次)的Vega超算系统已开始运行。不过,最受人瞩目的还是随着各超算系统的计划安装和运行时间节点的临近,三个E级超算先导系统的研制进展。据了解,芬兰超算系统Lumi的Linpack性能测试将达到了375 petaflops、意大利超算系统Leonardo的Linpack性能预期为249 petaflops,而另一台E级超算先导系统——西班牙的MareNostrum 5尚未公布太多细节。近日,芬兰国家超算中心(CSC)和意大利CINECA超算中心的代表受邀在HPC用户论坛(HPC User Forum)上,分别介绍了他们各自E级超算先导(pre-exascale)系统的最新情况。







▲ EuroHPC超算系统推进计划表


E

Leonardo E级超算先导系统

意大利CINECA超算中心

CINECA超算应用与创新部主任Sanzio Bassini介绍了Leonardo超算系统的最新进展,该台超级计算机预计投入高达2.4亿欧元。Bassini表示,Leonardo系统的“助推模块”约含3456个Atos Sequana节点,其Linpack性能将达到240.5 petaflops,而由1536个节点组成的“数据中心和通用模块”的Linpack性能将达到8.97 petaflops。在此前的报道中,关于Atos Sequana XH2000节点中的硬件有详细说明,它包括大约14000个Nvidia A100 GPU,英特尔冰湖(Ice Lake)CPU, Nvidia HGX基板和Nvidia InfiniBand 200Gb/s网络。

▲ CINECA超算中心

Leonardo超级计算机将被安置在博洛尼亚的特克诺波洛新建成的一个数据中心,距离CINECA总部里诺之家几英里。Bassini认为这对有效冷却是一种挑战——因为该系统将位于欧洲南部,夏季非常温暖,这个数据中心的功耗预计将达到40兆瓦,而Leonardo系统研究团队的目标电源使用效率(PUE)是要低于1.1Bassini还透露,这些节点运行过程中,“95%”直接用温水冷却,系统将配置“EB设备”,目标是每秒处理1TB的数据。



▲ Leonardo超级计算机示意图

Evangelos Floros是欧盟高性能计算共同计划的一名负责官员。他曾表示,CINECA计划在2021年8月安装助推器模块,并在2021年完成配置和测试;与此同时,数据中心的模块定于2022年第一季度开始安装,2022年第二季度完成。Bassini主任在会上确认助推器模块仍按原计划在大约8、9个月后进行,数据中心模块则计划于2022年1月进行。Leonardo系统建成后,将有望推动意大利成为AI和高性能计算研究与创新的全球领导者之一。

E

Lumi E级超算先导系统

芬兰国家超级计算中心

Lumi 领导计算设施(Leadership Computing Facility)的主任Pekka Manninen介绍了有关该系统安装部署过程的更多细节。Lumi是一个基于HPE Cray EX的系统,将包括AMD Epyc Milan CPU和Instinct GPU,其主GPU分区(Lumi-G)峰值性能将达到550 petaflops,并辅以一系列分区和存储系统:Lumi-C是一个附加CPU分区,拥有约20万Milan核;Lumi-D是一个数据分析分区,32TB的内存和额外的GPU;以及通过Lumi-P、Lumi-O和Lumi-F提供大量PB级存储。Manninen在HPC用户论坛上介绍到,“我们确实希望增加一些新兴技术能力供超算用户探索。”
▲  Lumi系统组成
由于大部分节点的内部结构此前都已经公开了,Manninen在会上提供了Lumi所在数据中心的更多细节。他表示:“数据中心的前身是一家造纸工厂,它能支持200兆瓦的功耗,且有足够的空间来容纳该台超级计算机。过去,造纸机消耗了大量电力,而现在我们可以重用它来为IT设备供电,并可以用碳中和电力系统来运行IT负载。

▲ LUMI超级计算机示意图

与Leonardo的温暖夏季不同,芬兰全年的气候相对凉爽,可为整个系统提供全年免费降温。由于附近就有水电站,该台超算系统将通过100%的水力发电。不过,他认为如果有需要,该系统仍然可以接入电网,因为当地电网是具有一定可靠性在过去的38年里,它只经历过一次两分钟的停电

Manninen介绍道:“Lumi超算系统的余热也不会浪费。研发人员并没有任由Lumi的热量随意散发出去,而是将其收集起来并给其周边城市如Kajaani提供热量。事实上,Lumi多余的热量将用于满足城镇每年约20%的区域暖气能源需求。这是一种能量的循环利用。”他补充说,所有这些因素加在一起,使得Lumi不仅仅达到了碳中和,而且将实现了负碳排放,导致每年净减少约13500吨二氧化碳当量的碳足迹,电源使用效率约为1.03。此外,该中心还将通过销售收集到的余热获得额外收益。

▲ LUMI数据中心的设计

Manninen也确认,Lumi系统将以数千兆比特的速率连接到北欧的骨干网络GEANT,而且可以很方便地升级到万亿比特速率。他说:“通过高速网络,人们可以很方便的访问与使用Lumi的资源。

Lumi将支持来自十个国家的建立一个新的“Lumi联盟”,将由比利时、捷克共和国、丹麦、爱沙尼亚、芬兰、冰岛、挪威、波兰、瑞典和瑞士十国共享。该协会表示,Lumi将使更精确的气候模型成为可能,在诸如自动驾驶汽车、大规模社会科学分析、个体化医学研究等领域,它将使人工智能得到更先进的应用,同时为欧洲工业和中小型企业保留多余的产能。

E

MareNostrum5 E级超算先导系统

西班牙巴塞罗那超级计算中心

除了上述两个超算系统之外,还有一个神秘的MareNostrum 5系统,它由西班牙巴塞罗那超级计算中心运营,是欧洲高性能计算中心委托的第三个也是目前最后一个E级超算先导系统,但与其他7个系统不同的是,供应商的细节目前尚未公开。到目前为止,我们所知道的是,MareNostrum 5设计之初是计划作为一个异构系统,其峰值性能约为200 petaflops,它将包括一个旨在为未来超级计算机开发新技术的实验平台,保障相关技术在欧洲实现自主可控。

▲西班牙巴塞罗那超算中心


继E级超算先导系统之后,欧盟高性能计算共同计划(EuroHPC)的目标应该是性能达到百亿亿次的E级超算系统,但目前相关具体信息还比较少。不过EuroHPC已确认将在2023至2026年期间部署两台E级超算系统,并且计划在2021选定运营主体单位。欧盟内部市场官员Thierry Breton表示:“超级计算机已经成为夺得数字主权的最前沿技术,紧跟国际技术趋势是当务之急,目标是依托百亿亿次超级计算机快速达到计算的下一个标准,这些先进的技术将会使欧洲处于领先地位!”


热门文章推荐


▲推动原始创新,中山大学三大建设超算专项硕果累累

▲再创佳绩!中大学子勇夺ASC世界大学生超算竞赛最高计算性能奖

数说超算创新,播洒科技种子——2021超算科普开放日活动成功举办

— — NSCC-GZ — —

  来源:HPC WIRE、HPE等官网

翻译整理:万园园

微信编辑:岳苹

初审:王栋

审核:万园园

核发布:李奈青

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存