查看原文
其他

丹佛归来,看全球超算进入新的发展关键期

导  读

未来即现在,超算正当时。为期一周的世界超算顶级大会SC19已在白雪覆盖的丹佛落下帷幕,整个城市寒气袭人,而大会现场热火沸腾。趁盛宴余音尤在,让我们再度一起回看本届大会的精彩!


TOP100超算总性能破E,Fugaku登顶Green500

第54届TOP500榜单与上一届相比前十名系统排名保持不变,美国的Summit以持续性能148.6 Pflops继续位列第一;在上榜总数上,中国由之前的219台增加到227台,进一步扩大了与美国(118台)的优势;在总算力占比方面,美国系统算力占比达37.8%,中国由上届的29.9%提升至31.8%。本期榜单的最大亮点是前100名的系统总算力首次突破了E级,达到1004 Pflops,显示全球超级算力的快速稳定提升,尤其是大规模系统的数量在增加。

今年的Green 500排名吸引了不少眼球,有四台新的系统进入排名前列。日本E级计算机Fugaku/Post K的原型机夺得第一,能效比达到16.9 gigaflops/W,这台基于A64FX芯片的系统的Linpack性能为2P,目前在Top500上排名第159位,也是继Astra之后第二个进入TOP500的Arm架构系统。排名第二的是日本的NA-1系统,排名第三的是部署在伦斯勒理工学院的IBM系统 AiMOS,紧随其后的是部署在MIT的Satori系统。

GREEN 500


各国超算最新进展披露

Fugaku原型机夺得Green500排名第一无疑是日本E级计算机研制重大进展,也证明纯CPU架构的超级计算机可以比用加速器异构的系统更加节能。目前,K Computer已经从Riken的机房里移除,A64FX芯片的测试已经开始,11月份Fugaku的时钟频率将达到2.0-2.2GHz,日本文部科学省也同步宣布了将于2020年第二季度发布Fugaku系统的“试用项目”。按照计划,Faguku的系统部署将在2020年1月份开始进行。

SC19

美国首台E级计算机Aurora的研制厂商英特尔在SC19上发布了将用于Aurora的通用GPU——Ponte Vecchio,这款GPU是Intel首款7纳米工艺Xe架构芯片,将充分满足高性能计算模拟与AI训练的需求。按照发布的信息,Aurora的计算体系架构将由2颗10纳米英特尔Xeon可扩展处理器(Sapphire Rapids),6颗PonteVecchio GPU构成,全系统内存容量超过10PB,存储容量达到230PB,预计于2021年问世。

美国的National Strategic Computing Initiative(NSCI)和E级计算应用项目(ECP)也在SC19发布了进展。NSCI由美国政府于2015年提出,包含了E级计算机软硬件研制、推进数值模拟与大数据分析融合技术的发展等一系列行动目标。在最新的进展报告中,NSCI强调“异构”已成为高性能计算的常态,要建设异构计算系统与软件、网络、数据与人才融合的计算生态环境,并提出要超越E级计算,建设从前沿(Edge)到极限(Extreme)的计算连续体,同时将软件和高性能计算人力资源作为未来发展的关键。ECP的材料、地球物理、核反应器、微生物组学应用项目团队分别报告了项目进展,目前各领域的应用代码均已在Summit系统上进行部署和调优,性能取得了跨越式的提升,各个团队也对面临的面向E级计算机的拓展性问题和应用移植问题进行了分析,并探讨了下一步的研究路线。

欧洲通过SC19大会会展介绍了其E级计算项目与基础设施建设的情况,欧盟地平线2020计划支持的7个项目分别进行了报告和展示。

ETH团队获得Gordon Bell奖,绘制晶体管上的热量“地图”

今年的Gordon Bell奖由苏黎世联邦理工学院(ETH)可扩展并行计算实验室团队的研究“A Data-Centric Approach to Extreme-Scale Ab initio Dissipative Quantum Transport Simulations.”获得。

随着芯片上晶体管的体积越来越小、密度越来越大,晶体管的散热已成为下一代计算架构发展的瓶颈问题。通过自主研发的DaCe OMEN程序,ETH团队模拟了电流如何通过由10万个原子组成的晶体管二维面,得出晶体管上的热量“地图”,这对深入了解晶体管热性能、指导新一代散热性半导体的研发具有重大意义。OMEN近年来已成为纳米尺度材料模拟领域常用的一款量子传输模拟器,但也面临着可扩展性的问题。ETH开发的DaCe OMEN以数据为中心,通过通信回避的算法有效缓解了原来的可扩展性问题,将运算速度提升了两个数量级。DaCe OMEN程序目前已经在TOP500排名前六的两台超级计算机上运行,在 Summit的4560个节点上取得了双浮点85.45 Pflop/s、混合精度90.89 Pflop/s的优异性能。

高性能计算+大数据+人工智能,融合应用加速工业发展

SC的HPC Impact环节专注于高性能计算在工业领域的应用,由高性能计算用户展示他们的实际应用成果。今年HI共15个子环节,其中7个与大数据、深度学习、人工智能相关,比如阿贡国家实验室与能源公司Aramco Services合作使用Mira超级计算机进行商业重型汽油发动机的设计优化,几天内运算完成了数千个设计组合,完成了普通工业计算集群上数个月的模拟工作量,并实现了对更多变量的快速评估,模拟结果再采用机器学习方法进行分析,通过融合计算实现了设计的快速评估和选型。这些应用都充分反映了近年来高性能计算、大数据和人工智能在工业界应用中的快速融合。

高性能计算与AI的融合展现出了解决工业和科学领域挑战性问题的巨大潜力,然而,多尺度多物理场特征的挑战和部分数据无法直接解答的问题,决定了单纯以数据为中心的方法还是不够。本届HPC Impact的主席,美国能源部ECP计划的副主任Lori Diachin认为,数值模拟领域还有需要研究和理解的根本问题,在探索融合带来的新可能时,急需坚实数值模拟的基础。在未来,更需要将数据和基于物理的模型进行协同组合,在尊重物理约束的前提下,嵌入领域知识,实现高性能计算和AI的进一步深度融合,进而助力在更多领域的高效应用。

大会论文聚焦学术前沿

SC19的大会论文与Poster继续保持了极高水准,目前大会Proceeding 已在ACM DigitalLibrary 和IEEE Xplore出版。由国家超算广州中心衡益教授指导的“Model identification of pressure drop in membrane channels with multilayer artificial neural networks”成功入选大会Poster,作者古江航同学在SC19进行了现场报告展示。


该研究关注目前最广泛应用的海水淡化技术—反渗透技术,以优化反渗透(Reverse Osmosis, RO)淡化过程中卷式膜组件进料通道中隔网设计为目标,以对RO过程影响较显著的6个几何参数以及一个操作参数作为设计参数,结合涉及水动力学及传质过程双向耦合三维CFD微尺度模型,采用高通量计算获得CFD模拟数据,利用多层神经网络进行拟合,建立反渗透淡化过程中的压降模型。最后,基于获得的压降模型,进一步扩展至工业级别优化,指导反渗透卷式膜组件的结构设计。该工作在“天河二号”超级计算机上进行。

清华大学再夺SCC冠军

今年共有来自7个国家16支队伍进入SC大学生计算竞赛的决赛,经过连续几天的奋战,清华大学代表队最终夺冠,再次捧起了SC大学生超算竞赛的冠军,这也是清华大学在三大国际大学生超算竞赛中得到的第12个冠军。

中国超算之声

国家超算广州中心作为中国超算中心的代表,SC19展位现场人气火爆,一如往常地吸引了诸多对“天河二号”和中国超算感兴趣的参会者。超算中心重点介绍了中心紧跟粤港澳大湾区建设发展战略,基于高性能计算、大数据、人工智能的融合创新,在各个领域所取得的丰硕应用成果。为了满足科技产业创新各领域迅速增长的超算应用需求,国家超算广州中心充分发挥重大科学基础设施的优势,着力提升系统能力、研发能力和服务能力,积极探索超算应用服务模式,引育“超算+”复合型人才,为粤港澳国际科创中心和国际高等教育示范区建设提供强有力的支撑。

国家超算广州中心还受邀加入了亚洲展位行活动,与来自中国和亚洲的一流超算中心、主流企业携手向世界各地的参会者集中展示亚洲和中国的超算科技力量。秉持“开放,合作,协同,创新”的理念,广州超算代表与国内外专家学者、产业精英深入探讨与交流,促进国际合作,积极融入国际超算大家庭,继续提升中国超算的国际影响力。

世界超算已经进入新的发展窗口期,新技术与新趋势不断涌现,未来的机遇与挑战并存,开放合作、协同创新仍是不变的主题和道路,中国超算新的征程已经开启,大江大河奔腾向前的势头无法阻挡!


热门文章推荐

┣大计算+大数据:大科学协同创新的未来

┣让7天大于260天,全国首次三级公立医院绩效考核背后的“天河二号”功不可没

┣SC19:以超算之机,先见未来

超算— — NSCC-GZ — —撰稿:莫倩、万园园、颜辉微信编辑:岳苹

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存