查看原文
其他

英特尔塑造高性能计算的未来

英特尔 知IN 2022-08-02



从工作站、云到全球Top500超级计算机,英特尔一直是高性能计算的坚实基础。在近日举行的2020年超级计算大会(SC20)上,英特尔副总裁兼高性能计算部总经理Trish Damkroger展示了英特尔及合作伙伴通过软、硬件技术来加速先进高性能计算系统广泛部署,共同塑造高性能计算的未来。


英特尔在2020年超级计算大会上主要亮点:


  • 更高的内存带宽、全新的核心架构、更多的处理器核数以及更快速的输入/输出:即将推出的第三代英特尔®至强®可扩展处理器(代号“Ice Lake”)将为高性能计算工作负载提供更高性能。


  • 马克斯·普朗克计算和数据中心(Max Planck Computing & Data Facility)以及韩国气象厅等客户都选择第三代英特尔至强可扩展处理器来加速高性能计算应用。


  • 美国阿贡国家实验室(Argonne National Laboratory)利用英特尔® Xe-HP GPU和英特尔® oneAPI工具包来加速E级计算应用的开发。


  • AWS、Penguin Computing和Advantech等合作伙伴已通过认证,来部署针对高性能计算优化的英特尔®精选解决方案,帮助客户部署和管理高性能计算工作负载。


近日,在2020年超级计算大会上,英特尔重点展示了公司如何通过软硬件技术塑造高性能计算的未来。全球范围内,诸多企业选择英特尔® XPU(CPU、GPU、FPGA和加速器)和oneAPI编程环境,来加快先进计算系统的开发和部署。


第三代英特尔®至强®可扩展处理器

(代号“Ice Lake”)


在2020年超级计算大会的主题演讲中,英特尔副总裁兼高性能计算部总经理Trish Damkroger着重介绍了英特尔即将推出的Ice Lake服务器处理器,它将为广泛的高性能计算工作负载提供性能优化的功能。通过更高的内存带宽、新的高性能Sunny Cove核心架构、更多的处理器核数,以及对第四代PCIe的支持,Ice Lake处理器将帮助客户解决包括生命科学、材料科学和天气建模等多个学科的科学挑战。


早期测试表明,对比搭载64核处理器的竞品x86系统,采用32核双路系统的Ice Lake处理器能够以一半数量的处理器内核为特定工作负载提供更高的性能。对比搭载比32核Ice Lake处理器系统多一倍处理器内核的竞品x86系统,生命科学和金融服务应用类客户会在NAMD分子动力学模拟(最高1.2倍)、蒙特卡罗模拟(最高1.3倍)和LAMMPS分子建模模拟(最高1.2倍)等工作负载上都获得更高的性能。


诸多客户正在采用Ice Lake来满足自身对新一代高性能计算的需求,包括:


  • 韩国气象厅将Ice Lake服务器处理器应用于其5号超级计算机中,该系统能够实现每秒50千万亿次浮点运算,帮助研究天气和气候变化,并实现比当前系统更可靠、更具可行性的预测。


  • 马克斯·普朗克计算和数据中心将在其全新的Raven系统中采用Ice Lake。Raven系统可实现每秒9千万亿次浮点运算,能够支持物理学、生物学、理论化学等领域的突破性研究。


  • 日本国家工业科学技术研究所将在其AI数据中心楼内新增的AI桥接绿色云基础设施系统中采用Ice Lake。预计,该系统的半精度浮点运算峰值将达每秒850千万亿次。


  • 东京大学和大阪大学是首批采用Ice Lake的日本大学。东京大学每秒达2千万亿次的浮点运算系统和大阪大学每秒达2.8千万亿次的浮点运算系统,将主要用于综合研究和数据分析。


  • 甲骨文将在其甲骨文云基础设施内部署Ice Lake,运行X9 Generation高性能计算云实例,适用于碰撞模拟、抗震分析和电子设计自动化等计算密集型工作负载。


此外,Damkroger还重点介绍了一些近期的超算项目,这些项目利用英特尔最新的至强处理器、即将面世的至强处理器、内存和人工智能技术来推动科学研究


  • 巴塞罗那超算中心采用英特尔®傲腾®持久内存和至强可扩展处理器,以加速采用异构内存架构的高性能计算应用。该中心的研究员发现,傲腾持久内存不仅功耗比DRAM低10倍,还能够让多个应用的性能实现双位数提升。


  • LIQID和英特尔正携手为美国国防部提供全球最大的组合式超级计算机。采用英特尔至强铂金9200 处理器的LIQID的平台,主要用于为美国国防部的人工智能工作负载按需创建软件定义服务器,并能够提升资源利用率和AI性能。


英特尔Xe-HP GPU为美国阿贡国家实验室

开辟通向E级计算之路


在2020年超级计算大会上,英特尔和美国阿贡国家实验室(Argonne National Laboratory)宣布双方将基于英特尔 Xe-HP微架构的GPU和英特尔oneAPI工具包,共同设计和验证E级应用。阿贡国家实验室的开发者采用英特尔最新的异构计算编程环境,以确保科学应用能够支持正在部署的Aurora超级计算机的规模和架构。


Xe-HP GPU为阿贡国家实验室提供了面向英特尔 Xe-HPC GPU(“Ponte Vecchio”)的开发工具,后者将被应用于Aurora系统。


更多信息请阅读“英特尔和阿贡国家实验室的开发者开辟通向E级计算之路”


面向高性能计算的英特尔®精选解决方案


英特尔近期宣布,数家新的合作伙伴已经验证并正在提供采用了英特尔精选解决方案的高性能计算优化解决方案,这些合作伙伴包括:


  • AWS宣布将面向模拟和建模的英特尔精选解决方案集成到其ParallelCluster环境中。利用英特尔优化的环境,客户可以在AWS上轻松创建高性能、按需自动扩展的集群。该英特尔精选解决方案已经在AWS的c5n.18xlarge、m5n.24xlarge和r5n.24xlarge实例上进行了验证。


  • Penguin Computing正在部署面向高性能计算和AI融合集群的英特尔精选解决方案,使客户能够满足越来越高的同时运行AI和高性能计算工作负载的需求。


  • Advantech携手英特尔与GARAOTUS,为客户提供Advantech SKY-5240。Advantech SKY-5240满足了基因组学应用的高性能计算需求,并已经通过验证,成为面向基因组分析的英特尔精选解决方案。


欲了解有关英特尔参加2020年超级计算大会的更多信息,请访问Intel.com。


性能因使用、配置和其他因素而异。更多信息请访问 www.intel.com/PerformanceIndex 。性能结果基于截至配置中显示的日期的测试,可能无法反映所有公开可用的更新。有关配置的详细信息,请参见备份。任何产品或组件都无法提供绝对的安全性。成本和结果可能有所差异。英特尔技术可能需要支持的硬件、特定软件或服务激活。英特尔不控制或审核第三方数据。请咨询其他资源以评估准确性。


向上滑动阅览

①NAMD 分子动力学模拟: 2S第三代英特尔至强可扩展处理器(Ice Lake):单节点,2个预生产的第三代英特尔至强可扩展处理器(Ice Lake – 2.2GHz,每个插槽32个核心),英特尔参考平台,256GB、16x16GB 3200MHz DDR4,超线程启用,TURBO启用,SNC禁用,SSDSC2KG96 960GB,BIOS SE5C6200.86B.0017.D92.2007150417,微代码0x8c000140,CentOS Linux 7.8, 3.10.0-1127.18.2.el7.crt1.x86_64,使用Intel C Compiler 2020u2编译,英特尔数学内核库,NAMD:2_15-Alpha1,由英特尔于2020年9月17日进行测试。2S AMD EPYC 7742:单节点,2个AMD EPYC 7742(2.25GHz,每个插槽64个核心),Supermicro平台,16x16GB 3200MHz DDR4,SMT启用,Boost启用,NPS=4,SSDSC2KG96 960GB,BIOS2.0b dt 11/15/2019,微代码0x8301025,CentOS Linux 7.7.1908,3.10.0-1127.13.1.el7.crt1.x86_64,使用AOCC 2.2编译,英特尔数学内核库,NAMD:2_15-Alpha1,由英特尔于2020年9月10日进行测试。


②蒙特卡洛模拟:2S第三代英特尔至强可扩展处理器(Ice Lake):单节点,2个预生产的第三代英特尔至强可扩展处理器(Ice Lake – 2.2GHz,每个插槽32个核心),英特尔参考平台,256GB, 16x16GB 3200MHz DDR4,超线程启用,TURBO启用,SNC禁用,SSDSC2KG96 960GB,BIOS SE5C6200.86B.0017.D92.2007150417,微代码0x8c000140,CentOS Linux 7.8,3.10.0-1127.18.2.el7.crt1.x86_64,使用Intel C Compiler 2020u2编译,英特尔数学内核库2020u2,英特尔开发的Monte Carlo FSI Kernel工作负载,由英特尔于2020年10月9日测试。2S AMD EPYC 7742:单节点,2个AMD EPYC 7742(2.25GHz,每个插槽64个核心),Supermicro平台,16x16GB 3200MHz DDR4,SMT启用,Boost启用,NPS=4,SSDSC2KG96 960GB,BIOS2.0b dt 11/15/2019,微代码0x8301025,CentOS Linux 7.7.1908,3.10.0-1127.13.1.el7.crt1.x86_64,使用Intel C Compiler 2020u2编译,英特尔数学内核库2020u2,2,英特尔开发的Monte Carlo FSI Kernel,由英特尔于2020年7月17日测试。


③LAMMPS分子建模模拟(原子流体,铜,液晶,聚乙烯,蛋白质,斯蒂林格-韦伯,特索夫和水的几何平均值):第三代英特尔至强可扩展处理器(Ice Lake)单节点,2个预生产第三代英特尔至强可扩展处理器(Ice Lake – 2.2GHz,每个插槽32个核心),英特尔参考平台,256GB, 16x16GB 3200MHz DDR4,超线程启用,TURBO启用,SNC禁用,SSDSC2KG96 960GB,BIOS SE5C6200.86B.0017.D92.2007150417,微代码0x8c000140,CentOS Linux 7.8,3.10.0-1127.18.2.el7.crt1.x86_64,使用Intel C Compiler 2020u2编译,英特尔数学内核库2020u2,LAMMPS 03/03/2020,由英特尔于2020年10月9日测试。2S AMD EPYC 7742:单节点,2个AMD EPYC 7742(2.25GHz,每个插槽64个核心),Supermicro平台,16x16GB 3200MHz DDR4,SMT启用,Boost启用,NPS=4,SSDSC2KG96 960GB,BIOS2.0b dt 11/15/2019,微代码0x8301025,CentOS Linux 7.7.1908,3.10.0-1127.13.1.el7.crt1.x86_64,使用AOCC 2.2编译,LAMMPS 07/21/2020,由英特尔于2020年8月19日测试。


©英特尔公司,英特尔、英特尔logo及其它英特尔标识,是英特尔公司或其分支机构的商标。文中涉及的其它名称及品牌属于各自所有者资产。



相关资讯



/转载请注明出处/

点赞还是在看?

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存