冲刺E级超级计算,英特尔会带来多少种可能?
你能否想象,某种尖端技术,在经历了半世纪甚至更久的发展演化之后,会有怎样的嬗变?变得更为精深、更加极致,这或许是一个答案,但并非惟一的答案,与之并存的,很可能还包括:它的应用会更为广泛,从服务少数人到普惠多数人,还有,它在本原上也会与新兴技术产生更多的交集和融合。
▲戳视频,回顾英特尔@HPC China 2021
刚刚落幕的 2021 年第十七届全国高性能计算学术年会 (CCF HPC China 2021) 就探讨了类似问题的答案,它围绕的主题——高性能计算就是这样一种技术,而上面三种可能的、甚至更多的答案正在它的身上同步迸现——向 E 级计算冲刺的“极致”、从学术界走向产业界的“普惠”,以及与 AI 和大数据的“融合”,已经成为其公认的重要发展趋势。
CCF HPC China 2021 主题演讲现场
先绕过极致,谈谈普惠和融合,虽然对于超算的业内人士来说,这两个趋势已不是什么新鲜事物了,但很多人可能还是想不到,关系到国计民生的油气勘探,还有让人望眼欲穿的癌症新药物及疗法的开发,这些事都与高性能计算,尤其是与大数据和 AI 开始融合的高性能计算密不可分。
应英特尔邀请,中石油东方地球物理公司物探技术研究中心计算机技术研究部主任张旭东,以及转化医学国家重大科技基础设施(上海)生信大数据平台共同负责人吕纲,就在本次年会上现身说法,谈了谈他们在高性能计算上的应用体验及核心需求。
张主任的分享,是从 GeoEast 切入,这是中国石油集团具有自主知识产权的超大型油气勘探软件,整合了地球物理、地质、计算机及 HPC 等多学科先进技术及新方法。由于地质勘探的数据已经实现了从 PB 到 TB 的转换,加之对精度要求的不断提高,计算量已经上千倍地增加,当然,也就对计算系统提出了更高的要求。开发人员在这种情况下必须要同时考虑软件的特性及硬件平台的性能优化,迫切需要跨平台支持多语言开发的解决方案,来实现灵活性和高性能水准。例如面对 CPU 和 GPU 甚至更多种类加速器协同计算的开发和维护难题时,GeoEast 的开发人员就希望有 Java 一样的方案,可以实现“一次编译,处处运行”。
中石油东方地球物理公司
物探技术研究中心计算机技术研究部主任张旭东
吕老师的需求,则直指高性能计算系统中的存储应用,他所在的上海交通大学附属瑞金医院转化医学中心,是中国第一个也是截至目前唯一建成的国家级综合性转化医学中心,而转化医学的实现,需要先收集全面多维的患者生物信息数据,然后基于海量数据的挖掘和分析,最终形成更个性化且精准的诊疗方案。由于这一过程涉及的数据数量庞大、复杂且持续增长(例如,单个人类全基因测序分析涉及的数据就高达 870 GB)。并且由于招募的患者通常病情比较危急,效率就变得至关重要。同时,由于不同转化医学研究团队都需要高效地并行访问海量生物信息数据,这一切归结之后,高性能的数据并行访问能力就成了关键。
转化医学国家重大科技基础设施(上海)
生信大数据平台共同负责人吕纲
表面看是技术问题,背后是产业问题、是民生问题,甚至是人类生存和发展的问题,这就是高性能计算的独特性或魅力所在。张主任和吕老师谈到的,也不仅仅是他们遭遇的个体问题,而是高性能计算从传统学术圈或科研领域走向工业界或产业界,如工程制造、天气预报、智慧城市、金融分析、能源勘探、药物开发等领域,并与更多源、更为海量的数据以及更多样、更先进的应用和算法碰撞后,必然面临的共同问题。
好在,这些问题看似错综复杂,但就像再纠缠的绳结也有活扣,它们的活扣,则要回到技术本身,回到极致或者追求极致这个话题上。
就像东方地球物理公司选择了英特尔 oneAPI 工具包,让 GeoEast 支持前沿异构架构成为可能——oneAPI 工具包就是英特尔为充分简化跨 CPU、GPU、FPGA 及其他加速器的异构计算应用开发及优化而生,它不仅拥有英特尔的编译器、库和分析工具,还支持英特尔现有和即将发布的用于 AI 和 HPC 应用加速的 VNNI/DL Boost和 AMX(高级矩阵扩展)等技术,可以为更多相关应用负载提供更优的支持。张主任表示,GeoEast 的开发人员在 oneAPI 研发阶段就积极与英特尔进行了交流与测试,发现 oneAPI 十分切合其高性能应用场景,遂决定将在明年推出最新版 GeoEast 5.0 中正式采用 oneAPI 作为编译构建工具。
GeoEast围绕oneAPI与英特尔开展的合作以及其应用规划
上海交通大学附属瑞金医院转化医学中心也在英特尔的帮助下,找到了他们追求的那份“极致“——他们发现,英特尔® 傲腾™ 持久内存 + 分布式异步对象存储 (DAOS) 的方案能够有效破解高性能计算平台面临的存储瓶颈。该方案在硬件上使用了性能与 DRAM 相近,但容量、耐用性和性价比更高,并且具备数据持久性的傲腾™ 持久内存;软件上则采用了可显著提升数据存储、访问效率,并能加速数据恢复的 DAOS 系统。双方目前正在深化合作,期待通过实际应用场景验证基于该存储架构打造的高性能临床医学深度挖掘系统的性能表现,顺便,再打个排位赛,冲击一下全球 IO500 排行榜中前十名。
瑞金医院转化医学中心对DAOS优势的剖析
看到这里,你可能会觉得有些意外:英特尔在高性能计算领域得到普遍应用的至强® 处理器何在?
至强,其实一直都是基础!但英特尔现在高性能计算领域帮助合作伙伴或用户追求极致的助力,早已不再是单一的 CPU,而是丰富、多维、软硬兼施的完整产品技术组合,至强是其核心,oneAPI、傲腾™ 持久内存和 DAOS 也同样是其不可或缺的部分,将它们组合起来的目标,就是要实现均衡。
均衡与极致,乍一看很矛盾,如果是用中庸或制衡的意思来理解均衡,的确如此。但如果把它解读为同步且均衡的提升呢?
这正是英特尔对均衡的解读,即旨在实现数据全链路,包括计算、存储和传输的均衡提升和优化,以避免平台出现性能短板和瓶颈,同时,它还包含另一层含义,就是要实现对通用计算和专用加速能力的兼顾和均衡提升,以满足高性能计算应用多样化+差异化+融合化的需求。
英特尔公司市场营销集团副总裁、中国区行业解决方案部总经理梁雅莉就在本次年会上谈到:“帮助更多企业、行业加速探索更多未知与可能,高性能计算也需要进行自我革新和重塑。不论是冲击 E 级计算的新境界,还是实现与 AI 及数据分析的融合,高性能计算都比以往更渴求算力的跳跃式进化以及对更多样化的负载的承载能力。”
英特尔公司市场营销集团副总裁、中国区行业解决方案部总经理梁雅莉在本次 CCF 高性能计算学术年会上发表主题演讲
她进一步解释说,作为高性能计算普及大潮的坚定支持者和技术创新引领者,英特尔正致力于提供基于异构体系,更为丰富也更加灵活易用的高性能计算核心产品技术组合,包括全新英特尔® 至强® 可扩展处理器、傲腾™ 持久内存和存储产品,以及为 HPC 和 AI 应用提供特定加速能力的 GPU,还有能充分激发这些硬件性能潜力的全套软件工具。“我们相信这些产品组合将协助客户进一步拓展 HPC 应用边界并实现更多可能,帮助更多企业把面临的复杂性和挑战转化为发展机遇。”
目前英特尔已为高性能计算领域提供,及正在进一步打造、强化的产品技术组合
梁雅莉提到的高性能计算产品组合,应该说同时涵盖了这两层含义。计算、存储和传输的均衡都已在至强® 平台上实现。就现阶段而言,最高可集成 40 核,内置了英特尔® 深度学习加速技术,并支持 PCI-e 4(这意味着它可与更多高性能 GPU 搭配)的第三代至强® 可扩展处理器,与傲腾™ 持久内存和英特尔高速以太网产品的硬件,再铺以 oneAPI 软件工具就是其落地的基石。
英特尔高性能计算产品组合现阶段的核心
——第三代至强® 可扩展处理器
要谈到未来,那么正蓄势待发的、代号为 Sapphire Rapids 的下一代至强® 可扩展处理器,以及英特尔首款主打高性能计算和人工智能加速,也是 Xe HPC 架构首款产品、代号为 Ponte Vecchio的 GPU 产品,就有望形成强化英特尔高性能计算产品组合均衡优势的“双主角配置”,而这也将意味着英特尔迎来其 XPU 战略落地、为高性能计算提供异构架构支持,以及冲刺 E 级(Exascale,百亿亿级)计算的尖峰时刻,这正是高性能计算追求“极致”的最新标志。
英特尔公司副总裁 Trish Damkroger 特地录制了一段视频,为本次年会的参会者披露了这两款产品的关键指标及初步的性能结果。她称从高性能计算和 AI 应用的角度而言,采用全新模块化 SoC 架构的 Sapphire Rapids 的优势不仅在于集成更多核心(56 核,112 线程),更在于其支持 DDR5、PCIe5 和 CXL 技术后,在进一步增强内存、存储和互联性能方面带来的潜能,以及集成 AMX(高级矩阵扩展)技术后,即将为 CPU 运行矩阵运算任务带来的显著加速效果。
英特尔公司副总裁 Trish Damkroger
展望下一代至强® 可扩展处理器的规格特性
与 Sapphire Rapids 主要提升通用计算性能相匹配的,就是 Ponte Vecchio 为高性能计算和人工智能带来的更强加速能力。Trish Damkroger 表示这款由 47 种不同芯片模块组合而成的 GPU,将有助于加速 E 级计算愿景的实现。它将采用灵活的数据并行向量矩阵引擎来处理一系列高度并行的工作负载。它可提供超高的双精度浮点运算吞吐量并提供超高缓存和内存带宽,以满足需要高内存带宽的应用程序。
集领先架构和多种先进制造、封装技术于一身的 Ponte Vecchio
当然,Sapphire Rapids + Ponte Vecchio 的组合,还只是英特尔异构架构或 XPU 战略的初探,未来英特尔的高性能计算产品组合,以及面向其他主流企业工作负载的平台或方案,还将在英特尔 CEO 帕特.基辛格新近提出的四个“超级技术力量”的指引下持续演进。“这个超级技术力量分别是无处不在的计算、无处不在的连接、从云到边缘的基础设施,以及人工智能,”梁雅莉表示:“它们都有自己的特质,同时也相得益彰,创造了强大的全新可能性。”
可赋能“万物智能化”变革,同样也会给高性能计算带来更多可能性的四大超级技术力量
可以想见,这些强大的全新可能性里,必然会包括有助于高性能计算自身演进的更多的可能性,还有用更为高效、更灵活也更为均衡的高性能计算助力行业和用户探索出的更多可能性。具体会有多少种可能性?它们又会是什么样?没有人能够给出确切的答案,我们唯一可以预见的是,英特尔将会不断进步,就像今年刚提供第三代至强® 可扩展处理器和全新傲腾™ 产品,同时又准备推出 Sapphire Rapids 和 Ponte Vecchio 这样,持续且坚定地交出越来越令人满意的答卷。
毕竟,英特尔的愿景就是通过创造改变世界的技术,来造福地球上每一个人。这种创造,没有止境,也意味着无限的可能性。
* 本文内容及配图均为“英特尔商用频道”的原创内容。该公众号的运营主体拥有上述内容的著作权或相应许可。除在微信朋友圈分享之外,如未经该运营主体书面同意,请勿转载、转帖或以其他任何方式复制、发表或发布上述内容。如需转载上述内容或其中任何部分,请留言联系。
英特尔、英特尔标识、以及其他英特尔商标是英特尔公司或其子公司在美国和/或其他国家的商标。
©英特尔公司版权所有。
* 文中涉及的其它名称及商标属于各自所有者资产
延伸阅读
长按识别二维码
“芯”有灵犀,你也“在看”!