技经观察丨美国先进计算政策分析(之一)——美国超级计算机政策分析
先进计算对于一个国家科学研究、经济建设、国家安全等方面发展至关重要。当前,摩尔定律遭遇瓶颈,登纳德定律终结,传统计算向非冯·诺依曼结构发展,一个新计算时代正在来临。美国政府高度重视先进计算发展,近年来更是将先进计算置于战略高度,为美国在基础科学研究和前沿应用突破奠定关键基础,相关经验对我国发展先进计算具有重要借鉴意义。本文主要对超级计算机相关政策进行梳理。
一、超级计算机在美国的战略定位
美国计算机政策发展经历了从超级计算机到多种计算形式并行发展的过程。但时至今日,美国一直将超级计算机作为关键发展事项,促进其快速发展与建设,超级计算机也作为关键基础设施支撑了美国前沿技术和产业发展。
超级计算机是美国人工智能发展处于世界前列的重要保障之一。2016年,谷歌(Google)旗下DeepMind公司研发的AlphaGo战胜围棋世界冠军,掀起了第三次人工智能发展的浪潮,超级计算机为人工智能技术实现突破提供了关键支撑。美国总统特朗普在2019年签署的《保持美国在人工智能领域的领导地位》行政命令中明确要求,国防部、能源部等部门发展高性能计算资源,以保持美国人工智能领导地位。
超级计算机是美国在国防军事、生物医药、航空航天等领域占据全球技术领先地位的基础支撑。美国国防部(DOD)高性能计算中心主任John Wes早在2014年便提出将超级计算作为国防部未来技术发展的关键基础。美国国立卫生研究院 (NIH)通过超级计算机在生物工程方面不断突破,超算已在癌症早期筛查、人群中新冠传播模拟等研究中应用。通过超级计算机,DeepMind旗下公司开发的AlphaFold 可在短时间内测试大量不同的算法,准确预测了超过35万种蛋白质结构。美国宇航局(NASA)表示在推进阿尔忒弥斯计划时一系列复杂问题的处理必须依靠高性能计算机,并且NASA基于已有技术正在开发新的太空飞行计算机,与目前现有的太空飞行计算机相比,其计算能力至少是原来100倍。2020年3月,美国国家科学基金会发布《国家网络基础设施生态系统的愿景》,将超级计算机规划为美国21世纪网络生态系统关键基础设施。
图1:国家网络基础设施生态系统的愿景
超级计算机将在量子计算机的发展中发挥巨大作用。当前,发展量子计算机的主要任务之一,就是如何充分发挥NISQ(Noisy Intermediate-Scale Quantum)的量子硬件能力,真正地解决一些有意义的问题,从而展现具有现实价值的量子优势。
图2:桥接技术搭建跨系统架构
英伟达(NVIDIA)认为可以通过桥接技术搭建跨系统架构的动态工作来实现量子优势。NVIDIA基于经典超级计算架构搭建的QODA将是该公司未来量子计算的关键路线,可以在一个系统中集成和编程量子处理单元 (QPU)、GPU 和 CPU。借助 QODA,开发者就能构建完整的量子应用程序,并在超级计算机上进行模拟。
图3:QODA平台系统架构
美国始终处于全球超级计算机发展的领先行列。据2022年5月超级计算机Top500榜单显示,美国在世界前十的超级计算机排名中独占五席,分别是Frontier(排名第一)、Summit(排名第四)、Sierra(排名第五)、Perlmutter(排名第七)、Perlmutter(排名第八)。排名第一的Frontier由美国橡树岭国家实验室(ORNL)研发。该系统基于最新的 HPE Cray EX235a 架构,配备 AMD EPYC 64C 2GHz 处理器,占地372平方米,由74个HPE Cray EX机柜组成。并且Frontier能耗比也居全球超级计算机环保程度之首,单个机柜单元的能耗效率是每瓦运算62.68 gigaflops 。
二、主要政策及管理模式
美国通过长期政策扶持与资源投入,目前已形成政策、管理、产业一体化发展的超级计算机生态体系。
(一)政策脉络分析
先进计算战略
1991年,美国率先推出超级计算机法案(以下简称“超算法案”),这是政府出台的首部关于计算机与互联网建设的综合性法案,阐明了计算机科学与技术对国家安全、经济繁荣和科学进步的重要意义。根据超算法案规定,美国在1992年发起了高性能计算和通信(HPCC)计划,也就是NITRD计划的前身。在超算法案及HPCC计划带动下,能源部、国防部等多个政府部门开始推动超级计算机建设与发展。
美国政府根据计算技术不断演变,提出了先进计算战略。2015年,美国总统奥巴马签署总统令,启动了“国家战略计算计划”(NSCI),其中要求美国在2025年之前研制出E级超级计算机。NSCI由美国能源部,美国国防部和美国国家科学基金会等部门牵头执行。
2.E级计算行动计划
2016年,美国能源部(DOE)推出“美国E级计算行动计划”(ECI),加速超级计算机的研究、开发和部署。该计划目标是在本世纪20年代初至中期,为DOE实验室提供百亿亿次级计算能力(即E级高性能计算),提高美国经济竞争力,保障国家安全。该计划由美国能源部科学办公室和国家核安全管理局具体执行,涉及美国能源研究科学计算中心旗下劳伦斯·伯克利国家实验室(LBL),橡树岭国家实验室(ORNL)、阿贡国家实验室(ANL),和国家核安全管理局旗下的三个实验室:桑迪亚国家实验室(SNL)、洛斯阿拉莫斯国家实验室(LANL)、劳伦斯·利弗莫尔国家实验室(LLNL)等多个国家实验室。
ECI计划主要由三个部分组成:
(1)项目管理:由美国能源部科学办公室、美国能源部国家核安全管理局等部门负责展开项目遴选及投资。
(2)系统采购和落实:主要分为ALCF-3,OLCF-5,ASC ATS-4等部分分别进行。
(3)百亿亿次级计算项目(ECP项目):专注于研究、开发和部署E级超算项目,促进集成软件堆栈和百亿亿次级硬件技术进步。
为落实ECP计划,美国政府专门组建ECP项目机构,由先进科学计算研究办公室(ASCR)和国家核安全管理局高级仿真和计算(ASC)负责。ECP计划指定了6个核心实验室:ANL、LBL、LLNL、LANL、ORNL、SNL,该项目的领导团队也由核心实验室负责人担任。ECP项目总共涉及研究人员超过1000名。
此外,ECP建立了一个联合设计中心(ExaLearn),将重点放在机器学习等技术上,并针对科学及工程应用项目开发E级超算软件。此外,ExaLearn在项目实施过程中向美国超算供应商反馈最新的技术进展,并将ExaLearn成熟的产品率先部署到超级计算机中。
(二)管理体系分析
美国政府在超级计算方面形成了政府主导的管理模式,一方面有力推进政策落地,另一方面保持政策延续。白宫层面由白宫科技政策办公室负责政策协调,具体项目由能源部、国防部及美国国家科学基金会等部门进行落实。
首先,白宫层面由白宫科技政策办公室(OSTP)负责协调。2020年美国国会通过了《国家人工智能倡议法案》将超级计算作为关键算力纳入美国人工智能战略进行统一谋划,OSTP通过组织政府部门、大学、企业等利益相关方成立了国家人工智能研究资源(NAIRR)工作组,该工作组工作内容包括为跨科学领域的人工智能研究提供超级计算机资源和高质量数据。
其次,部门间配合由美国能源部和美国国家科学基金会共同设立的高端计算机构间工作组(HPC IWG)开展相关工作。2020年《国家人工智能倡议法案》要求加强国家实验室建设,为人工智能提供更多高性能计算基础设施并建立相应的数据管理。HPC IWG将加强高性能计算系统研发确保美国掌握下一代计算革命关键技术。目前HPC IWG已协调14个政府部门参与高性能计算研发。
最后,部门内部也成立了超级计算机管理机构。美国能源部通过设立先进科学计算研究项目(ASCR)和国家核安全管理局高级仿真和计算项目(ASC)对超级计算机项目及任需求进行管理。此外,美国能源部科学办公室设立INCITE计划促进超级计算机资源合理使用。科研人员可以通过INCITE计划访问美国能源部所属的超级计算机,并且该计划还提供了系统使用支持,以确保科学家高效地使用超级计算机。
(三)美国构建超级计算生态
通过联邦政府与产业界互融共建,美国成功构建了超级计算机生态,使美国超级计算机发展形成了良性循环。
首先,政府出资建设超级计算机,产业界深度参与。IBM、Gray、NVIDIA等公司均参与到国家实验室关于超级计算机的建造与设计。Frontier、Summit均由IBM和能源部橡树岭国家实验室(ORNL)联合建设;能源部阿贡国家实验室的基于 GPU 的超级计算机是由 NVIDIA 计算平台运行;能源部洛斯阿拉莫斯国家实验室和桑迪亚国家实验室部联合部署的Trinity是由美国Cray公司主持建造。
其次,政府与产业界、学术界联合攻关超级计算技术。2021年,美国国家科学技术委员会(NSTC)发布《开拓未来的先进计算生态系统》明确阐述了产业界与政府合作攻关先进计算技术的重要性:政府与产业界、学术界长期合作是探索、开发和转化特定的技术的关键。政府鼓励企业研究、开发,并产生的新方法和新技术纳入政府项目中。
最后,政府牵头组建超级计算机创新应用联盟。2020年,白宫科技政策办公室和美国能源部共同发起了COVID-19高性能计算联盟,旨在通过超级计算机进一步加速病毒与生物技术的研究。IBM、谷歌、英伟达、英特尔、亚马逊、微软等科技巨头以及哈佛大学、斯坦福大学、麻省理工等顶尖学术机构积极响应并加入了该联盟。
三、启示
当前美国以政府主导模式发展超级计算机取得了显著成绩,对于我国制定及管理超级计算机政策有一定的借鉴和启示意义。
一是美政府发展超级计算机的规划具有前瞻性。美国在2016年制定“国家战略计算计划”提出 “加速研制百亿亿次级计算系统”的目标,运算性能是当时高性能计算系统的50-100倍,高于摩尔定律所预测的性能提升速度。同时,该计划也提出制定后摩尔定律时代的先进计算发展路径。
二是美政府对超级计算机的规划兼顾新兴技术发展全局。政府在推动非冯计算架构创新发展的同时,审慎思考超级计算机发展定位,将超级算计算机作为未来网络基石,深度融合人工智能、量子计算等前沿技术,以更宏观的视角考虑其战略价值与后续发展路径。
三是持续投入巨量资金建设超级计算机。2014年,美国宣布投资3亿美元制造两台超级计算机;2015年,宣布使用英特尔处理器Knights Hill建设3台超级计算机,总投资超过6亿美元。2016年ECP计划中政府投入18亿美元用于研制3台E级计算机。
四是构建以应用为核心的技术生态系统。美国积极引导各级政府部门、学术界、产业界参与超级计算机应用开发。一方面政府部门提前参与规划。美国航天局、联邦调查局、卫生部、国土安全部等多部门提前参与超级计算机前期规划,根据各自应用特点提出特殊设计需求,在一定程度上保障了高性能计算机在政府部门的应用前景;另一方面通过项目引导学术研究向实际应用落地。美国推出的ECP计划提出开发15-20个包括材料科学、物理化学、能源、宇宙太空等领域的百亿亿次应用程序。
四、结语
参考文献:
[1]顾蓓蓓,武虹,迟学斌,赵青.国内外高性能计算应用发展概况分析[J].科研信息化技术与应用,2014,5(04):82-91.
[2]美国国家人工智能计划[EB/OL]. https://www.ai.gov/
[3]美国网络和信息技术研究与开发[EB/OL]. https://www.nitrd.gov/about/
[4]美国先进计算机跨机构工作组[EB/OL]. https://www.nitrd.gov/coordination-areas/high-end-computing/
[5]超级计算机Top500[EB/OL]. https://www.top500.org/
[6]DeepMind的AI预测了大量蛋白质的结构[EB/OL]. https://www.nature.com/articles/d41586-021-02025-4
[7]英伟达混合量子经典计算平台[EB/OL]. https://developer.nvidia.com/qoda
[8]美国能源部科技办公室[EB/OL].https://www.energy.gov/science/office-science
[9]美国橡树岭实验室[EB/OL]. https://www.olcf.ornl.gov/
[10]国防部高性能计算中心[EB/OL]. https://centers.hpc.mil/
[11]美国国家科学基金会-计算机与信息科学与工程[EB/OL]. https://www.nsf.gov/dir/index.jsp?org=CISE
[12]胡微微,周环珠,曹堂哲.美国数字战略的演进与发展[J].中国电子科学研究院学报,2022,17(01):12-18.
[13]2022 hamilton-index advanced industry performance [EB/OL]. https://itif.org/publications/2022/06/08/the-hamilton-index-assessing-national-performance-in-the-competition-for-advanced-industries/
[14]美国总统科技顾问委员会[EB/OL]. https://www.whitehouse.gov/PCAST/
[15]美国百亿亿次级计算项目[EB/OL].https://www.exascaleproject.org/
作者简介
白路 国务院发展研究中心国际技术经济研究所研究一室,助理分析员
研究方向:科技战略、科技安全
联系方式:bailu_801@163.com
推荐阅读
编辑丨郑实
研究所简介
国际技术经济研究所(IITE)成立于1985年11月,是隶属于国务院发展研究中心的非营利性研究机构,主要职能是研究我国经济、科技社会发展中的重大政策性、战略性、前瞻性问题,跟踪和分析世界科技、经济发展态势,为中央和有关部委提供决策咨询服务。“全球技术地图”为国际技术经济研究所官方微信账号,致力于向公众传递前沿技术资讯和科技创新洞见。
地址:北京市海淀区小南庄20号楼A座
电话:010-82635522
微信:iite_er