查看原文
其他

2021年,中国超算能否重回全球第一?

光子盒研究院 光子盒 2021-12-15
光子盒研究院出品 


2020年全球超算TOP500榜单,日本“富岳”连夺两冠,中国超算自2013年以来首次跌出全球前三。
 
过去十年,中国超算风光无限。2009年国防科技大学研制成功“天河一号”,使我国成为继美国之后世界上第二个研制成功千万亿次计算机的国家;2010年11月,升级后的“天河-1A”系统首次冲上全球超级计算机榜首。
 
2013年6月开始,“天河二号”连续6次位居TOP500首位,2016年底第一次由全国产CPU的“神威·太湖之光”取代第一的位置,帮助中国超级计算机连续10次蝉联冠军。
 
2018年6月,美国计算机Summit以峰值速度每秒20亿亿次取代“神威·太湖之光”成功登顶。自此,中国超算已经三年没有问鼎,甚至跌出全球前三。进入新一个十年,中国超算能否重回全球第一?
 

超级计算机(Supercomputer)是指能够执行一般个人电脑无法处理的大资料量与高速运算的电脑,其基本组成组件与个人电脑的概念无太大差异,但规格与性能则强大许多。
 
20世纪70年代末,中国决定研制第一台超级计算机(巨型机),至今已有40余年。中国超算40年,前30年厚积薄发,后10年则一鸣惊人。
 
世界第一台超级计算机CDC6600于1963年在美国问世,运算速度每秒300万次,这在当时是绝无仅有的高速。1976年,美国克雷研究公司研制成功“克雷-1”,把超算带入了亿次时代。随后日本也研制出自己的亿次超级计算机。
 
相比之下,1978年中国研制的通用计算机系统151-4,运算速度不过每秒二百万次。
 
1975至1977年,长沙工学院(国防科技大学前身)计算机研究所所长慈云桂两次率领科研人员进行高性能计算机的调研活动。气象部门急需巨型机做中长期天气预报,航空航天部门急需巨型机减少昂贵的风洞实验经费,石油勘探部门急需巨型机进行三维地震数据处理……
 
慈云桂带队调研时,石油勘探部门领导指着大厅中央玻璃房内的机器说,这是美国高价卖给我们的一台落后设备,还有附加的一大堆条件。一是为机器修建一间专门的机房,二是使用维修人员必须由美国公司派遣,三是中方人员严禁入内,计算数据只能交由美方人员处理。
 
这件事深深刺痛了年至花甲的慈云桂,激发了他自主研制巨型机的决心。
 
1978年全国科学大会在北京召开,邓小平在这次会议上拍板决策“中国要搞现代化,不能没有巨型机。”这一任务下达给了国防科技大学,慈云桂立下军令状:每秒运算一亿次一次不少;研制时间一天不拖;预算经费一分不超。
 
5年时间,慈云桂带领研发团队突破关键技术,完成整体设计,把整机系统的250万个焊点一个个焊起来。1983年,“银河-Ⅰ”巨型机研制成功,让中国成为继美国和日本后世界上第三个可以自主研制巨型计算机的国家。
 
这台计算机也因此得一别名:“争气机”,慈云桂也被誉为“中国巨型计算机之父”。
 
银河-Ⅰ
 
但是中国超算的征程才刚刚开始,1980年代初,业界开始转向大规模并行运算系统,这时的超级计算机由成千上万的普通处理器所组成。中国再次落后美国和日本。
 
1986年年初,国防科技大学申请研制“银河-Ⅱ”10亿次巨型计算机,1992年,“银河-Ⅱ”研制成功,实现了从向量巨型机到处理并行巨型机的跨越,成为第三个实现10亿次计算机的国家。
 
但是超算的发展日新月异,“全球超算TOP500”排行榜从1993年开始发布,整个90年代中国都无缘前十。
 
在这个空白期内,“曙光”超级计算机开始异军突起。1990年,国家智能计算机研究开发中心正式成立。曙光一号研发过程中,当时智能中心的主任李国杰主导了全新的技术路线和科研模式。
 
李国杰派了一支6人小队到美国硅谷,利用国外协作配套完善的大环境,加速并行计算机的研制。同时,在国内首次采用大规模集成电路来研制并行计算机。研发团队在UNIX源代码的基础上,自行设计并行操作系统SNIX。
 
1993年10月,曙光一号超级计算机诞生,峰值运算速度达每秒6.4亿次,在多个技术上都取得了突破,比如采用全对称共享存储多处理结构、操作系统核心实现并行化。
 
而且曙光一号投资少(直接研制经费只有200万元)、研制周期短(从正式开发到成果鉴定只有一年半)、产品化程度高,与中国过去的超级计算机研制形成鲜明对比。
 
随后,智能中心又推出了曙光天潮系列(含曙光1000和曙光1000A),并在经过产品化后逐渐走上商品化销售的道路。实现了国产超级计算机商品化零的突破。
 
2004年和2008年,曙光公司分别研制成功了“曙光4000”十万亿次计算机与“曙光5000”百万亿次计算机,分别进入TOP500排名前十位。这是中国超级计算机首次进入世界前十。
 
2008年,中国刚迈入百万亿次的大门,美国已经实现了千万亿次,IBM研制的“走鹃”超级计算机,峰值运行速度每秒1015万亿次,勇夺当年的世界第一。
 
恐怕所有人都没有料到,只过了一年,国防科技大学和浪潮联合研制的天河一号,峰值运行速度1206万亿次,诞生了中国首台千万亿次超级计算机,排在超算TOP500的第五位。天河一号采用了全新的多阵列可配置协同并行的体系结构,从而实现了系统性能的提升。
 
2010年,中国超算迎来历史性时刻。天河-1A在天津超算中心升级完成,以峰值速度(Rpeak)每秒4700万亿次浮点运算、持续速度(Rmax)2566万亿次,超越克雷公司研制的美洲虎超级计算机,帮助中国首次摘得全球超算的桂冠。
 
天河-1A
 
2011至2013年,天河-1A相继被日本的“京”、美国的“泰坦”(世界上第一台以通用GPU为主要数据处理单元的超级计算机)和“红杉”等超级计算机赶超。
 
但是随着2013年天河二号的诞生,中国超算再次成为全球冠军,比第二名泰坦快近一倍的速度,此后五年(TOP500榜单每年发布2次)超算冠军的头衔再无旁落。
 
中国超算强劲的势头,引起了美国的注意。2015年,美国将国防科技大学和三个国家超算中心列入到实体清单里。采用英特尔至强处理器的天河二号,原定的升级计划马上被打断。
 
但是,中国仍然牢牢占据全球超算的榜首,2016年6月江南计算技术研究所使用中国自主芯片“申威”制造的“神威·太湖之光”取代“天河二号”登上榜首。“神威·太湖之光”结束了中国只能依靠西方技术才能在超算领域拔得头筹的时代。
 
这一时期中国超算的整体实力也大幅提升,TOP500中来自中国厂商制造的超级计算机数量2015年6月仅37台,到2016年11月达到168台,首次在数量上超过美国,再到2018年11月达到227台,占据TOP500的半壁江山。
 

遗憾的是,2018年6月“神威·太湖之光”丢掉了第一的位置,取而代之的是美国IBM的20亿亿次计算机Summit。此后,“神威·太湖之光”仍然稳居前三,直到2020年6月日本超级计算机“富岳”的出现。
 
作为“京”的后继机型,富岳(Fugaku)于2014年继续由富士通与日本理化学研究所共同开发,部署在理化学研究所计算科学研究中心内,原本预计于2021年正式运行,它的提前亮相将世界上最快计算机的速度提升了近3倍,还把中国超算挤出前三。
 
富岳也是世界上第一台半E级(百亿亿次)计算机,峰值速度每秒53.72亿亿次,持续速度44.20亿亿次。在业界普遍认为更接近实际应用场景的HPCG(高性能共轭梯度基准测试)中达到了16亿亿次,这个数字是第二名Summit的5倍多。
 

富岳的出现使得ARM架构首次在超算榜单中登顶,它采用富士通研发的A64FX处理器,这款处理器集成了52个核心,配备32GB HBM 2内存,带宽1TB/s,浮点性能2.7万亿次,使用7nm工艺生产,一个芯片上集成了87.86亿个晶体管。
 
但算力的提升并非没有代价。富岳的双精度浮点性能是Summit的2.8倍,从功耗上看也是Summit的2.8倍。因此在性能功耗比这项属性上,富岳相对于Summit并没有提升。
 
必须指出的是,Summit的IBM Power9是14nm工艺,NVIDIA GV100是12nm工艺。在处理器工艺领先一代的情况下,富岳的性能功耗比并没有提升。作为对比,2016年“神威·太湖之光”夺冠时,在绝对性能和性能功耗比两项参数上都有明显提升。
 
值得一提的是,“神威”项目于2014年3月科技部正式立项,2015年12月31日主机研制成功,虽然没有对外公布具体制程,但外界推测,其处理器很可能采用了中芯国际的28nm制程工艺。
 
根据台积电对制程的描述,7nm芯片相比28nm速度增加20%,功耗降低40%。想象一下如果神威也采用7nm制程,全球超算榜首还不一定鹿死谁手。
 
富岳还面临着制造成本过于高昂的问题。据透露,富岳的造价约为10亿美元,而排名第二的Summit造价为2亿美元,排名第四的神威造价为2.73亿美元。
 
根据富士通的规划,富岳只是阶段性成果,下一步计划升级到1百亿亿次(E级)。中科院计算所、中国计算机学会高性能计算专委会秘书长张云泉在采访时表示:“富岳以E级超算的未完成形态冲榜,旨在打中美E级超算一个时间差,短期成为‘独孤求败’,但等到中美E级超算一出,就会变成‘独孤必败’。”
 
而中美E级超算的亮相,很可能就在今年。
 
2021年是业内公认的E级超算元年。美国“极光”是世界上首个E级超算项目,从2015年开始投入2亿美元打造,计划于2021年在阿贡国家实验室上线。此外,橡树岭国家实验室也计划在2021年上线“前沿”(Frontier),利弗莫尔国家实验室则计划2022年上线“El Capitan”,这些均为E级超算。
 
中国也同时启动了三大E级超算的研发,分别是国防科大和天津超算中心的天河三号、中科曙光的E级超算以及江南所和济南超算中心的神威E级超算。
 
天河三号采取的技术路线与富岳类似,都是基于ARM构架处理器;中科曙光则选择了类似于美国主流超算的CPU+GPU技术路线;神威采用的是众核异构体系。中国三大项目囊括了当今世界E级超算的三大技术流派,而且核心处理器都是国产的。
 
其中,天河三号原型机2018年7月以来已开放应用,已为多个合作单位完成了大规模并行应用测试,涉及大飞机、航天器、新型反应堆、电磁仿真等领域数十款大型应用软件。神威E级原型机和曙光E级原型机系统也己完成交付。
 
天河三号原型机
 
下一个第一,不出意外的话应该会在中美6台E级超算中产生。
 

在张云泉博士看来,随着超算与云计算、大数据、AI的融合创新,算力经济已经登上历史舞台。实际上,中国超算已经走过了以政府主导的机器研制带动应用发展的阶段,正在进入以应用需求引领系统研制的理性阶段。
 
在863计划相关重大项目的支持下,我国先后重点支持了物理化学、天文、气候气象、生物医药、新能源、流体仿真、大飞机、石油勘探地震成像等领域的超级计算应用,研制出一批自主知识产权的重大行业应用软件系统。


中国国家网格目前已经接入6个国家超级计算中心:无锡中心、天津中心、济南中心、深圳中心、长沙中心和广州中心。而且,还有独立运行的上海超级计算中心等一系列商业化超算服务建立起来。各行业、各高校也趋向于统一建设高水平的超算中心,面向用户提供集约化的超算服务。
 
但与强劲的算力相比,应用仍是中国超算发展的主要短板。超算应用的生态环境尚未建立起来,除了维持超算系统的建造技术领先地位,还需构建一个涵盖系统硬件(包括高端芯片和其他核心器件)、系统软件、开发工具、应用软件甚至包括人才队伍的超算生态环境。
 
虽然神威、Summit、富岳连续三任冠军采用的芯片架构都不是X86,但在TOP500榜单中仍有九成以上的超级计算机采用X86 CPU架构,目前的应用生态是建立在X86架构之上的。
 
而从目前中美两国在E级超算领域的技术总结来看,张云泉认为,异构众核是未来E级超算的不二之选。日本富士通采用的基于ARM处理器的AF64X就是典型的异构众核,大概有四个分区,每个分区有一个主核与12个从核,整个处理器共计52众核。
 
换句话说,E级超算有希望重构应用生态,这是中国超算的重要机遇。
 
尽管我们还没有进入E级时代,但是业界已经在考虑后E级时代的算力提升。首先,半导体工艺已逐步逼近其物理极限,传统冯·诺依曼架构的瓶颈日益凸显。其次,超级计算机能耗巨大,据估计,若不改变设计方式,到2040年,全球超算需要的电力将超过全球的发电量。
 
目前,量子计算机被普遍认为是下一代计算机,但在量子计算机全方位实现“量子优越性”之前,全球超算的竞争仍将愈演愈烈。
 
参考:
[1]中国超算产业发展现状分析, 历军, 曙光信息产业股份有限公司
[2]E级超算元年将至, 中国三条技术路线冲顶, DeepTech深科技

相关阅读:
从超算到量子计算,我们需要更多的慈云桂

#光子盒社群招募中#

进入光子盒社群,与我们近距离互动,了解量子领域更多产业、商业、科技动态,领取量子技术产业报告。
 
现添加社群助手微信Hordcore即可进群 ,与我们一起展望未来!

你可能会错过:

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存