如何加速算力转化为生产力?怎样夯实数字经济发展的算力底座?中国工程院院士邬贺铨近日在接受媒体专访中回答了相关问题。
邬贺铨认为,作为数字经济时代新的生产力,算力及其产业正迅速发展。下一步要提升全国算力网络的协同发展水平,让东部地区的数据更方便地传输到中西部数据中心进行运算存储,促进算力转化为更大生产力。
◇算力产业发展呈现三方面趋势:一是算力形式更加多样,算力资源需求旺盛;二是基础设施建设提速,算网融合走向深入;三是应用场景竞相涌现,产业生态进一步拓展◇我国算力布局日益优化,已基本形成京津冀、长三角、粤港澳大湾区、成渝等核心区域协调发展,中西部地区协同补充的发展格局
算力,数据的处理能力。数字经济建设背景下,算力已成为热力、电力之后新的生产力。
从手机、电脑到汽车、超级计算机、航天火箭,再到人工智能、数据中心、互联网,算力无处不在。2021 年,中国数字经济规模已经达到 45 万亿元。
算力既是信息基础设施的重要组成,也是承载数据和运算运行的平台,更是数字经济时代计算、存储、网络能力的一种综合体现。数据中心和通信网络成为重要的公共基础设施。
数据显示,截至 2021 年底,我国在用超大型、大型数据中心超过 450 个,智算中心超过 20 个。在全球算力分布中,中国位列第二,仅次于美国。其中,中国基础算力、智能算力占全球的比例分别为 27% 和 26%。
截至 2022 年 6 月底,我国在用数据中心机架总规模超过 590 万标准机架,服务器规模约 2000 万台,算力总规模超过 150EFLOPS(EFLOPS是指每秒百亿亿次浮点运算次数)。如何加速算力转化为生产力?怎样夯实数字经济发展的算力底座?中国工程院院士邬贺铨近日在接受媒体专访中回答了相关问题。
邬贺铨认为,作为数字经济时代新的生产力,算力及其产业正迅速发展。下一步要提升全国算力网络的协同发展水平,让东部地区的数据更方便地传输到中西部数据中心进行运算存储,促进算力转化为更大生产力。邬贺铨:近年来,随着各行业数字化转型升级进程加快,全社会数据总量爆发式增长,拉动了数据计算分析需求。尤其科学计算、工程计算,这些专业科研领域的数据产生量很大,对算力的要求极高。以油气勘探为例,油气勘探简单来说就是给地表做 CT。一个项目下来,分析海量的数据,需要巨大算力支撑。人工智能也是一个算力需求大户,特别“吃”算力。以深度神经网络在城市交通预测中的应用为例,我们收集每天的交通大数据输入深度神经网络进行建模,训练出的模型能够实时引导车的流量流向。深度神经网络建模的过程依赖极高的计算复杂度和存储空间,需要大量算力支撑。当初 Alphago 打败李世石用了 3000 万盘比赛的棋局作为训练数据。人工智能非营利组织 OpenAI 曾于 2018 年发布报告,提出自 2012 年以来,AI 训练任务所运用的算力每 3.43 个月就会翻倍……随着我国数字经济加快发展、数字化转型持续深入,算力应用场景持续扩大,算力赋能效应凸显。总的来看,算力产业发展呈现三方面趋势:一是算力形式更加多样,算力资源需求旺盛;二是基础设施建设提速,算网融合走向深入;三是应用场景竞相涌现,产业生态进一步拓展。
邬贺铨:从宏观的角度而言,在算力上每投资 1 元钱产生的回报是 3 至 4 元钱。以 2020 年的数据为例,我国 2 万亿元的算力产业规模直接、间接分别带动经济产出 1.7 万亿元和 6.3 万亿元,算力作为数字经济重要底座支撑的赋能作用日渐凸显。建设算力基础设施也已成为包括我国在内全球多个国家的战略选择。今年 2 月,国家发展改革委等 4 部门联合印发通知,同意在京津冀、长三角、粤港澳大湾区等 8 地启动建设全国一体化算力网络国家枢纽节点,并规划了 10 个国家数据中心集群,“东数西算”工程正式全面启动。目前我国算力布局日益优化,已基本形成京津冀、长三角、粤港澳大湾区、成渝等核心区域协调发展,中西部地区协同补充的发展格局。8 个全国一体化算力国家枢纽节点建设的定位有所不同。贵州、内蒙古、甘肃、宁夏主要打造面向全国的非实时性算力保障基地,不断提升算力服务品质和利用效率,充分发挥能源和资源优势,夯实网络等基础保障,承接全国范围的后台加工、离线分析、存储备份等非实时算力需求。京津冀、长三角、粤港澳大湾区、成渝四个节点主要服务于重大区域发展战略实施需要,定位于进一步统筹好城市内部和周边区域的数据中心布局,实现大规模算力部署与土地、用能、水、电等资源的协调可持续发展,优化数据中心供给结构,扩展算力增长空间。根据规划,到 2023 年底,利用率方面,全国数据中心平均利用率力争提升到 60% 以上;算力规模方面,总算力规模超过 200EFLOPS,高性能算力占比达到 10%;能效水平方面,新建大型及以上数据中心 PUE(数据中心消耗的所有能源与其 IT 设备消耗的能源的比值即能源使用效率)降低到 1.3 以下,严寒和寒冷地区力争降低到 1.25 以下;网络时延方面,国家枢纽节点内数据中心端到端网络单向时延原则上小于 20 毫秒。问:如何提升全国算力网络的协同发展水平,让东部地区的数据更高效地传输到中西部数据中心进行运算?邬贺铨:当前大部分的算力需求集中在数字经济发展较为发达的东部沿海地区。东部产生的数据有冷、热之分:热数据主要是实时性计算数据,冷数据是非实时性计算数据,例如去年前年产生的数据。从能源角度看,西部自然资源禀赋比较适合构建算力基础设施,因此可以把冷数据存放在西部。在“东数西算”推进过程中,需要进一步加强东部和西部算力枢纽、数据中心的协同。在西部,一个数据中心全天 24 小时持续工作,但不代表一直在计算,数据存储是常态。因此从某种意义上讲,“东数西算”实际上是“东数西存”。但由于缺乏协调机制,西部一些算力枢纽不知东部将有多少冷数据要存到西部,是放在宁夏还是放在贵州或其他枢纽,需要做好规划协调工作。一些东部城市存在倾向于将冷数据留在身边方便使用的现象,为此,需要建立“东数西算”跨域数据中心能力的协调,避免存、算资源不匹配。要实现算力资源的最优配置,除正在推动建设的“东数西算”工程之外,还要构建算网协同体系,让算力最经济地适应数字经济的发展需求。一是算与网的资源协同调度。通常算与网的运营主体不同,而且互不感知对方的需求与能力,需要采用能够提升我国互联网承载能力和服务水平的下一代互联网协议 IPv6 等技术来感知客户需求并优化对算力节点的选择;二是各数据中心间协同。包括同一数据中心内主备的配置和异地灾备,数据中心间的光纤传输容量及双路由的合理规划等;三是跨行政区域的算力协同。如东西部地区的数据中心如何配对协同等;四是在管理上,地方政府加强包括土地、公用能源、电力设备等“源网荷储”的优化协同;五是能源布局与算力布局的协同。在满足东部算力需求的同时带动西部地区数字经济和产业发展等。
邬贺铨:首先是继续推动人工智能算力发展,夯实人工智能算力基础设施。近年来,我国人工智能技术快速发展、应用场景不断拓展,人工智能算力中心也迎来了迅猛发展势头,天津、成都、上海纷纷建设本地的智算中心。在 2021 年的算力分布中,在基础算力、智能算力、超级计算的三类算力里面,美国分别占全球 35%、15%、30%,中国分别占 27%、26%和20%,美国是基础算力为主,中国智能算力规模超过美国。今后应继续加强人工智能算力基础设施建设,为人工智能推动实体经济数智化升级提供算力支撑。其次,健全数字化生态,激发数据中心应用需求。当前我国企业数字化转型不敢转、不想转的问题依然存在,消费数字化场景应用有待深入、行业数字化应用场景待探索,数字化营商环境需持续优化。一些地方政府开放数据与应用场景及算力资源,鼓励互联网平台企业与中小企业合作,提供包括咨询、设计、制造、验证、实施、运营的完整云服务解决方案,以此降低算力的使用门槛,解决企业上云难题。将算力转化为生产力,才能推动企业数字化转型步伐,创造更大商业价值。第三,数据中心产业链需要延伸和优化。作为重资产行业,数据中心的投入回报慢。过去,西部地区发展数据中心多是以出租数字空间为主的模式,出租机架、服务器托管,增值服务较少。产业链应用和市场两头在外,数据采集、清洗、挖掘、分析等服务环节发展不足,导致数据要素发展潜力难以得到充分释放。未来西部数据中心可围绕中心环节,延伸产业链,提供更多增值服务:一方面向上游扩展,进行数据预处理,包括数据的标注、清洗、脱敏等;另一方面向下游延伸,包括生产服务器、边缘计算以及承接工程运维服务等,还可以向大数据挖掘与应用发展。第四,提升绿色发展水平。双碳背景下,节能减排是算力产业发展进程中绕不开的话题。从长远来看,整个社会需要算力与连接构成的“数字底座”,也需要清洁能源与绿色技术构建的“绿色底座”,二者要协同发展。目前数据中心的能耗大约占全社会能耗的 2%,并且能耗还在增长,这要求我们使用更先进的节能技术,引入更多绿色清洁能源等。在建设数据中心时需要关注 PUE 值,同时还需要努力降低IT设备的能耗。值得一提的是,PUE 值低并不代表碳排放低。我们更应该追求的是提升可再生能源使用比例的低 CUE(数据中心 CO2 总排放量与 IT 设备消耗能源的比值)。算力基础设施建设方面,还需要补齐芯片、操作系统等方面的关键技术短板和人才的不足,这需要长时间努力。