《数据中心白皮书(2022年)》摘录
来源:中国信息通信研究院,数据中心白皮书(2022年),2022年4月
高密服务器研发部署加快,单位面积算力提升
数据规模的持续增长及土地、电力资源集约化发展推动高密度数据中心发展。
在过去很长一段时间,为了满足不断增长的用户数据处理需求,数据中心主要是通过增加空间,扩大机架和服务器规模来提供更多算力,但是这也会导致数据中心运营成本的增加和数据中心场地空间的浪费。
经济发达地区日益紧张的土地资源使得以扩大服务器规模来提升算力规模的数据中心建设模式难以开展,建设高密度数据中心成为提升数据中心算力水平的重要举措,高密度数据中心能够进一步增加数据中心“每平方米”的计算能力,能够更好地满足大数据场景下的计算与存储需求。
高密度服务器部署显著提升数据中心单位面积算力,降低数据中心运营成本。
建设高密度数据中心的关键是部署高密度服务器,与传统服务器不同,高密度服务器电源和风扇多以共享方式进行设计,位于同一机箱内的多台服务器节点可以共享电源和风扇。
上述方式,一方面降低了机体的重量和空间占用,提升数据中心单位面积算力,另一方面能够提升电源和散热系统的使用效率,降低数据中心运营成本。
随着数据中心功率密度的提升,数据中心平均机架功率也在不断提升,有研究机构发布数据3显示当前全球5-9kW/rack 的机架占比最多,功率超过10kW/rack 的机架占比达到近30%,单机架功率的提升与高密度服务器规模部署和应用密切相关。
当前,Intel、IBM、华为、浪潮、曙光等厂商纷纷加速推进高密度服务器的产品设计与市场布局。
新存储访问协议不断演进,网络存储深度融合
NVMe-oF 协议成为全闪存端到端重要解决方案,存储与网络融合进一步加深。
NVMe over Fabrics(以下简称NVMe-oF)成为降低存储网络协议栈处理开销并实现高并发、低时延的重要技术,其解决了存储由于通信协议而造成性能损失的问题,进一步释放 SSD 的性能,加速了闪存的发展。
NVMe-oF 使得主机和存储设备可以通过网络使用NVMe 协议,有效地提高了主机通过远程网络访问存储的性能,引起了业界广泛关注。
当前,包括 FC 网络、IB 网络、无损网络、标准以太网等均支持NVMe-oF。
其中,无损网络作为业界关注的焦点之一,近年来取得了长足发展。
其在性能上大幅优于标准以太网,在建设成本方面低于 FC 网络和 IB 网络。
因此,在 NVMe与网络融合发展的过程中,无损网络或将成为重要的发展方向。
泛在算力互联需求将增多,算力网络创新加速
算力网络连接泛在算力基础设施,运营商积极开展落地实践。
金融、交通、教育、工业等行业对泛在算力场景的需求不断增长,用户需要随时随地可接入的更优惠、更高质的算力服务,基于算力泛在使用和交易需求衍生的算力网络成为下一代算力基础设施发展的重点。
近年来,运营商加速推动算力网络落地实践。
算网一体是中国联通CUBE-Net3.0 重点方向之一,中国联通在全国多地开展算力网络建设试点,通过算力网络业务链、网络切片、资源感知实现算力资源调度和感知,形成云网安一体服务。
中国电信在算力网络建设过程中重点强调“云”为核心,侧重网络、算力和存储三大资源相互融合,推进天翼云持续升级,实现天翼云节点和天翼边缘节点统一管理调度,云网融合、云边协同是电信云的优势。
中国移动重点改造底层算力基础设施,基于X86 和ARM 架构打造通用算力网络,同时基于GPU、ASIC 不断丰富智能算力。
算力网络技术创新主要集中在架构、调度技术及度量方式三个方面。
在算力架构方面,传统计算与网络分离模式逐渐向计算与网络融合方向演进,算力基础设施融合架构创新发展。
在算力调度技术方面,算力调度由之前仅支持对网络的调度发展到算力与网络匹配的调度模式,算力调度技术创新不断涌现。
算力调度技术创新主要包括算力跨区域调度、多层次调度、算力资源统一编排、网络协议、可视监测及智能运维等。
在算力度量方式方面,算力与网络度量内涵不断延伸,算力度量方式由单一节点度量转变为一体化协同度量。
随着算力网络的形成,用户算力获取来源变得更加多样,在这种情况下,用户可获取的算力就不能以单一或局部节点来衡量,而是以算力网络平台当前可供给的且满足用户业务需求的算力来衡量,这种新的一体化协同度量机制将对用户可用算力进行重新核定。