其他
腾讯云发布:大模型算力集群!
刚刚,腾讯云发布
新一代HCC高性能计算集群
采用最新一代星星海自研服务器
搭载NVIDIA H800 Tensor Core GPU
基于自研网络、存储架构
带来3.2T超高互联带宽
TB级吞吐能力和千万级IOPS
实测结果显示
新一代集群算力性能较前代提升3倍
去年10月,腾讯完成首个万亿参数的AI大模型——混元NLP大模型训练。在同等数据集下,将训练时间由50天缩短到11天。如果基于新一代集群,训练时间将进一步缩短至4天。
大模型进入万亿参数时代,单体服务器提供的算力有限,需要将大量服务器相连,协同优化单机算力、网络架构和存储性能,打造大规模、分布式的高性能计算集群。
计算层面
服务器单机性能是集群算力的基础,新一代集群的单GPU卡在不同精度下,支持输出最高1979 TFlops的算力。
针对大模型场景,星星海自研服务器采用6U超高密度设计,相较行业可支持的上架密度提高30%;利用并行计算理念,通过CPU和GPU节点的一体化设计,将单点算力性能提升至更高。
网络层面
存储层面
依托分布式云原生的治理能力,腾讯云智算平台提供16 EFLOPS的浮点算力,规模业界领先。
以新一代集群为标志,基于自研芯片、星星海自研服务器和分布式云操作系统遨驰,腾讯云正通过软硬一体的方式,打造面向AIGC的高性能智算网络,持续加速全社会云上创新。
点击阅读原文,申请内测新一代HCC集群
刚刚!打破世界纪录