泰尔英福支撑“算力浦江”分布式智能算力网络研讨会顺利召开
5月30日,“算力浦江”专委会组织召开分布式智能算力网络研讨会,本次大会旨在更好地落实工业和信息化部等六部门印发的《算力基础设施高质量发展行动计划》以及上海市通信管理局等十一部门印发的《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案》,实施智能算力高效率调度,聚焦跨区域模型训练。
会上,泰尔英福焦臻桢博士首先介绍了面向新一代人工智能的分布式算力网络试点试验的整体思路:首先对本次试点试验的背景和目标进行了汇报,对当前人工智能大模型发展给算力带来的挑战,以及如何基于我国算力网络建设为大模型算力需求提供进一步支撑等思路进行了汇报,并着重介绍了本次试点试验开展的相关研究工作,包括基于算力网络跨域联合训练的大模型高效并行策略、面向分布式联合训练的跨域网络优化、面向多方联合的数据安全隐私保护等。该试点试验由中国信通院、同济大学、国家(上海)新型互联网交换中心牵头,并联合了华为上海公司、上海联通、有孚网络共同开展。
随后,由同济大学介绍了基于国家(上海)新型互联网交换中心算力平台开展的最新工作进展,即大模型跨域分布式训练研究情况:目前研究团队已基于大模型混合并行框架,在分布于不同运营商和地理位置的多个算力集群间的数十张GPU上进行了中小型规模的大模型跨域联合训练实验,已初步验证了大模型跨域训练的技术可行性,并获取部分性能参数,验证了大模型跨域分布式训练能够作为算力网络的潜在应用场景继续推进,该项工作未来将有利于提升我国算力资源的利用效率,进一步促进算力网络的应用和发展。
各与会企事业单位智算领域相关技术专家就分布式智能算力网络工作发表意见建议,深度研讨。
最后,上海市通信管理局对会议情况进行总结,充分肯定了当前分布式智能算力网络试点试验工作,同时介绍了“算力浦江”智算行动主要内容,就构建智能算力跨节点无损网络、探索模型分布式匹配跨节点算力资源、依托隐私计算结合算力标识进行算力度量等重点技术趋势发表意见。最后,针对下一步工作提出三点建议,一是要进一步扩大分布式智能算力网络试验规模,从同架构跨域、单节点跨架构、跨域跨架构等多维度探索;二是要注重科学理论研究与实践探索相结合,希望能通过联合实验室等总结试点经验,形成科研成果;三是要进一步扩大分布式智能算力网络生态圈,希望有更多的国内顶尖机构参与到该项工作中,共筑上海算力发展高地。
中国信通院(工业互联网与物联网研究所、泰尔英福、华东分院)、清华大学、同济大学、上海人工智能实验室、上海电信、上海移动、上海联通、国家(上海)新型互联网交换中心、华为上海公司、有孚网络、阶跃星辰、无问芯穹、基流科技等企事业单位参加会议。
延伸阅读