观点分享 | 中国移动信息技术中心AI项目总监孙昊:面向业务注智赋能的AI工程化探索与实践
9月28日,由中国人工智能产业发展联盟(以下简称“AIIA”或“联盟”)和中国信息通信研究院(以下简称“信通院”)联合举办的第二次“人工智能研发运营一体化(MLOps)技术沙龙”以腾讯会议和小鹅通直播的方式同步进行,受到了来自互联网、软件、通信、制造等多个行业近500名专家的广泛关注。中国移动信息技术中心(以下简称“中移信息”)AI项目总监孙昊以“面向业务注智赋能的AI工程化探索与实践”为主题发表演讲,从总体背景、AI工程化实践思路、AI平台和业务赋能四个方面进行了分享。
以下为演讲实录:
中国移动为实现“加速数智化转型,共创数字空间新世界”的目标,提出了创新数智化产品、夯实数智化网络、打造数智化中台、构建数智化组织和构筑数智化生态的五个数智化转型关键行动。其中,数智化中台作为基础设施,构建具有运营商特色、中国移动特点的“业务+数据+技术”智慧中台,汇聚信息技术和数据要素资源,形成支持创新的能力基座,旨在为整个智能化体系注智赋能。为此,中移信息基于IT云资源池和省端资源池打造了大规模AI资源池,向上支撑形成了全方位赋能的AI平台。通过该平台研发、合作引入CV、NLP等不同领域优质AI能力,进一步助力不同领域业务,从而帮助企业实现增长营收、降本增效和智能化管理目标。
人工智能的三大基础要素包括数据、算力和算法。在数据方面,中移信息构建了面向AI场景的数据处理基础,支持多种渠道的数据采集,并提供了数据存储、数据处理和数据管理的相关工具与流程。为了提升数据质量,中移信息着重在文本类数据的消歧和图片类数据的权重化等方向做出了努力,并提供了一套标准化的数据标注模板,有效提高了后续模型训练的质量和效果。在算力方面,中移信息基于大规模算力资源池分布,以磐基PaaS为统一技术底座,打造了云边协同架构。分布式算力资源为大规模机器学习模型训练提供了算力支撑,同时其云端管理节点可以根据业务特性灵活调整模型部署。此外,在AI资源方面,中移信息还引入了GPU、国产化芯片等AI算力资源,采用了异构资源调度方案和GPU资源虚拟化技术,有效提升了资源利用率。
对于上层AI平台,在AI能力研发环节,针对不同业务需求,中移信息将用户分为AI专业人员和AI初学者两种角色。平台为AI专业人员提供标注工具、交互式建模和可视化建模工具,并支持一键部署和镜像打包部署;为AI初学者特别提供自动标注、自动学习、自动部署和能力编排工具,以满足两种角色均能完成从数据标注、模型研发、模型部署到服务编排的全栈式研发。在运营和运维环节,中移信息首先建立了由集团到省到分公司自上而下的运营管理机制,明确分工,协同发展;其次构建了AI平台计量和计费机制,从而反哺源头,实现技术创新;最后为推动业务落地,进行了业务推广、人员培训和能力分享,提高了整个团队的研发能力和水平。基于以上设计,中移信息建立了以项目需求、研发和运维为一体的标准化流程。
目前,统一AI平台涵盖五大核心板块:标注平台、学习平台、推理平台、能力超市和运营管理,提供了数据标注、模型训练、推理部署和能力开放的AI模型全生命周期管理服务,同时实现了用户、项目、资源、数据及权限的统一管控。统一AI平台以精准营销、精细服务、精确管理、精益运维、产品创新的理念赋能了全网51项成熟解决方案: