查看原文
其他

观点分享 | 百度资深研发工程师陈晓宇:百度MLOps工作介绍

AIIA 人工智能产业发展联盟AIIA 2022-07-06
 9月28日,由中国人工智能产业发展联盟(以下简称“AIIA”或“联盟”)和中国信息通信研究院(以下简称“信通院”)联合举办的第二次“人工智能研发运营一体化(MLOps)技术沙龙”以腾讯会议和小鹅通直播的方式同步进行,吸引了来自互联网、软件、通信、制造等多个行业近500名专家的关注。来自百度的资深研发工程师陈晓宇就百度在MLOps方向做出的工作努力进行了介绍。



以下为演讲实录:


01 政策和技术背景


近几年来随着国内各行各业迈入智能化升级时代,数字化转型已经成为企业增加竞争力的重要手段。在此背景下,咨询机构IDC指出:截至2020年,我国的数字经济增加值已突破40万亿,预计2022年全球65%的GDP将由数字化推动。在政策上,我国政府长期高度重视人工智能产业的发展。由此可以看出,利用人工智能开展数字化转型和智能化升级已成为全球战略共识。



除了企业和政策方面,业内相关技术也在高速发展之中。数据方面,大规模训练和评测数据集、数据类型、数据采集设备越来越多样。算法层面,Tensorflow、PyTorch等深度学习框架的功能越来越完善,深度学习的工程方法也越来越多。在算力方面,GPU和CPU的市场份额逐步提升,专用的训练和推理芯片也在快速发展,各个厂家提供了面向算力设备的一些基础计算库。业内社区出现了诸如Paddle套件、TVM、NNCF等算法优化的工具链,以及EasyDL、BML、SageMaker、ModelArts等端到端的AI开发平台。根据以上不难看出,AI技术生态已经初具规模,同时还在高速发展之中


02MLOps支撑工具


为助力企业化生产和管理AI能力从而实现智能化升级的目标,百度为企业提供了AI中台和知识中台两大中台作为MLOps的能力工具。其中,AI中台作为企业技术平台的重要组成部分,由服务运行平台、样本中心、模型中心、开发平台和资产共享平台构成。



广义的AI中台,包括AI技术服务平台、AI研发平台、AI管理运行平台三大核心层级,利用MLOps的理念,百度对AI中台做出了以下设计:


(1) 实现对机器学习的全生命周期管理,样本中心和模型中心层提供了从AI开发前期的数据处理功能直至AI开发中后期的模型纳管、评估和部署功能,贯穿AI开发流程始终。


(2) 降低数据标注成本,样本中心提供了一套完整的智能标注功能,在实际生产中,数据标注量可有效降低70%以上。


(3) 降低模型开发门槛,面向不同的开发者和不同的场景,百度分别提供了全功能的AI开发平台、零门槛的AI开发平台以及场景定制开发平台。


(4) 管理训练资源,AI中台设计并实现了基础管控能力,中台可以进行账号和权限的管理、资源和存储的管理,以及资产共享的管理。


(5) 提供模型治理能力,百度首先构建了一套比较完整的模型规范,记录模型的各种信息并对用户的操作信息进行统一处理。其次,对模型的上线、下线以及归档和请求进行审核,保证审批记录可以回溯的同时将记录集成到企业内部的项目协作平台,从而更好的监控,为模型质量提供保障。


03 MLOps的理解

关于企业实现智能化升级的路径,陈晓宇认为主要有以下两个方面:


一是对于多数传统企业,缺乏相关AI专家,企业自身AI能力尚未建设完成,升级初期主要依赖外部采购的 AI 模型、应用服务等。此类企业建设路径主要分为四个阶段:第一阶段,企业引入成熟的AI能力进行管理;第二阶段,引入购买的能力和样本进行企业内部的共享和推广;第三阶段,在第二阶段基础上建设零代码AI建模能力;第四阶段,打造灵活的AI能力满足多个场景需求。


二是对于已经具备AI能力、专业的AI建模专家及算法团队的企业,该类企业聚焦于个性化AI研发,从自身的业务场景出发,在实际生产环境中进行模型的快速迭代,节省AI能力落地时间,提升企业竞争力。该类企业建设路径主要分为三个阶段:第一阶段,建设全功能AI开发平台;第二阶段,对模型实际效果进行监控和优化;第三阶段,在能力推广过程中进行资产沉淀和共享,实现模型的快速应用。


无论哪一种实现路径,对MLOps都存在着同一诉求:强调自动化、可靠性和效率的提升。



04实际案例


该案例是AI中台在电力巡检场景的应用,为解决电线线路分布广泛、户外环境复杂带来的人工巡检工作繁重问题,利用图像识别,对输电线路进行识别,包括线路起火、绝缘子脱落等进行异常检测。该服务在某电力服务公司的20余省、300多个单位进行试用,运行效率相比人工识别检测高出了几十倍。



往期推荐:




关于AIIA2021人工智能产业峰会延期举办的通知


观点分享 | 腾讯云高级工程师张加浪:AI浪潮下海量业务的智能监控


观点分享 | 渊亭科技解决方案专家黄勇:MLOps实践DataExa-Insight中台及应用


观点分享 | 中国移动信息技术中心AI项目总监孙昊:面向业务注智赋能的AI工程化探索与实践


观点分享 | 中国农业银行研发中心资深专员合松:中国农业银行人工智能工程化探索与实践


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存