DataOps 在联通数科的实践 构建数据治理研发运营一体化能力
导读 本文将分享联通数科如何利用 DataOps 构建数据治理研发运营一体化能力。
主要内容分为四个部分:1. DataOps 实践的困难与挑战
2. 关于 DataOps 体系建设的一些思考
3. 8 个中心构建一体化协同机制
4. 总结与展望
分享嘉宾|谭晟中 联通数字科技有限公司 总监
编辑整理|汪维
内容校对|李瑶
出品社区|DataFun
数据工具的集成。DataOps 相关的数据工具众多,企业在建设数据中台初期,由于没有合理的产品规划,通常会面临众多自研、开源产品的集成问题,这也是间接导致数据流转链路不清,用户对平台操作复杂程度高的原因。 数据分布复杂。多种数据源类型、结构化与非结构化数据并存为 DataOps 构建带来的难题。 数据治理。数据治理、数据安全介入的时机偏向数据加工后期,导致无法持续高价值产出满足企业要求的数据结果。 用数的难度大。数据治理研发的过程,往往存在需求不明确的情况,而且对于人才的要求也逐步提高。基础数据研发人员既要业务思维,也要有一定技术能力,甚至还要具备对数据科学相关知识了解的能力。2023 年开始火热的大模型 AIGC 的能力,也会影响数据治理研发的过程,使得整个数据处理的加工周期越来越长。
DataOps 体系建设思考
一套方法论:创新数据治理七步法。这是联通以及联通数科现在秉持的方法论,在整个数据运营体系里面占有核心地位。基于这套方法论,通过明确场景、识别数据、认定来源、治理数据、汇聚数据、使用数据、提升质量,形成一个完整闭环,从而构成数据研发、持续交付、持续运维、持续运营的完整过程。 一套规范:构建管理制度和标准规范。执行国家相关法律法规政策,遵循行业标准及联通集团的相关规则,建立由“1+12+N”制度框架和“1+10+N”企标框架组成的“一套制度规范”体系,在集团层面统一构建管理制度和标准规范,上下贯通、刚性执行,全面提升数据治理成效。 两个平台:一体化数据资产管理平台和一体化数据安全管控服务平台。其中,前者是基于上述方法制度及方法论进行打造的,是能够充分支撑数据治理、数据开发、数据分析、数据运营的工具平台。后者则是管控服务平台,安全是底线,也是红线,数据治理的首要要求就是数据安全,数据安全平台覆盖了数据采集、传输、存储、处理、交换以及销毁的全生命周期,形成了对数据安全的整体把控。
8 个中心构建一体化协同机制
总结与展望
分享嘉宾
INTRODUCTION
谭晟中
联通数字科技有限公司
总监
1998 年本科毕业于北京理工大学,2005 年获得复旦大学工程硕士学位,2019 年 10 月加入联通数字科技有限公司数据智能事业部(原联通大数据有限公司),任职专业总监,主要负责联通数一体化数据资产管理平台产品研发、对外交付和数据治理实施。
具备 20 年以上政府、大型国企、外资企业的信息系统、数据中心、大数据项目规划、数据治理项目实施工作经验,10 年以上微软、联想等世界500强企业工作经历,服务过包括国家税务总局、索尼(中国)、联想集团、国家统计局、上海世博会、上汽集团、国泰君安、海通证券、中体彩等大型客户。
聚焦于大数据及数据治理相关行业,具备多年政企、智慧城市、金融、企业等行业数据治理项目平台交付与实施经验,在多个省部级政府项目和大型企业项目中负责数据湖仓规划、数据治理、数据开发与服务等工作,交付省部地市各级政务类大数据平台及数据治理项目 50 余个,对企业级数据仓库规划与治理有着深刻理解。擅长 DCMM 评估、DAMA 管理体系、数据治理规划、大数据平台数据治理、研发与交付等方面的咨询及实施。
往期推荐
大模型微调方案设计和能力整合
金融级实时数仓建设实践
理想汽车基于Flink on K8s的数据集成实践
大数据安全治理与防范——网址反欺诈实战
货拉拉大数据新一代基础架构实践与思考
如何实现 DataOps 开发、运营、治理一体化
蚂蚁 TuGraph-DB 数据库查询引擎技术
字节跳动基于 DataLeap 的 DataOps 实践
大模型分布式训练的第四种境界
点个在看你最好看
SPRING HAS ARRIVED