查看原文
其他

数据仓库架构、模型、调度、指标建设方案

秀方案 大数据学习与分享 2022-07-29
随着我们从IT时代步入DT时代,数据的积累量也与日俱增,同时伴随着互联网的发展,越来越多的应用场景产生,传统的数据处理、存储方式已经不能满足日益增长的需求。

数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。近年来,随着大数据的应用不断深入,构建企业级数据仓库成为了企业进行精细化运营的一种趋势。


从管理者的视角来看,数据仓库是赋能业务并辅助决策的一种工具,从开发者的视角来看,数据仓库是一堆数据模型的集合。数仓开发是一个系统工程,涉及数据集成、数据建模、数据开发、数据服务、任务调度、元数据管理、数据质量管理等一系列的流程。另外,由于数据跟业务是息息相关的,所以在构建数仓的时候,需要对业务有一个非常深刻的理解。


值得注意的是,数仓的建设不是一蹴而就的,也没有毕其功于一役的方法,业务的不断变化决定了数仓是在不断迭代中进行完善的。从这个层面上来讲,或许永远没有完美的数仓。由于人员的流动、业务的变化以及前期的系统性建设不足,数仓总会存在这样或那样的问题。


下面这份PPT材料帮助大家更好的理解数据仓库相关知识体系,介绍了数据仓库建设的背景、理念,重点阐述了数据仓库的整体架构和数据建模管理,以及数仓调度和指标管理,最后是实例分享。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存