查看原文
其他

数据中台初探与应用实践

徐桢虎 技术琐话 2021-08-09
本文是【技术琐话公益直播】4月28日晚分享嘉宾徐桢虎在线直播中主题《数据中台初探与应用实践》内容整理,内容有删减调整,直播回放见之前的分享。

 1 

为什么需要数据中台



当企业发展到一定规模时,数据是否能够创造价值显得尤为重要。如果没有从业务的角度对数据进行规划,再多的数据也没有用。一个企业业务与数据双中台的战略地位是相辅相成的,需要打造数据与业务的闭环。

  • 数据增值:对数据做统一规划、管理、深度挖掘,实现数据到资产的增值;

  • 数据流通:高价值数据资源的整合、积累、流通,提升数据处理能力;

  • 业务创新:打破技术隔阂,构建智能化技术引擎,提高业务效率和创新能力。

数据中台的核心价值为优化现有业务和实现新业务的转型,打造数据驱动的智能化企业。
业务价值
  • 以客户为中心进行精细化运营

  • 以数据为基础支撑商业模式创新

  • 打造持续增值的数据资产

技术价值
  • 应对不同数据处理的需求

  • 对数据资产进行标签化应用

  • 快速复用数据服务

  • 快速定位数据血缘链路




 2 

什么是数据中台

传统数据仓库,第一次明确了数据分析的应用场景应该用单独的解决方案去实现,不再依赖于业务的数据库。这个阶段主要是IBM、oracle的产品的黄金年代。但是进入互联网时代后业务发展太快,数据量剧增,传统数据仓库逐渐没落。为什么传统数据仓库效率这么低?自顶向下建模。


数据湖(Data Lake)是一个以原始格式存储数据的存储库或系统。以google发布的三篇论文为基础实现的hadoop开源项目的出现大数据平台是面向数据研发场景的,覆盖数据研发的完整链路的数据工作台。


大数据平台像一条设备流水线,经过大数据平台的加工,原始数据变成了指标,出现在各个报表或者数据产品中。


数据中台的核心,是在企业数字化战略的基础上,利用一套技术标准构建的共享、安全、标准、统一的数据服务。


恩门建模(自顶向下)因为是从数据源和主题域开始构建,构建成本比较高,适用于应用场景比较固定的业务,比如金融领域,冗余数据少是它的优势。金博尔建模(自底向上)由于是从分析场景出发,适用于变化速度比较快的业务,比如互联网业务。



嘉宾观点:数据中台是各个企业独有的一种战略选择和组织形式,不存在数据中台这样的一个能对外直接售卖的产品。



 3 

哪些企业需要数据中台


嘉宾认为:

企业有一定的信息化基础,但存在较多的业务数据的孤岛,需要数据整合分析

企业有数字化转型需求,需要通过精细化运营提升效率

企业是跨多个领域业务线的集团架构,有丰富的标签维度和大量的数据应用场景

四、什么时候要建数据中台


 4 

什么时候要建数据中台



 5 

建数据中台的成本

五、建设数据中台的成本

 6 

如何建数据中台

六、如何建数据中台

嘉宾观点:可见是数据资产化,可用是数据产品化和服务化,可运营是要打造数据价值转换的闭环

建议原则:

尽量兼容原各业务线系统,避免推倒重来(开源兼容)

先拿新的业务线作为试点,再大面积推广(快速试错)

先使用的业务线,提供更高的容错度和激励(鼓励创新)


 7 

建数据中台职责由那个团队承担?



 8 

封面传媒数据中台应用实践


嘉宾核心观点

人的因素往往最难推动,因为涉及到很多团队的利益,还涉及到能不能找到一些有经验的人来做这个事情。


嘉宾介绍

- END-


参与相关讨论,请在公众号回复关键词:读者群。

参与相关讨论,请在公众号回复关键词:读者群。 


阅读推荐:

技术中台是割韭菜的镰刀?还是落地的丹药!

中台崛起的本质是“去ERP化”

中台的问题,是技术的问题,还是人的问题             

从平台到中台【上

从平台到中台【下】

银行选型和排坑实战:用开源软件自建分布式数据服务平台

从新型冠状病毒想到清单革命



技术琐话 


以分布式设计、架构、体系思想为基础,兼论研发相关的点点滴滴,不限于代码、质量体系和研发管理。本号由坐馆老司机技术团队维护。


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存