首页
下载应用
提交文章
关于我们
🔥 热搜 🔥
1
百度
2
今日热点
3
微信公众平台
4
贴吧
5
opgg
6
dnf私服
7
百度贴吧
8
知乎
9
dnf公益服
10
百度傻逼
分类
社会
娱乐
国际
人权
科技
经济
其它
首页
下载应用
提交文章
关于我们
🔥
热搜
🔥
1
百度
2
今日热点
3
微信公众平台
4
贴吧
5
opgg
6
dnf私服
7
百度贴吧
8
知乎
9
dnf公益服
10
百度傻逼
分类
社会
娱乐
国际
人权
科技
经济
其它
”FAN某”的离婚财产分割判决书(全文)
”FAN某”的离婚财产分割判决书(全文)
刑讯逼供、管辖异议,唐山杨立国涉黑案争议
大瓜!找工作太难了:私募大佬白嫖95后小姐姐事件刷屏!
深度 |台积电断供大陆芯片,任正非罕见感谢特朗普,美霸权摇摇欲坠
生成图片,分享到微信朋友圈
查看原文
其他
如何跟老板解释清楚什么是主数据? by 大鱼先生
Original
讨厌的大鱼先生
大鱼的数据人生
2022-10-15
收录于合集 #数据治理
26个
有一天,一个年轻人到美术馆看到一幅很美的画,不禁脱口而出:“这幅画真美。”一位老人走过来说:“年轻人且慢,我叫苏格拉底,你说这幅画真美,代表你知道”美“的意义是什么,我这把年纪了还不知道”美“的意义,请你启发我,告诉我什么是美?”年轻人觉得这个问题太简单了,可真要开口,却不知道从何说起。
简单来说,美是客观的,还是主观的?如果说美是客观的,任何画只要满足某种条件(如布局、背景、色调满足一定标准)就可以称为美的,但天下没有这样的画;如果说美是主观的,只代表个人的审美品位,则不能用“美”来形容以求取别人的认同。年轻人本以为自己懂得了什么是美,追问之下发现其实不懂,心里十分沮丧。
过了几天,年轻人又去美术馆,发现苏格拉底先到一步,站在一幅画前赞叹“这幅画真美!”年轻人心想机会来了,上次被问到说不出话,今天倒要看他怎么回答:”请问,你所谓的‘美’的意义是什么?”苏格拉底说:“很好,你问我‘美’的意义,请先告诉我‘’意义‘是什么意义?”天啊,这是什么问题!但千万不要认为这个问题不能成立。
以上的故事虽然是虚构的,但绝对不是抬杠。一位西方学者出版了一本书叫《意义》,对“意义”一词给出了26种不同的含义。这说明进行逻辑思考首先应澄清概念,清楚分辨概念的主观意象与客观意义,尽可能排除主观的意象成分,而用客观的意义进行沟通,思考从起步就要非常谨慎。
数据治理涉及公司组织、机制、流程、文化的变革,需要有人能把数据治理的概念普及到公司的每个人,特别是老板。
但数据治理的概念很多,要理解清楚这些概念的本质不容易,把这些概念跟别人讲清楚就更不容易了,想当年光一个元数据的概念就把我绕晕了,什么技术、业务、管理元数据,元模型啥的。
今天就来讲讲主数据,为什么要讲它呢,因为有次老板问什么是主数据,当时感觉没解释清楚,倒并不是说自己不懂主数据,而是缺乏有效的诠释方法,这也是写这篇文章的原因。
那么,如果老板问你主数据是什么,假如只有15秒的时间,怎么才能言简意赅的把这个概念说清楚?
按照我自身的经验,专业人士在对外解释专业概念的时候,容易犯二个错误:
第一,把自身的背景知识等同于别人,比如会认为某个概念的基本定义就是常识,常识有什么好解释的呢,我去解释常识,显示水平低吗?
第二,把实践经验当成真知,虽然实践得到的经验可贵,但容易以偏概全,这也是我们要去学习理论和规范的原因,做数据治理做到一定程度,还是要去读读DAMA等书籍,这可以让我们开阔视野,对数据治理的理解能上一个层次,经验抽象成了定义以后,不仅适用的范围广了,而且更容易让别人理解。
很多人虽然干了主数据很多年,但也许真的不知道主数据是怎么定义的,老板一问,直觉反应就是把自己干的主数据的具体事情说一遍,什么物料编码啥的,什么一致性啥的,这对于外人的理解门槛是比较高的,特别是对于爱学习的老板,再往下沟通就比较难了,没有基本概念这个“1”托底,后面有再多的“0”,似乎也缺失了意义。
那么,主数据的基本定义是什么呢?
DCMM定义:
组织中需要跨系统、跨部门进行共享的核心业务实体数据。
DAMA定义:
主数据是关于关键业务实体的权威的、最准确的数据,可用于建立交易数据的关联环境,主数据值被认为是“黄金”数据。
《数据治理-工业企业数字化转型之道》定义:
指满足跨部门业务协同需要的、反映核心业务实体状态属性的基础信息。主数据是用来描述企业核心业务实体的数据,是企业核心业务对象、交易业务的执行主体,是在整个价值链上被重复或共享应用于多个业务流程、跨越多个业务部门和系统、高价值的基础数据,也是各业务应用和各系统之间进行数据交易的基础。从业务角度看,主数据是相对固定、变化缓慢的,但它是企业信息系统的神经中枢,是业务运行和决策分析的基础。
《华为数据之道》定义:
具有高业务价值的、可以在企业内跨流程跨系统被重复实用过的数据,具有唯一、准确、权威的数据源。主数据通常是业务事件的参与方,取值不受限于预定义的数据范围,在业务事件发生之前就客观存在,比较稳定。
因此,当老板问你主数据是什么的时候,首先要回答的就是“主数据是企业内核心业务实体数据”这个解释,老板也许很难一下子理解主数据能带来什么业务价值,但肯定能理解“核心业务实体”这种业务概念。
如果能做到这一步,那么就算起了一个好头,虽然我们不能死读书,但超越经验,牢记一些基本定义是需要的,这不仅是加深理解的需要,更是高效沟通的需要,因为老板给你的时间也许只有15秒,啰里啰嗦抓不到重点是很多专业人士的毛病。
其次,有些概念的定义是比较抽象的,这个时候,结合定义举些公司的主数据实例也是必要的,比如客户、用户、员工、合同、物资、策划、设备、地址等等,这样让老板有更感性的认识。
再次,即使老板当时已经大致理解了主数据的概念,也许仍然不够,因为孤零零的一个没有任何联系的新概念很容易被忘掉,下次老板碰到你还会问,而让别人理解一个概念最好的方法就是能够与其已有的知识体系联系起来,让其感到既熟悉又意外。
我们都知道,主数据是一种数据类型,按照《华为数据之道》和《 数据治理-工业企业数字化转型之道 》等书籍对结构化数据的分类方法,一般可以分为
参考数据(又叫维度数据)、主数据、事务数据(又叫交易数据)、统计数据、观测数据(又叫时序数据)等五种类型。
(1)参考数据
指对其他数据进行分类和规范的数据,如国家、地区、货币、品牌、产品类型等通用的数据,具有相对稳定、静态的数据,基本不会变化,往往通过系统配置文件给予规范并固化在信息管理系统中。
(2)主数据
主数据是用来描述企业核心业务实体的数据,是企业交易业务的执行主体,是在整个价值链上被重复或共享应用于多个业务流程、跨越多个业务部门和系统、高价值的基础数据。
(3)事务数据
指在业务活动过程中产生的数据,是企业日常经营活动的直接体现,也是围绕主数据实体产生的业务行为和结果型数据,业务活动数据存在于联机事务处理系统中,就有瞬间生成和动态的特点,比如用户详单、订单等
(4)统计数据
是组织在经营分析过程中衡量某一个目标或事物的数据,一般由指标名称、时间和数值等组成。
(5)观测数据
指时间序列数据,它是按时间顺序记录的数据列,在同一个数据列中的各个数据必须是同口径的,要求具有可比性。在工业企业中,实时数据是时序数据的一种,如设备运行监测类数据、安全类监测类数据、环境监测类数据。
可以看到,通过数据分类体系的引入,可以将主数据跟老板已知的统计数据联系起来,这就比较容易让人理解和记住。
而从一个概念带出一个体系,也是老板喜欢看到的,因为如果咬文嚼字一下,就会问,既然有主数据,那么有没有次数据呢?
知其所以然对较真的人很重要,
当
然要能达到这种解释水平,需要
有点做学问的精神。
最后,老板信不信还源于解释的权威性,权威性一方面来自于人的权威性,这个没办法,只能慢慢积累,另一方面来自引用资料的权威性,假如有华为为你背书,比如《华为数据之道》,那可信度就大增了,即使有瑕疵,老板的容忍度也会高一点。
解释清楚了主数据是什么,我们就可以跟老板汇报主数据的具体工作了,比如供应链的问题,由于各系统对物料的定义、编码不一致,导致无法对物料的流转过程(包括采购、物流、入库、出库、安装、入网、转资到运维等环节)进行跟踪分析,从而无法对供应链的流程进行优化,因此需要新建物料主数据管理系统。
企业数据治理很难,很多时候的挑战不在于技术,而在于要让别人理解你做这个事情的价值很难,其中解释清楚基本概念是比较基础的工作,这是数据治理专家当仁不让的责任。
2万字详解数据仓库数据指标数据治理体系建设方法论
网易数帆数据生产力方法论
关于数仓建设及数据治理的超全概括
ClickHouse在网易的实践
关于未来数据开发技术方向的观点
基于阿里(OneData)的数仓体系建设
One Data:看阿里如何进行数据指标体系的治理
Hive SQL 参数与性能调优
50000字,数仓建设保姆级教程,离线和实时一网打尽(理论+实战) 下
点击左下角“
阅读原文
”查看更多精彩文章,后台回复【
加群
】申请加入万人
数据学习
社群
🧐
分享、点赞、在看
,给个
3连击
呗!
👇
您可能也对以下帖子感兴趣
{{{title}}}
文章有问题?点此查看未经处理的缓存