从奥运奖牌榜的玩法看啥叫“数据管理”
奥运会结束了,各大主流媒体的奖牌榜是这样的,中国仅次于美国,排名第二👇
不过,台湾和香港作为中国不可分割的部分,有人认为奥运奖牌榜应该是这样算的,于是中国的金牌数和奖牌数都超过美国👇
这就是数据管理、数据治理的例子——不同的数据管理方法,会出来不同的数据分析报表结果。具体来说:
一、
在业务规则上,就将“国家”里的 “中国”的含义定义为大陆、台湾、香港。因此,在奥运会执行的过程中,只要是大陆、台湾、香港的运动员拿了奖牌,在信息系统里做记录时,“国家/地区”的字段都计成“中国”,这是“主数据管理”(MDM)以及“ERP”的解决方案;
如果把“中国”改成“大中华区”,或者Greater China,操作人员在系统里录入数据时,不是用习惯的“中国”而是输入“大中华区”,这叫业务流程再造(BPR),需要进行变革管理的宣贯。
二、
在产生原始业务记录的系统里,“参赛奥委会”字段仍然是大陆、台湾、香港等取值;在数据仓库做数据立方体(data cube)时,“国家”维度里的“中国”包括大陆、台湾、香港等取值,对应到数据源的“参赛奥委会”。因而,从记录系统里将奖牌数据抽取到数据仓库,通过数据立方体出报表时,大陆/台湾/香港的奖牌数据在“国家“属性下,都会被汇总到中国之下,这叫“数据集市”和“数据仓库”;
三、
奥运会都已经结束了,觉得中国奖牌总数落后于美国不爽,想起来还可以把奖牌数据记录中的大陆、台湾、香港都打上“中国”的“数据标签”,这样现给数据打标签,然后出奖牌榜报表的数据平台,就是传说中的“数据中台”。
最后,我认为上面奖牌榜的表头表述还有不严谨的地方,“国家奥委会”应为“国家”,另外总奖牌(铜牌)数有误,应为106:
好吧,那你认为在实践中,那种数据管理和报表方式更符合企业管理的要求?
旧文参考: