今年是我系统性的开始做数据治理的第一年,希望能如实的记录下这个过程,这是第一篇,谈谈目标的确定。
做正确的事比正确的做事重要的多,目标定得好不好,高不高,基本决定了做数据治理能达到的高度,但目标要定得高,定得好,首先取决于你所在的数据治理组织在企业中的生态位。
比如你负责市场部的取数,牵头搞的数据治理一般就被限制在了公司市场领域,又比如你负责技术支撑,那么,牵头搞的数据治理就被限制在了技术领域,再比如你负责企业级数据汇通,那么,牵头搞的数据治理可能就跨越了部门的界限。
现在很多公司成立了专门的数据安全部门,相较于IT部门自身的安全部门,这个企业级的部门就能干一票大的,人家制定一个规范带来的影响力和价值就可能远远超过IT部门的那些安全管理的举措。
从去年下半年开始,根据公司的要求,自己一直在做企业数据治理相关工作的前置研究,回过头来看,与其说是研究,还不如说我充当了一个咨询者的角色,需要针对数据治理的顶层设计给出一些建议。
经过大家的同心协力,此处省略10000字,企业现在拥有了一个做企业级数据治理的组织,从组织成立开始,干的事情的就拥有了企业级的性质,不是说数据团队瞬间变了,而是说做的很多事情的意义跟以前有很大的不同。
比如我们以前自己做个数据字典工具还是比较随意的,现在需要升级为企业级的数据字典工具就需要非常谨慎,因为要推广到各个领域去使用,责任显然变大了。
这让我想起多年前从报告取数转型去做大数据变现,经历了从数据支撑者到数据价值创造者的转变,现在,要从一个领域的数据管理者转变为企业的数据治理者角色,这是全新的挑战。
企业级数据治理的战略已经定下来了,但今年的具体目标到底是啥,从哪里切入,是要根据当前企业面临的实际情况制定的,前段时间自己一直在思考这个事情,现在算有了一些眉目,特此分享。
1,进行企业数据资源的重新盘点
对于已经拥有大数据平台的企业来说,这个事情即使重要但估计也不紧急,因为当初做大数据平台的时候已经盘点过一次了,现在数据支撑风平浪静,再去进行数据资源的盘点似乎是为了做而做,边际效应感觉也不高。
后来我发现自己犯了认知上的错误,即重新做数据资源的盘点价值不在于简单获得一些新的数据发现,而在于这个过程中要建立企业数据资源盘点的闭环管理体系,大数据平台从0到1建立的时候也许不需要体系,因为容易空谈,性价比不高,但从1到N的时候,就很需要:
第一、以前盘点是IT部门孤身奋战,现在依托于企业级组织可以让领域的业务部门参与其中,你可能会质疑业务部门梳理不出自己领域的数据资源目录,但业务部门能不能干和应不应该干是两码事,很多事情是名不正而言不顺,领域业务部门一定要skin in the game。
另外,IT部门相对于业务部门,虽然数据能力和技术能力要强一点,但业务视野还是差了很多,比如很多业务平台、第三方数据的引入其实严重依赖业务部门的牵线搭桥,又比如很多数据问题,只有业务部门才能提得出来,而这往往是数据治理的起点,比如这次列出的数据治理八个目标,大多源自业务部门在联席会上提出的问题。
第二、以前数据资源盘点大多跟着大数据平台的建设一起进行,项目的技术色彩太浓了,大家做事的最高优先级一定是大数据平台的建设及相关技术问题的解决,至于业务部门的诉求,找熟悉报表取数的人了解一下,然后把数据采集的范围确定就可以了,至于能否打破部门壁垒解决一些关键的数据问题,能否基于数据治理创造新的业务价值,估计已经少有人关注了,这是导致大数据平台建立初期价值感不足的重要原因。
第三、以前数据资源盘点技术导向过于浓厚,基本就是EXCEL设计一下,然后把系统,表,字段罗列出来就可以了,只要表能够配置采集,其他的能省就省,因此设计出来的数据字典根本无法开放给用户使用,更没有什么闭环流程来支持数据字典的自动更新,元数据管理一塌糊涂,数据的确是采集了,但所谓的订阅推送等功能,基本是不可能面向用户实现的。
因此,企业数据治理的第一个目标,就是完成企业级数据资源的盘点,让企业的数据找得到,看得清,读得懂,在这个过程中会同步获得在组织、流程、方法、工具建设上的数据治理经验。
2、进行海纳百川的数据汇聚攻坚
企业数据资源盘点是自上而下的,其是系统性的工作,着眼于解决长期的一些问题,但当前业务部门存在的一些痛点堵点问题马上需要解决:
第一、解决跨领域数据汇聚问题。
很多部门和一线对于跨领域数据有强烈诉求,但这类数据的采集存在部门壁垒,倒并不是这些壁垒没法打破,而在于缺乏一个专业的组织去研究如何打破这些壁垒,很多数据采集的壁垒问题其实是被人为夸大的,小鬼当家的事情挺多,而让需求部门去打破这些壁垒成本比较高,小问题积累多了就成了大问题,
同时,我发现领域数据消费存在严重的路径依赖,大多领域只消费自己领域的数据,这抑制了企业的数据创新能力。
第二、解决长期数据积压问题。
就像当年大数据平台数据采集一样,这么多年已经积压了很多数据采集难题,这些数据采集问题靠普通的流程走不动,需要企业级数据治理组织专项攻坚,比如敏感数据的使用,以前可能一刀切,不开放一线使用,但现在可以依赖一些"可用不可见"的技术手段去解决。
第三、解决技术红利普及的问题。
公司建立了大数据平台不代表各个领域享受到了大数据技术栈的红利,当前仍然有很多业务部门还在靠线下的,人工的方式从外部获取数据,这些数据采集没有etl工具支持,没有自动运维保障,没有数据质量监控,出现了问题大多靠人工解决,如何整合散在各处的数据接口,如何为各领域提供更好的统一数据采集服务,对于企业数据治理组织都提出了全新管理挑战。
因此,企业数据治理的第二个目标,就是自底向上的解决一批紧急且重要的存量数据问题,让业务部门有获得感。
3、基于数据治理推进专题应用建设
数据治理要为企业的业务战略服务,但传统意义上的数据治理与数据消费距离比较远,至少是比较间接的,要一个搞数据治理的人说清楚本次数据治理到底给业务带来了多少直接价值,这是很难的事情。
类似的问题也发生在6-7年前做大数据的时候,当时讲大数据是大忽悠的不在少数,为了说明大数据有价值,自己常引用下面这段话来救场:
“冯.诺依曼指出:“在每一门学科中,当通过研究那些与终极目标相比颇为朴实的问题,发展出一些可以不断加以推广的方法时,这门学科就得到了巨大的进展。在发展大数据技术和产业中,不应天天期盼奇迹出现,而应扎实多做“颇为朴实”的事,培育数据文化,打造大数据应用环境,提高决策合理性,开拓新的数据应用。”
“从对GDP的直接贡献看,大数据的效益不算高,但是,大数据是典型的通用技术,理解通用技术要采用“蜜蜂模型”:蜜蜂的效益主要不是自己酿的蜂蜜,而是传粉对农业的贡献。大数据的另一收益是促进国家治理体系的现代化,提高现代化治理能力,经济类似于血液系统,国家治理相当于神经系统,不能用GDP来反应,我们不必用左手来证明右手的重要性。”
这种说法看似有道理,但其实没法让人完全信服,后来我就不引用了,反驳这种观点的最有利武器就是用行动证明,现在大数据变现团队用收入来证明公司的大数据能直接创造价值。
当前数据要素作为生产资料已经渗透到了企业的各个环节,任何一个经营领域里其实都需要数据治理的保驾护航,当然,并不是每个业务领域的问题都需要优先去解决数据问题,但在某些专题领域,数据的问题就是最大的业务问题,我们需要挑选出这些业务专题领域,然后用数据治理手段去解决,用行动证明数据治理能直接创造业务价值,不是为了做而做,就像当年的大数据一样。
因此,企业数据治理的第三个目标,就是通过信息架构升级、数据采集、质量提升、数据贯通及数据开放等治理手段,构建或升级出全新的业务专题应用并创造出新价值。
4、完善数据治理常态化运营机制
企业级数据治理委员会虽然成立了,但远远不够,因为大家当前对数据治理的理解水平参差不齐,推进的力度也不同,只有通过建立常态化的机制,才能逐步形成共识并推进工作的深入,至少要达成以下两个目标:
第一、进一步完善数据治理联席会议制度,企业数据责任人和领域责任人需定期向办公室汇报工作进展,数据治理办公室需协调处理相关问题并布置下一阶段工作,如此循环往复形成闭环。
第二、建立常态化沟通协作机制,针对联席会议部署的工作,领域责任人需统筹推进,通过问题答疑、现场辅导、专题会议等形式,辅助各领域完成数据治理的相关工作,同时建立跟踪通报机制,及时发现并解决工作推进过程中出现的问题。
因此,企业数据治理的第四个目标,就是通过数据治理联席会、常态化沟通协作等机制的建立和完善,为数据治理工作往前推进提供持续的组织保障。
四个目标讲完了,你会发现要完成这些任务,往往不是领域能单独搞定的,这也许就是企业级数据治理组织的使命吧,未完待续。