查看原文
其他

华为启示录:数据团队最核心的能力到底是什么?

The following article is from 大鱼的数据人生 Author 讨厌的大鱼先生

如果你问公司的技术团队:”你们最核心的能力是什么?“ 他们会说技术能力,比如云计算,云原生、微服务、容器等等。


如果你问公司的业务团队:”你们最核心的能力是什么?“  他们会说业务能力,比如业务管理、客户细分、营销能力、销售能力等等。


如果你问公司的数据团队:“你们最核心的能力是什么?” 答案就不那么显而易见了,数据能力是一个非常模棱两可的词,既包含技术能力,也包含业务能力,如果数据技术做到顶尖,似乎应该归属到技术团队去,如果业务能力顶尖,那业务团队才是归宿。


有人会说,数据团队的核心能力就是要具备数据驱动业务的能力,既懂技术,也懂业务,更懂数据,这种说法还是很含糊,这个综合能力到底指什么?其差异化到底在哪里?


自己在不同时期对于这个问题的认知是不一样的,直到读到华为数据之道,我才有了最终答案。


1、数据仓库建设时期


数据仓库刚起来的时候,数仓建模成为了数据团队最为关注的能力,因为好的模型可以大幅提升数据支撑效率,大家都以掌握关系建模、维度建模、分层建模等方法而自豪,数仓建模师成为了数据人才市场上的香饽饽,直到现在,还有很多人认为数仓建模是数据团队最具技术含量的工作。


2、数据仓库运营时期


数据仓库建成后,数仓建模师并没有创造更多价值,因为发现业务人员最关注的却是报表和取数,为业务部门提供准确而及时的数据成为了数据团队最核心的能力,这个时候,SQL BOY大行其道,为了快速满足业务需要,数仓模型是可以被牺牲的。


3、大数据平台建设期


互联网时代带来的数据的爆发式增长使得数据仓库不堪重负,换数据仓库引擎成为了数据团队最重要的工作,这个时候大数据平台技术横空出世,大家都认为掌握hadoop等技术栈是数据团队最重要的能力。


4、大数据平台运营期


大数据技术同质化后,大家的焦点重新回到了业务上,数据团队迫切希望把海量数据的价值发挥出来,到处去寻找数据赋能的场景,这个时候,客户标签、精确营销、数据产品、数据变现等能力变得非常重要。


但无论是标签、营销、产品还是变现,似乎都在强调业务能力,那么数据团队差异化的能力到底是什么呢?


论业务能力,肯定不如业务人员,论技术能力,也比不过研发人员,搞算法更没前途,因为大多场景的建模靠业务规则就够了,唯一剩下的是取数能力,但取数对于业务和技术的要求并不高。


5、数据中台运营时期


数据中台横空出世的时候,大家都欢欣鼓舞,因为觉得找到了一个新的发展方向,但剥开数据中台的内核一看,发现还是那几样老东西,模型与工具,只不过外面套了个数据服务的马甲,虽然数据服务的确让数据可用性变得好了点,但数据服务本身可成为不了数据团队的核心竞争力,因为模型还是那些模型,抽象封装又能有几个呢?

6、数字化转型时期

数字化对公司运营的一个明显影响就是对于全流程端到端的数据贯通诉求增多,很多公司通过建立企业级的数据治理组织、机制和流程解决了顶层设计的问题,但却卡在了企业级数据的运营上,因为原来的数据团队没有做好准备。

在企业级数据目录的构建中,企业数据团队要求各个领域提供领域数据目录,但发现这些领域的数据目录都是以碎片化的表的形式提供的,这些表对于其他领域来讲难以理解,虽然大家都知道这个领域的数据对自己很重要,但谁也没有能力从这些碎片化的表中还原出自己所需要的东西。

大量跨域的数据流通问题,看似是部门墙造成的,但实际上很多是由跨领域的数据理解门槛造成的,需求方提不清楚需求,数据拥有方则没有跨领域的数据服务能力。

比如领域A希望从领域B获取某业务的视图数据,但领域B根本没有该业务的视图数据,它只有最原始的碎片化的表,而且这些表散落在多个系统中,因为领域A的业务方从来没要求去做这些模型视图,但这些视图对其它领域却是至关重要的。

很多企业各个领域的数据能力还存在严重的不平衡,有些领域数据管理已经成熟,干着从95分到96分的工作,而有些领域连数据目录、数据采集都还没做,根本没有能力跟其它领域进行数据联动。

比如某企业市场部希望针对10000个价值小区进行产品营销,希望后端部门提升这10000个小区的线路覆盖,但后端部门说无法做,因为双方的小区定义是不一致的。

很容易想到,这些跨领域的模型工作应该由企业数据团队去承担,但数字化转型时期所要求的模型能力数据仓库那个年代相比,内涵已经发生了巨大的变化,即要求企业数据团队重新审视自己的定位,将各个领域数据的拉通整合作为自己最为核心的工作,能够跨越流程、系统和数据的鸿沟端到端解决问题,从而实现业务流程的全局最优,具体包括四个方面的能力要求

(1)掌握公司核心业务流程和业务对象

(2)能够以核心业务对象为主体进行建模

(3)能够提供端到端的跨域数据服务

(4)以业务对象为核心进行数据资产运营

为了完成以上工作,数据团队真正需要的是一只数据模型产品经理队伍,能够以业务对象为核心(不局限于领域)来进行数据模型产品的构建,能够为业务提供端到端的数据服务支撑,能够解决跨领域数据模型构建过程中出现的数据标准、数据质量、数据整合等问题,他们是公司数据资产的真正代言人,能力要求远远超越了传统的数据建模师。

数据团队要围绕业务对象进行组织的变革,也业务对象为核心进行人员职责的重新划分,如果公司有100个核心业务对象,那么也许数据团队需要50个产品经理,每个产品经理负责2个,这些产品经理为公司的数据资产整体负责,他们代表了数据团队的核心竞争力,独一无二。

假如你是公司“物资”这个业务对象的产品经理,那么围绕“物资”你要建立一套贯通上下游的模型体系和数据标准,所有涉及物资的数据需求都应该由你端到端负责实现,任何涉及物资的业务流程变动,系统变动,数据变动,你都要能与时俱进的进行模型的同步变更,你是公司里最懂物资的人,无论是在业务上,系统上还是数据上,这是未来10年数字化时代数据团队最需要的人。


    数据仓库模型全景
    业务中台会吞并数据中台吗?by 大鱼先生
    京东零售数据仓库演进之路
    7张图总结—SQL 数据分析常用语句
    知乎热议:数据仓库、数据湖、湖仓一体,究竟有什么区别?
    数据网格到底是什么?它真的能颠覆数据仓库、数据湖吗?
    基于OneData的数据仓库建设方案
    全部文章

    点击左下角“阅读原文”查看更多精彩文章,后台回复【加群】申请加入万人数据学习社群


    🧐分享、点赞、在看,给个3连击呗!👇

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存