查看原文
其他

Netflix利用数据产生价值的20个原则和实践

The following article is from 凯哥讲故事系列 Author 筱愚她爸

傅一平评语:
文章挺有趣,因此挑了几条有感触的点评一下:
1、当心局部优化:数字化的一个核心就是全局优化,架构设计的原则也是全局最优,机器学习的调参原则也是全局最优,你看,大千世界很多道理就是普适的
2、铺好道路:干数据也要站在巨人的肩膀上,无论是流程、方法还是工具,比如DataOps
3、可视化:可视化促进了管理扁平化,这是我很大的一个感受,如果不可视化,管理者对数据的糟糕程度完全没概念
4、自建还是购买:Netflix倾向于基于开源自建,对于数据规模较大的企业,我认为自建是主旋律,大家想想为什么?
5、一线创新:不要仅做报表,BI时代已经过去了,要把数据渗透到生产流程中去,数据中台与业务中台要逐步融合
6、模块式架构:老外不提数据中台,但思想是一致的,强调复用
7、通知而不是申请:这体现了Netflix数据团队和业务人员的关系,不是被动支撑,而是主动作为


正文开始


    前文,我们介绍了真正数据驱动的企业,Netflix。那么他们是如何建设他们的数据中台的呢?

    在2017年O'Reilly的Strata Data Conference大会上,Netflix的Kurt Brown介绍了Netflix的20个建设数据中台的原则,这些原则让他们的数据中台能够产生最大的业务价值。

    我作为搬运工把这个演讲视频搬了过来,供所有希望建设数据中台的企业参考。(如有侵权,请第一时间告知,立刻下架。)



01.北极星原则



    北极星原则,利用数据做企业最感兴趣的事情,将数据中台的建设和利用,关注于企业最重要的领域。




02.当心局部优化



        在《企业转型,ERP之后是什么?》的文章里,我总结到,智能化和数字化,信息化,最大的区别之一,就是智能化是全局优化的思路。

    无独有偶,在Netflix利用数据的时候,第二个原则就是,当心局部优化,这意味着,一定要站在全局视角,企业价值视角去做数据的分析和利用。




03.最佳拍档的五个菜单


    这个原则包括五条实践,个人认为仅适用于Netflix这样的业界顶级企业,拥有最优秀的人,去中心化的组织结构和数据文化。

    其他企业很难照搬。





04.避免过度分析


    避免过度分析,这是很多时候大家不知不觉进入的误区。很多时候,过度分析源自对于目标的不清晰,或者已经失去了对于最终目标的关注,而将注意力关注到了其他不重要的层面。

    比如下图:



05.有些时候不需要循规蹈矩


    关注北极星原则,在结果和流程之间,选择前者,所以有的时候,可以不必要教条主义和循规蹈矩。



06.质疑一切


    在任何时候都要能够提出问题,敢于提出问题,质疑一切。

    提出好的问题是获得一个成功的结果的第一步。

    


07.清晰的知道Why和Why Not


    很多时候,我们只关注为什么这么做,而并没有深入的去解释为什么不能用别的方法,所以清晰的理解,为什么做这些和为什么不做那些,是能够更全面的分析问题的两面。



08.尽量标准化


    在Netflix这样一个全是聪明大脑和各种想法的地方,依然倡导标准化,可见在数据领域,标准化是多么的重要。

    那么,标准化具体指什么呢?比如说,表名:



09.铺好道路


    

    在这里,Paved Paths指的是能够提供给所有的数据用户直接使用的一条道路,这样大家可以统一在这条路上利用数据,而不需要重新趟过哪些以前别人踩过的坑。



10.平台的拥有者是用户

    这一点是现在国内为什么强调数据中台,而不是传统数据平台的原因,那就是,将数据中台交由业务去使用和拥有。而不是仅仅提供给技术和数据团队。



11.可视化


    在Netflix的三个数据哲学中,其中第二条就是,不论你是什么数据,第一件事情就是把它可视化出来,从而能够被大家所理解。

    不能够被可视化出来,被用户访问和使用的数据,它的价值就越小。

    Netflix甚至能够将哪一张表消耗的存储成本最多,都可视化出来,然后提醒技术人员去优化设计,提高效率。

    Netflix对于数据可视化的理解,是值得我们国内所有企业去学习的。



12.有所取舍


    牛掰如Netflix,他依然知道不可能什么都要。

    在灵活性,性能和可扩展性上,Netflix总会去做一些取舍,关注最重要的部分,这一点,充分的体现在它的技术栈的选择上。


    当它需要灵活性和可扩展性的时候,Netflix选择Hive。

    当需要灵活性和性能速度的时候,Netflix选择In-Memoery DBs。

    当需要性能速度和可扩展性的时候,Netflix选择Cassandra和Druid。



13.自建还是购买

    

        这是一个对于所有的企业都非常重要的选择,是自建能力还是购买产品或服务?

        Netflix的选择会参考以下几个关键点,去决定是购买供应商的的产品或服务还是自己从零做起:

  • 是否是大家乐于去尝试的甜蜜区

  • 成熟度如何

  • 业务的重要性成都

  • 是否有巨大的差异

  • 能否选择Open Source从而在中间部分取舍


    实践证明,Netflix大部分的技术栈都优先选择在Open Source的基础上进行自定义开发。




14.当心冰山效应

    在做一切决策的时候,都小心谨慎,全面采集信息,多次试验,避免出现不可预料的冰山效应。




15.一线创新

        在Netflix特别强调与用户的连接,听取用户的建议和想法,从而能够在一线发现创新,只有这样的创新才能够获得业务的支持,从而更持续的产生价值,而避免脱离用户的想法和创新,那样的成果是很难推行下去的。



16.模块式架构

        Netflix非常重视模块式架构,从而能够让更多的成果可以被复用,避免重复造轮子带来的浪费和不一致。



17.个性化


    在标准化可复用的模块式架构基础上,Netflix数据平台也提供各种个性化的工具。



18.设置清晰的期望


        对于任何任务和工作,都要设置清晰的期望,这个期望是理性的,是清晰的,这是成功的重要因素。



19.通知而不是申请



        Netflix的数据平台团队在内部有一个实践,那就是当他们想做一个新功能和新想法的时候,比如,他们评估现在集群需要升级,他们通常会通知业务部门,而不是获得业务部门的批准。因为如果是后者,可能永远都不会获得批准。



20.形成安全网络

        Netflix的所有的数据操作都在这个安全网络里,从而能够可追溯,可以回滚。



21.共享的决策机制

        

        争取让你的决策和大部分人共享,从而获得大家的支持。



22.优先级最重要

        识别用户最需要的需求,他们会接受一些妥协。



23.站在用户的角度思考

    



24.赋能并信任团队


    


    2022大数据十大关键词及点评

    数据要素国家政策大盘点!

    【PPT】我在高中讲大数据 by 傅一平

    为什么达不到这五个境界,就没资格称理解了业务

    数据驱动业务的18个有效策略

    新人和老人关于数据思维的50个区别

    【漫画】为啥客户都喜欢聊大数据?

    我们有多少机会将数据、信息、知识转化为智慧?

    查看全部文章


    点击“阅读原文”查看更多精彩文章,公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个在看或者把本号置顶

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存