查看原文
其他

为什么开放、透明的环境对于大数据团队是如此重要?

傅一平 与数据同行 2021-10-16

传统企业很多在转型做大数据,在技术层面上从互联网公司学到不少,改革也可谓大刀阔斧,就几年时间,很多传统企业的数据仓库全部从小型机转到了X86,现在做数据处理和分析如果不提hadoop甚至有点落伍了。


应该来说,现在搞一套大数据平台其实已经不是难事,但如果企业希望能基于新的大数据平台快速的进行创新,事情就并不像想象的那么简单,你会发现,换了平台以后,虽然数据增加了,创新的可能性增加了,但很多数据工作效率却比以前降低了,从采集、开发、分析、挖掘、运维不一而足,我们在看得见的成本上的确降低了,但看不见的成本却在大幅提升。


从平台的角度讲,由于技术组件的多样化,开源化,技术的复杂性大幅提升,企业能得到的标准化服务能力肯定是下降了,为了保障服务的连续性,企业必然要花更多的其它成本去做补偿,比如不少技术组件甚至业界也没多少人用过,企业只能硬着头皮自己去抗,难度可想而知。


从工具的角度看,当前各种技术组件的配套设施并不完备,我们不再拥有像PL/DEV这种完美的ORACLE第三方客户端软件,得自己重新开发一套客户端工具来跑脚本,比如针对HIVE的运行工具,但这些客户端工具的开发也是摸着石头过河,体验显然也是没法跟以前相比的。


互联网公司对于新产品的竞争力有个公式:竞争力=(新产品体验-老产品体验)-替换成本,因此,要推广一个体验还不如老工具的东西对于大数据平台运营人员来讲也是非常艰难,当然不仅是开发工具,还包括监控工具、优化工具等等。


从管理的角度看,更是要建立一套适应新的大数据平台运营的组织、机制和流程,比如建立小快灵的团队来适应大数据的创新,新的平台工具需要新的培训,比如hive脚本跑不动得自己有能力去解析yarn的日志,看看是否有数据倾斜的问题......。


无论如何,我们都将与BI时代的稳定再见,面对的将是一个全新的环境,这是当前任何一支大数据团队都会面临的问题,在如此不确定的环境中,一支大数据团队如何才能变得更高效是摆在每个大数据管理者面前的课题。


这个时候,我们首先要拥有对新事物勇敢提出问题的能力,而能否创造开放透明的环境是最重要的一个,这也是笔者最近的感悟,因此特别来说一说。


这里先举三个案例。


团队组织了一次工作研讨会,特意邀请了刚入职的新员工谈谈工作中的问题和建议,哪知道原来引以为豪的数据开发管理平台被一顿臭骂,从资源占用模式,开发界面,调试方式......但为什么老员工就能泰然自若,不愿意升级问题呢?也许是习惯了吧。


不少新人在日报中抱怨,一个脚本HIVE跑了很多个小时没跑出来,因此只能凌晨起来乘着人少跑,运维说一些不规范的脚本也帮助查杀了,性能也就这样了。


接到客户投诉,说一个标签质量有问题,核查发现原来标签开发人员为了万无一失,将正确的标签命名为sex_new,老的标签sex还留着,说是担心梳理不出对老应用的影响,就想了这个两全其美的方法。


这些看似不经意的问题,其实对于大数据的效率影响很大,一旦习惯了就会积重难返,大家都懂的,但关键是这些其实并不是团队不能解决的问题,但为什么会习惯于迁就呢?


笔者分析下来,大致有以下的原因;


1、认知格局问题:员工之间,员工与管理者之间信息非常不对称,拥有的视野和资源不同,对于事物的轻重缓急认知不同,比如管理者认为租户性能是全局问题,不及时解决后果很严重,而员工认为自己忍忍就算了,员工经常听到领导的教诲说要站得高一点就是这个理,对冲基金公司桥水将所有公司的资料开放给员工是提升员工格局的一种手段。有时候,不知道这个问题是大问题是最大的问题。


2、趋利避害问题:员工的工作边界有限,对于可提可不提的问题,从降低风险的角度讲一般会选择回避,毕竟提出问题是需要付出代价的,你得分析清楚原因吧,得找到利益相关方讨论清楚吧,一般还得求助上级协调解决,每一样工作都让你脱离原有的工作舒适区,这个违背人性,多一事不如少一事。


从更自私的角度来讲,比如碰到的是工具不好用的全局问题,我慢你也慢,那就不会由于这个问题导致自己的成果比别人差,那就无所谓了,其实很多KPI做到了极端就这样了,问题能否解决、饼能不能做大无关紧要,只要你不比我过得好。


3、沟通环境问题:要打造开放透明的沟通环境非常不易,互联网公司相对比较扁平化,也还在不停的琢磨如何提升企业的透明程度,比如Google,大多企业层级式的汇报体系的确抑制了问题的暴露,从大了讲涉及到企业的文化,从小了讲涉及团建能力,很多问题其实早就有人提了,要么没人理,要么草草应付。


4、小白兔问题:如果说趋利避害还带有一点选择性作为的话,小白兔就是不作为了,不作为不是不做事,如果你的工作都是领导安排的,比如说一下动一下,就要考虑自己是不是已经成为小白兔了。


有人说我的工作性质就是稳定啊,只需要执行就成,没有需要主动推进的事情,姑且不说这种被动心态,其实任何事情有深有浅之分,没有简单的事,只有简单的人,比如按部就班的处理工单算做事,想着如何提高工单效率也是做事,把处理工单的方法编撰成手册是做事,最后实现了一套自动化工单处理系统更是做事,其实没有人为你过设定边界,前者相对后者就是小白兔,而小白兔对于大数据这种创新团队影响更大。


大家会笑国王的新装,但自己不小心就会成为主角,管理者则被过顶传球了,这对于团队的伤害很大,大数据这类新事物特别需要问题的暴露和反馈,从而推进各类问题的快速解决,刻意练习提到重复单调的10000小时努力不会让你成为专家,这个道理同样适用于团队,卓越的团队无法靠无脑的扩张和机械的重复打造。


互联网公司值得我们学习的,不仅仅是技术,透明化、扁平化绝对是重要的一条,Google在《重新定义团队》提了很多了,对冲基金公司桥水创始人瑞·达利欧在《原则》一书中提到了“极度求真和极度透明”,李开复在微软亚洲研究院提倡的“白板文化”激荡和迸发了多少创意,也许只有经历过才能知道开放透明的价值。


毫无疑问,大数据将带来平台,工具,管理的巨大变革,有太多的问题需要解决,而能否勇敢、坦诚的提出问题是适应新变化的前提,同样起点的团队,会由于开放透明程度的不同形成巨大差距,大数据不能容忍鸵鸟政策,比如前面的三个问题通过团队的群策群力,我们给出了以下举措:


措施1:将开发管理平台的体验改善提升到团队工作的高级别,落实相关开发资源,在年底前逐步解决,同时反思项目化的建设模式是否符合新时期的要求。


措施2:新申请租户资源或者调整各个租户资源配额,削峰填谷;将开发人员按业务拆分成多个团队租户;明确开发规范,在年底前将开发规则内嵌在开发管理平台。


措施3:标签上线增加审核,比如区分变更还是新增,规范命名,对于存量标签相似名称进行核查,下线造成歧义的雷同标签。


现在有个热词叫做涌现,凯文.凯利在他的《失控》这本书中专门讲过蚁群,一只蚂蚁可能什么都做不了,但是一群蚂蚁通过一种协同的机制,可以做出很多精巧的事情。人的大脑是由神经元构成的,但是单个的神经元独立的看只是一个部件,但是通过不断的刺激,让神经元之间产生联系之后,我们就可以创造人类文明。这些就是涌现。我们熟悉的市场是涌现,区块链技术也是涌现。


这个道理似乎也能应用于团队,如果每个成员都能做到知无不言,团队将涌现出一种高效解决问题的能力,这也是我们梦寐以求的吧。


当然,笔者这里只是提出了问题,但却无法告诉解决问题的办法,比如打造开放、透明的团队环境的具体方法,因为自己也不知道,只知道照搬别人是很难的,因为每个企业有自己独特的环境,头脑风暴在一些企业很好使,但在很多地方完全不行,为了加大沟通让新人写日报能成,但对于其他人就不一定适用,因为不一定能对这个事达成共识,强扭的瓜也不会甜,“白板文化”说说容易,但真功夫不是看看李开复的书就能学会的,还是要自己实践和体会。


但在这个特殊的时期,理解“开放、透明的环境对于大数据团队是如此重要”这句话是非常有益的,因为认识到这个问题的重要性才有行动的可能。


你看赫拉利又出了本新书《今日简史》,他只是提出了21个问题,啥回答都没有,但也引发了大家的思考,最近正好读托马斯.弗里德曼的《世界是平的》一书,也发现了类似的话,分享于你。


一位朋友曾向诺贝尔物理学奖获得者伊西多.拉比询问他的成才之道。拉比回答说,小时候每天放学后母亲都会问他当天的学习情况。她对儿子一天所学的内容并不感兴趣,但她总是会问:“今天你是否提出了一个好问题?”,拉比说:“提出好问题让我成为了科学家。”


作者:傅一平    微信号:fuyipingmnb  欢迎交流!


视频 小程序 ,轻点两下取消赞 在看 ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存