数据团队的发展瓶颈,大多不是技术,而是人员的多样性!
The following article is from 与数据同行 Author 傅一平
正文开始
IT部门一般是企业的后端部门,而数据团队(很多企业叫BI团队)则是IT的下游,可谓后端的后端,数据团队做报表取数是本分,但如果你想在业务上有点直接贡献则非常困难,比如数据团队好不容易研发了一个模型,但发现要推广到全公司则是困难重重。
为什么?
企业对于数据团队一般有两个方面的诉求,第一个,做好报表取数等数据支撑,维持公司的正常运作,比如KPI,财务报表,营销取数等等,第二个,以数据来驱动公司业务的增长,这个使命在进入大数据时代后变得非常迫切。
但这两种职能,对于团队结构的要求是完全不同的,因为前者的诉求是稳定,后者则是创新,我们总是希望一只数据团队在做好报表取数的基础上,能够去做点数据创新,也叫所谓的亮点,从而能更好的体现出自己的价值。
但你会发现,亮点永远只是亮点,你的数据创新驱动不了公司的业务发展,一方面报表取数就像无底洞一样耗尽了团队的精力,资源总是不够用,另一方面,业务部门似乎也对你的数据创新不敢兴趣,厂家更是不给力,好不容易搞了个模型还昙花一现......
没有贬低任何工作的意思,报表取数是很专业的工作,非常强调稳定与标准化,公司需要这类特定的人才,但既然做了报表取数,就不要让他身兼数职去搞什么建模创新。
针对数据创新,比较好的组织形式其实是在业务部门直接设立数据组织,这样沟通成本最低,但由于业务人员的存量包袱往往太重(新创企业或部门例外),创新性会不足,而且数据驱动业务这种思想在国内并没成势,改变也不是一天两天的事情。
最靠谱的就是IT部门自己设立数据创新团队,大数据红火的这几年,很多公司的大数据团队也起来了,但如果只是简单的从原有BI团队划几个人组成新团队,那就是换汤不换药,基本没戏。
笔者经历了BI大发展时期,也有幸进入了大数据时代,更有幸还在干数据的活,因此可以做一些比较,自己的判断是这样:一堆只有取数或报表经历的人是很难碰撞出火花的,即使补充了数据建模师也无济于事,因为数据创新是个复杂问题,缺乏多样性的数据团队要获得突破很难。
下面举两个案例,第一个是关于算法应用的:
团队的建模师一直致力于解决定位的精度问题,优化数据和算法是其强项,但发现如果让他们单独去前端找验证的场景,或者推销他们的成果,往往半天都没个回音,进展非常慢。
笔者后来下了个决心,把做位置产品,商务支持和建模师三个人组成了团队,发现效果是显著的,他们在非常短的时间内就研发出了验证精度的工具,同时把算法成果应用到了实际的产品中,并且帮助商务解决了几个实际应用中的问题。
但一般企业不具备这个条件,这三个人分属三个组织,怎么搞?
第二个是关于数据产品提升的:
笔者在《直击传统商业五大痛点,如何打造一个爆款的商圈洞察产品》中提到我们研发了一款商圈雷达产品,原来的产品开发模式基本是产品经理主导一切,合作伙伴照着做就行了,至于要选择哪些数据,产品经理往往是根据客户要求到标签库找就行了,有就有,没有就没有,最多再调研一下。
但数据产品的核心竞争力其实是差异化的数据,产品团队其实需要有较为资深的数据模型人员参与,你才能知道数据的深浅,哪些数据可用,哪些数据不可用,哪些标签可优化,哪些标签要放弃,还要诸如数据的呈现方式等等。
数据产品团队只有配备了专职的数据模型人员才能确保基本的质量,一款数据产品如果仅仅仅经历了功能的迭代,而没有数据的迭代,这种数据产品很难有生命力,花哨的界面客户看多了也就这样,数据产品一定要回归到数据本身。
笔者也在反思传统BI团队的应用推广困境,虽然有机制和流程上的问题,但如果从自身找原因,可能是传统BI团队缺乏一定的多样性,你不大可能让一个纯粹搞数据的人去做推广,因为运营真的是一个非常专业的活,你得找到适合的各类人才,但大多时候,我们没有,只能硬着头皮上。
你们不是搞建模的吗?谁会为一支数据团队配备运营人员呢?然后我们一天到晚找业务人员,说运营是你们的事啊,但事情没搞大之前,Who care?这个沟通成本真是太高了。
因此,大数据团队要有点突破,有机会就扁平化到底吧,商务的,数据的,产品的,每天你看我,我看你就可以了,他们自然有机会演化出一些好东西。
最后有人也许会问,凭什么你说得是对的?
正好最近看了一本讲多样性的书,叫《多样性红利》,作者是密西根大学政治学教授斯科特·佩奇,其不仅讲了多样性的好处,还说了多样性要发挥作用的前提条件等等,人家都研究了好多年了。
佩奇给“多样性的好处”,找到了坚实的数据基础。佩奇提出,多样性有两个好处:一个是解决问题,一个是做预测,一个多样性的团队特别适合解决复杂的问题,和对复杂的事物做出准确预测。
佩奇的理论可以用两个数学公式概括:
(1)群体能力=平均个人能力+多样性
(2)多样性>能力
这可不是两个观念上的公式,它们背后有严格的数学推导,如果你知道怎么计算统计学上的“方差”的话,用最简单的语言说,多样性的好处就是,三个臭皮匠,好过一个诸葛亮。
很多公司搞开放的办公区域,就是希望不同部门的员工能够经常碰撞在一起,时不时来个头脑风暴,但你也许会再问,既然多样性群体智慧这么有效,那为什么不把事情都交给群体?
比如中国足球每次输球,论坛上都有很多“懂球帝”一致认为主教练的排兵布阵有问题,既然如此,中国足协为何不干脆把决定出场名单的权力交给广大球迷呢?笔者经历也告诉我,大多时候头脑风暴没啥卵用。
为什么?
佩奇又说了,要产生多样性红利,你的问题必须满足四个条件。
第一,这个问题必须得足够难,如果一个人能解决的事儿,强行搞多样性就是浪费人力。
第二,群体中每个人,都必须有一定的能力,你一个专业的问题分析会让个不理解背景的新人参加,其实是浪费他的时间。
第三,群体中每个人都有跟别人不一样的视角和解决问题的方法,比如建模的人和产品的人正是拥有不同的思维模式和技能,两者组合才能有多样性效益,让一堆建模的人讨论模型推广的事情,往往没戏,这其实是最本质的一条。
第四,群体的规模必须足够大,这倒不尽然。
话说回来,数据团队专注于建模其实没错,以前搞天盾反欺诈,由于业务人员急的很,运营的事情完全不用操心,因此团队只要专注于提升模型准确率和覆盖率就可以了。
但如果自己要搞点创新,特别是人家开始还不太理解,比如大数据就有这个特点,这个事情的推进就会变得异常艰难,需要你的团队有多样性的能力,从建模、优化、推广、变现到运营,不一而足。
很不幸,数据创新大多数时候就是这个状态。
—————— / END / ——————
分析最新的数据思想,与百万数据从业者一起成长