查看原文
其他

我如何设计数据团队的入职培训课程?

傅一平 与数据同行 2022-05-08

这是傅一平的第349篇原创



【与数据同行】已开通综合、数据仓库、数据分析、产品经理、数据治理及机器学习六大专业群,加微信号frank61822702 为好友后入群。新开招聘交流群,请关注【与数据同行】公众号,后台回复“招聘”后获得入群方法。


正文开始


当数据团队达到一定规模化后,数据团队的leader必然要体系化的考虑新人培训的方式,这不是要不要的问题,其体现了游击队和正规军的区别。

笔者知道实践是最好的学习方式,但实践能获取的知识的面还是有点窄,有些道理不提前说,也许别人永远不会知道,毕竟有超高天赋的人是少数。

新人的学习应以实践为主(占比80%),但也要辅之于培训(10%)和书籍之类(10%),这样能让新人更快的融入团队,眼界也会好一点,即使他现在还无法完全领会培训中的内容,但毕竟已经知道有这个东西,不知道自己不知道才是最可怕的。

我们以前其实有很多的专业课程,但几个主管都建议弱化通用专业知识的培训,因为通用专业的知识新人完全可以自学,在实践中慢慢领会,但新人更需要从真刀实枪的实践中总结出来的做事方法和规矩。

比如开发组需要培训SQL代码的开发规范,运维组需要培训自己的告警和故障的处理流程,建模组需要培训自己总结的成功建模的经验,产品组需要培训当前产品管理的过程,所有这些都需要资深的员工定期进行总结,最好亲自讲解,这是最接地气的培训方式,也是我从华为大学那里得到的一些启示。

今天就来谈谈数据团队新人培训课程的一个设计,共分为入职基础准备、数据建模通识、数据建模实战、优秀案例实践进阶初级能力测评五大部分,这些培训涉及的知识是每个新人都需要掌握的,不管你的专业是数据运维、数据开发、数据建模、数据产品、数据分析或是数据运营。

一、入职基础准备

新人来到数据团队之前,公司人力资源部门肯定已经安排了一些通用培训,诸如企业文化等等,但为了让新人更快的融入团队,团队还需要制定自己的培训课程。

1、团队介绍

至少包括团队的组织结构、人员构成及职责分工,也包括团队的主要工作内容及近期重点工作,要让新人对自己所处的团队职责有进一步的认识。

2、如何工作和成长

公司有企业级的使命、愿景及价值观,团队leader应该有责任去诠释这个企业文化是如何在团队中落地的,假如企业的价值观是“以客户为中心,以奋斗者为本、坚持自我批判、坚持开放进取,坚持团队协作”,团队leader就要以身作则,以案例的形式去诠释团队是怎样落实这个价值观的。

以“奋斗者为本”为例,要说清楚团队对于奋斗者的具体要求到底是什么,老黄牛可以叫作奋斗者,工匠也可以叫作奋斗者,创新者更可以叫做奋斗者,团队更看重的到底是哪类奋斗者。

也许团队的leader有自己工作和学习的方法论,但如果不去总结,不懂得去教,这些东西对于团队就毫无价值,也就很难带出一支有战斗力的团队,一定要把团队尊崇的这些原则清晰的传递出来。我极力倡导团队的leader以身作则去做培训。

3、如何写报告

能够写好报告、是一个人职业上升很必要的高级技能,无论是日报,周报,月报、综述报告(比如你代表部门给公司做一个报告)、研究报告(比如竞品分析)等等,以下是写报告的一种套路:

(1)要搞清楚报告的目的

(2)搞清楚听的人是谁,如果是帮领导写,要站在领导或部门的角度思考而不是自己的

(3)正式写之前先理结构,可以先按照金字塔原来画个思维导图

(4)理完结构找素材,最好是能直接说明的数据等等

(5)开始写,就是把素材放到搭好的结构里的坑里

(6)平时可以积累结构框架,案例模板等等。

如果让新人自己去总结,估计是很难的,不要抱怨新人不会写,而要反思团队为新人做了什么,报告这种关键技能其实是能教的,培训的性价比很高。

二、数据建模通识

建模现在是一个通用的概念,其实有三层意思,第一层是数据仓库建模,解决数据标准化和效率的问题,第二层是数据挖掘建模,主要采用机器学习、人工智能的手段从数据中挖掘出知识,第三层是数据分析,主要基于指标维度的组合发现业务中的问题,从而指导决策。

1、数据仓库建模

以前数据团队新人领进门,马上就会安排去取数,做了大半年,新人的取数技巧可能已经炉火纯青,但后劲不足,究其原因是新人的数据视野太窄了。

团队有责任也有义务让新人对于公司的整个数据仓库有基本的了解,包括采集了哪些数据,有哪些基础模型和融合模型,有哪些建模的规范,避免新人“只见树木,不见森林”。

在理解全域数据的基础上,要能端到端的展示数据采集和数据建模的整个流程,从而让新人对于数据的平台有个更为体系化的认识。

2、数据挖掘建模

现在大量的业务人员都能基于python进行数据建模了,数据团队的所有新人对于数据挖掘都要有基本的理解,至少要掌握四个方面的知识:常用的挖掘模型、数据挖掘常用宽表、数据挖掘的具体流程、数据挖掘的军规等等,比如对于数据运维工程师来讲,不懂数据挖掘就很那去优化输入输出这个环节。

3、数据分析方法

机器学习很高大上,但机器学习的前提是业务理解,而业务理解的量化手段就是数据分析。数据分析的基本概念包括报表、指标、维度、趋势、结构等等,撰写数据分析报告也是有方法论的。

在大多数的决策支持、精确营销或经营分析场景,拥有数据分析的能力已经足够了,一个企业的精确营销模型,大多数时候也仅仅是业务经验和规则的沉淀而已,很多暴力建模师总想着用算法来搞定一切,但懂得数据分析的技巧却可以事半功倍。

三、数据建模实战

工欲善其事,必先利其器,新人需要能基于企业数据中台提供的工具链(现在也叫DataOps,其是数据的加工厂,将数据变为信息和知识)端到端的完成整个数据建模过程。

每个企业拥有不同的工具链,决定了不同的培训内容,新人至少需要熟练掌握数据开发、数据挖掘、客户标签、数据服务相关的平台或工具。

掌握数据开发工具主要是能够端到端的完成离线/实时的数据处理过程,SQL是基本操作语言。

掌握数据挖掘工具主要是能够端到端的完成数据处理、模型训练、模型验证、模型发布的整个过程,Python、R是主要的操作语言。

掌握客户标签库工具主要是能够端到端的基于数据开发工具生成标签,并能够基于标签的组装计算生成客户群并推送到生产系统。

掌握数据服务工具主要是能够端到端的开发完成一个数据服务并对外开放。

四、优秀案例实践进阶

以前牛逼的人走了,没留下任何东西,这对于企业是巨大的损失。资深的员工需要将成功的经验以案例的形式总结出来,这些人的经验是新人快速成长的助推剂。

比如数据挖掘成功实施案例至少要说清楚各阶段成功的关键要素,哪些需求可以不做,怎么用团队智慧进行设计,在哪些阶段需要领导参与,跟业务人员要明确哪些资源,变量准备和调参上有哪些技巧,怎么定义模型在业务上的成功等等。

比如数据开发平台实施案例至少要说清楚它跟业务平台有什么本质区别,为什么要把它当成一个产品,为什么体验这么重要,为什么以前都做失败了,为什么要强调全链路端到端,为什么标准化的商业化产品很难成功,如何处理好与合作伙伴关系等等。

比如数据分析成功案例至少要说清楚为什么这个课题容易引起关注,如何跟上级做好互动,如何推动业务部门的参与,如何推动分析结果的落地,如何与生产系统进行协同,如何牵头进行运营,如何阶段性的进行汇报等等。

当然还包括数据归集、数据产品、数据运维的优秀经验等等,这些经验沉淀多了,就能抽象成方法论的东西,对于团队非常有价值。

五、初级能力测评

考试是最好的学习手段之一。

虽然培训在学习中的比例不高,但只有数据团队的leader才知道自己的团队成员最需要什么,而这些培训往往是外面很难给予的,只能靠自己。当然培训只能起到引入门的作用,但对于有心人来讲,这是非常重要的。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存