我们需要什么样的大数据培训?
点击上方
请您点击“与数据同行”以“关注”,关于数据的实践与思考,每周一我在这里等你!
作者:傅一平 博士 浙江大学毕业
企业的大数据平台起来后,培训是普及大数据的关键环节,虽然当前外部大数据的商业培训很多,但大多侧重理论、通用语言、算法和工具的使用培训,实际上,当学员回到企业后,要想具备实操能力还有相当的距离。
笔者强调企业应该建立自己的讲师队伍,只有让企业自己的平台建设者,产品研发者,数据采集者,数据建模者来现身说法,才是最好的培训方式。
培训的最终目的是让受培者基于掌握的技能在生产中创造价值,而内训如果能直达目的,那就是最好的培训方式。
公司的大数据平台起来后,我们自建了培训课程体系,分为PaaS、DaaS及SaaS三类:
PaaS课程:强调如何基于企业大数据平台提供的数据和工具端到端建设一个应用和模型
DaaS课程:强调如何使用企业现成可用的标签或模型
SaaS课程: 强调如何使用好企业自己的核心产品
以下是当前的17门实战课程,课时高达71小时。
课程的内容如下:
1、 架构介绍
主要是让学员对于自己企业的大数据平台架构,有哪些组件,有哪些能力有个大致了解,因为后续大家都会用到这些组件,需要有个宏观认识,包括《综合培训》和《平台环境整体介绍》。
2、 数据介绍
要让学员知道自己企业到底有哪些数据,这些数据的业务含义是什么,这些数据是怎么分类的,怎么采集的,存储在哪里,周期如何,特别是,对于一些价值较高的数据要特别说明,很多甚至要举具体应用场景说明,比如上网数据,必须告诉哪几个字段最为核心,一般怎么用,虽然企业有数据字典,但数据字典对于很多用途表述并不清楚,必须让有经验的使用者现身说法。
我们都是让企业的建模负责人来介绍的,一般大局观要好一点,可以起到很好的引领作用,数据是企业最核心的资产,让每个人理解自己的家当有多少最为重要,就好比烧菜,再好的厨师,如果没有菜,也是巧妇难为无米之炊,这是一个基础。
这里涉及了《价值数据之融合模型和标签》、《价值数据之基础模型和新数据》两门课程。
3、 平台介绍
有了数据,就需要让学员知道如何访问并使用它,一项核心工作就是申请平台的访问权限,另一个则是平台如何使用了。
诸如浙江移动已经建立起了自己的可视化数据管理平台,也叫DACP,可以基于这个平台去访问底层不同数据库的数据,比如GBASE/HIVE/REDIS/流处理等等,DACP集成了开发、调度、维护、查询、质量管理等系列功能,这门课程要花费16个小时,学员只有掌握了DACP,才算是打开了企业大数据的门,这门课程叫作《DACP实战开发》。
4、 数据挖掘
主要是进行三方面的培训,一个是数据挖掘常用的理论和算法介绍,这个也是大多数商业培训机构的重点,第二个是大数据挖掘实操案例,对自己企业的一个真实案例去端到端的完成讲解,让学员对数据挖掘有更深刻的认识,第三个就是对于SPARK数据挖掘平台使用作介绍,也是实操性的,用的是SCALA语言,课时也是16小时,当然其实是远远不够的,仅当抛砖引玉。
这里涉及了《数据挖掘理论和算法》、《大数据实操案例讲解》、《SPARK实操》三门课程。
5、 应用开发
我们不仅希望学员能自己建模,也鼓励有能力的人能基于大数据资源池、大数据平台的众多组件开发自己的应用,因此需要在应用的设计规范、环境集成方案、组件调用方式等各个方面提供培训,让学员能搭积木一样完成自己的一个应用,这种模式要求较高,但价值可期。
这里涉及了《大数据应用开发之搭台唱戏》、《大数据实时计算解决方案及案例讲解》、《大数据产品建设经验分享及案例讲解》三门课程。
6、 标签建模
公司通过多年的积累,已经沉淀了2万标签,大多数学员使用标签无需从头开始,只要在原有的基础上创新即可,因此,把当前公司已有的标签类别,标签价值说清楚是很关键的,同时,基于公司的DPI上网数据去爬取及解析内容,对于内容标签体系的建设至关重要,也是未来公司内容运营的核心竞争力,也有必要介绍清楚。
这里涉及《大数据标签能力》、《爬虫及互联网内容解析》两门课程。
7、 产品介绍
对于当前公司最重要的大数据产品做了介绍,包括标签库的使用和营销平台的使用,这两者的地位大致相当于互联网公司的广告平台。
一个企业建设了大数据平台只是大数据运营的开始,台子有了,没有唱戏的人,也是白搭,很多时候企业靠IT的几个人跳到台子上去跳舞,显然对于整个企业大数据的价值运营也是杯水车薪。
做好大数据培训是运营中的关键环节,针对性要很强,决不能泛泛而谈,更多需要依赖自身人员去打造,毕竟,只有自己的人才最懂企业需要什么。
历史足迹
传统BI的认知:
大数据的实践:
数据管理的领悟:
《七幅图读懂企业的数据字典》
数据人员的修养:
运营商大数据:
我的读书笔记:
▼
与数据同行
ysjtx_fyp
长按二维码识别,关注此号!