查看原文
其他

数据分析是行业,还是技能?(上)

The following article is from 木木自由 Author 木兮

前言

   

随着5G以及大数据时代背景下,数据分析领域相关岗位也是呈现多元化的发展趋势,如数据运营、经营分析师、商业分析师、数据科学家、数据工程师、数据架构师、算法工程师、数据产品经理、数据分析师......
 
无论从哪个视角来看,数据分析是不会脱离业务存在。也很大程度会决定我们所需要掌握的能力栈,如金融行业的风控模型、电商行业的转化漏斗模型等等。那么,我们应该是把数据分析作为一个行业,还是一种技能来看待呢?

本文将从数据分析领域的岗位详解以及数据分析在其他领域的应用进行简单的梳理分享,其目的主要让大家清晰地了解“数据分析”后,结合自己的自身经验和认知情况,是把数据分析作为行业,还是当做一项技能?仅供参考!
 
数据分析领域的岗位详解




01


偏业务方向的数据分析岗位


偏业务方向的数据分析,一般属于运营部门。有数据运营、数据分析师、商业分析、数据产品经理等,其岗位的职位描述一般是:
  • 负责和支撑各部门相关的报表;
  • 建立和优化指标体系;
  • 监控数据的波动和异常,找出问题;
  • 优化和驱动业务,推动数据化运营;
  • 找出可增长的市场或产品优化空间;
  • 输出专题分析报告;
 
下面我们介绍几个常见的岗位详解:


数据运营

主要负责运营相关数据的分析,协助运营人员制定数据分析策略,为日常运营提供数据支持,协调落地,形成推动闭环等,以活跃指标的下跌举例:
  • 活跃指标下跌了多少?是属于合理的数据波动,还是突发式?
  • 什么时候开始的下跌?
  • 是整体的活跃用户下跌,还是部分用户?
  • 为什么下跌?是产品版本,还是运营失误?
  • 怎么解决下跌的问题
  • ·····

在工具方面,主要以Excel+SQL+PPT+运营思维为主。总之,往往更关心某个指标为什么下跌或者上升。产品的用户是什么样的?怎么能更好的完成业务的KPI。
 

数据分析师

主要将业务数据体系化,建立一套指标框架,其次数据提取、清洗、多维度分析、预测;生成策略推动执行。如活跃下跌的问题,本质上也是指标问题。什么时候开始下跌,哪部分下跌,都能转化成对应指标,如日活跃用户数,新老用户活跃数,地区活跃数。指标体系如果工程化自动化,也就是BI,所以数据分析师可以算半个BI分析师,这里不包括BI报表开发。

在工具方面,主要以Excel+SQL+Python/R/SPSS/SAS+PPT。Excel+SQL是必备技能,Python/R/SPSS/SAS任选其一即可。一个优秀的数据分析师,应该业务、管理、分析、工具、设计都不落下。

总之,对于新人,比较普适的发展路线是先成为一位数据分析师。积累相关的经验,在一两年后,决定往后的发展,是数据挖掘和商业分析师,还是专精数据分析成为管理岗。数据分析的管理岗,比较常见的有数据运营经理/总监,数据分析经理等,相对应的能力是能建立指标体系,并且解决日常的各类「为什么」问题。
 

商业分析师

是另外一个方向,更多见于传统行业,一般更加宏观,偏行业研究,主要向高层汇报,基于商业问题和场景,通过数据洞察商业问题,为企业战略和决策提供数据支持,咨询/投行对该岗位的需求会比较多,会更多地关注国内外政策,对统计和业务能力要求更高。若在商业分析师做数据报告时,需要能站在整个行业的宏观角度,去看待本公司、所有竞对公司以及上下游的各种关系与优劣势等。
 
比如要开一家快递驿站,我们就需要考虑哪里开,这就要考虑居民密度,居民消费能力,竞争对手,网上的消费能力等因素。这些数据是宏观的大指标,往往靠搜索和调研完成,这是和互联网数据分析师最大的差异。

总之,商业分析师是需要有一定的MBA或商科背景,在能力上,需要对行业市场、上下游、商业敏感度有强烈的洞察力,能够体系化系统化的进行资料收集、市场研究、竞对研究和用户研究。



数据产品经理

这个岗位比较新兴,适合对数据特别感兴趣的产品经理。它有两种理解,一种是具备强数据分析能力的PM,一种是公司数据产品的规划者。
 
前者,以数据导向优化和改进产品。在产品强势的公司,数据分析也会划归到产品部门,甚至运营也属于产品部。这类产品经理有更多的机会接触业务,属于顺便把分析师的活也干了,一专多能的典型。最典型的场景就是AB测试。大到页面布局、路径规划、小到按钮的颜色和样式,均可以通过数据指标评估。俗话说,再优秀的产品经理也跑不过一半AB测试。此类数据产品经理,更多是注重数据分析能力,擅长用分析进行决策。数据是能力的一部分。
 
后者,是真正意义上的数据产品经理。随着数据量的与日俱增,此时会有不少数据相关的产品项目:包括大数据平台、埋点采集系统、BI、推荐系统、广告平台等。这些当然也是产品,自然需要提炼需求、设计、规划、项目排期,乃至落地。
 
总之,数据产品经理普遍要求如下:
  • 负责大数据产品的设计,输出需求文档、产品原型;
  • 负责推荐算法的产品策略,完成相关推荐及个性化推荐产品的需求分析;
  • 负责分析和挖掘用户消费内容的行为数据,为改进算法策略提供依据;
  • 负责客户端数据需求的对接,制定相关埋点规范及口径,相关业务指标验证;
  • 报表展示工具的落地和应用;
  • ·······
 
还有,数据产品经理必须了解公司或者业务线在不同的阶段,需要哪些数据产品,并能够制作出来,这是此职位的核心要求。其次,数据产品经理必须有足够的数据分析能力,如果有了数据分析的思维,再跟公司业务结合就会比较容易。最后,数据产品经理是产品经理的一种,所以要同时具备产品经理的能力:了解用户,需求调研,方案设计,协调技术、测试、设计等。从职业发展上看,数据分析师做数据产品经理更合适。普通的产品经理,对前端、后端的技术栈尚未熟悉,何况日新月异的数据栈。

 

02


偏技术方向的数据分析岗位


偏技术方向的数据分析岗位,如数据挖掘/算法专家等岗位有的归在研发部门,有的则单独成立数据部门。与业务方向的数据分析师相比较来说,要求更高的统计学能力、数理能力以及编程技巧。有数据挖掘工程师、数据算法工程师、数据仓库工程师、数据科学家等岗位。
 
下面我们介绍几个常见的岗位详解:

数据挖掘

从概念上说,数据挖掘Data mining是一种方式,即可以通过机器学习,而能借助其他算法。比如协同过滤、关联规则、PageRank等,它们是数据挖掘的经典算法,但不属于机器学习,所以在机器学习的书籍上,你是看不到的。
 
实际的应用场景中,如共享单车,如何寻找单车使用效率最大化的最优投放,就是数据挖掘的工作范畴。数据挖掘工程师,除了掌握算法,同样需要编程能力去实现,不论R、Python、Scala/Java,至少掌握一种。模型的实施,往往也要求Hadoop/Spark的工程实践经验,精通SQL/Hive是必须的。
 
常见数据挖掘项目的闭环如下:
  • 定义问题
  • 数据抽取
  • 数据清洗
  • 特征选取/特征工程
  • 数据模型
  • 数据验证
  • 迭代优化
 
总之,单看环节,数据挖掘对分析能力没有业务型那么高。这不代表业务不重要,尤其在特征选取方面,对业务的理解很大程度会影响特征怎么选取,进而影响模型质量。用户流失是一个经典的考题,如何选取合适的特征,预测用户会否流失,能够考察对业务是否深刻洞察。
 
还有,数据挖掘的业务领域一样可以细分。金融行业的信用模型和风控模型/反欺诈模型、广告模型的点击预估模型、电商行业的推荐系统和用户画像系统。从需求提出到落地,数据挖掘工程师除了全程跟进也要熟悉业务。
 

算法专家

数据挖掘往后发展,称为算法专家。后者对理论要求更严苛,几乎都要阅读国外的前沿论文。方向不局限于简单的分类或者回归,还包括图像识别、自然语言处理、智能量化投顾这种复合领域。这里开始会对从业者的学校和学历提出要求,名校+硕士无疑是一个大优势,也有很多人直接做数据挖掘。
 
深度学习则更前沿,它由神经网络发展而来,是机器学习的一个子集。因为各类框架开枝散叶,诸多模型百花齐放,也可以算一个全新的分支。除了要求熟悉TensorFlow, Caffe, MXNet等深度学习框架,对模型的应用和调参也是必备的,后者往往是划分普通人和大牛的天堑。

总之,算法专家和深度学习专家,薪资level会更高一级,一般对应于业务型的数据运营/分析总监。

数据工程师

更偏数据底层,其核心是做好数据仓库建设及ETL数据处理。这个岗位基本不涉及数据分析的能力,而对大数据处理能力要求较高,需要较强的编程及架构设计能力。分析历史、预测未来、优化选择,这是大数据工程师在“玩数据”时最重要的三大任务。通过这三个工作方向,他们帮助企业做出更好的商业决策。要求具备一定的统计学、数学理论知识,有实际开发能力和大规模的数据处理能力,对行业有认知。
 
在很多中小型的公司,一方面数据是无序的、缺失的、原始的,另外一方面各种业务报表又嗷嗷待哺。没办法,分析师只能自己撸起袖子,一个人当三个人用。兼做数据清洗+ETL+BI。

部分归属到技术部的数据分析师,虽然Title叫数据分析(其实应该叫数据分析开发工程师),其工作职责为建设数据仓库、数据库表开发、数据采集、清洗、存储、建模、数据应用、数据平台的建设优化等职责,这就是标准的数据工程路线。部分公司会将机器学习模型的部署和实现交给数据工程团队,这要求数据工程师熟悉sparkMLlib、Mahout此类框架。
 
除此之外,还有算法工程师(核心是机器学习等算法能力)、数据架构师(核心是平台建设及数据仓库建设能力)等等,这些岗位要么跟数据分析能力关系不大,要么能力模型已经包含在前面几个岗位中了,就不一一罗列了。
 
总之,数据科学家是上述岗位的最终形态之一。其要求的能力更加全面,基本综合了前面岗位的核心能力,并且对AI能力及编程能力要求更高,这个岗位也会成为未来数据方向的重点发展趋势。

- EOF -

推荐阅读  点击标题可跳转

1、干货:统计学派的 18 种经典「数据分析方法」

2、CPU 和 GPU:异构计算的演进与发展

3、68 个 Python 内置函数详解,进阶必备


觉得本文对你有帮助?请分享给更多人

推荐关注「Python开发者」,提升Python技能

点赞和在看就是最大的支持❤️

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存