查看原文
其他

如何在业余时学数据分析?

陈老师 R语言中文社区 2019-04-23

点击图片,查看课程详情


想了解自己数据分析能力到了哪一层,戳{数据分析6个能力等级}(https://edu.hellobi.com/course/185)

想和大牛学更多思维方式,戳{和管理咨询顾问学思考}(

https://edu.hellobi.com/course/199)


高赞回答讲的更多是数据能力,分享一个提升分析能力的方法。

数据分析,数据和分析其实是可以分离的。因为分析本身并不一定需要数据。我们看了900集柯南,大部分案件依靠的是事实证据和逻辑推理;女生抓男票出轨,更多是靠女人心机和第六感。这些你不能说不是分析,只是用到数据很少而已。而数据也不一定用来分析,比如订单数据可能更多是驱动订单流程的完成,即使不做任何分析,快递小哥拿到一条订单数据中的送货地址字段,也能去派单了。

我们当然不想看到数据和分析脱节。然而在相当多的企业中,数据部真的就只是数据部。等着业务部门派需求,做报表。报表有什么用?用到什么地方去?用了又怎样?一问三不知。在这些企业,往往分析工作是战略发展部、市场部、运营部、财务部的某个经理做的。这种环境下,即使挂了个数据分析师的头衔,工作也相当苦闷。因为提数实在是太没有技术含量了,随时可能被智能BI软件或者刚毕业的小哥取代。在企业里也没地位,经常被人鄙视的称为:跑数的。我们学了那么多技能不是为了给人当人肉跑数机的,所以结合数据,提升分析能力是非常重要的。

分析能力,恰恰非常适合在业余时间提升。因为企业里大部分时候轮不到我们说话,为什么要分析、分析了有啥用得找业务部门的同事切磋。但生活里处处有可以分析的东西,小到去哪里吃饭,大到买房结婚投资。如果认真地用数据分析的思维看事情,你就会发现:我们远没有自己想象中的理性。这也就有了大量的练习分析能力的机会。

举个例子,有个经典问题我经常拿来培训新人。找个股市大跌的某天,一脸沧桑的在办公室叹口气:“我炒股亏了100万!咋办啊!”下属基本都笑哈哈的说:“没事你家大业大不怕”;同事会嬉皮笑脸的:“跑路前先把饭前还清哈” 这时候,再把下属们召集起来,认真的说:“我给大家10分钟时间,认真思考下刚才的那个问题,你会怎么答?”这时候大家才发现有坑,纷纷表示刚才太不专业了。专业的数据分析师不应该这么回应。


该怎么回应?从一个简单的问题开始:

Step1.这到底是个什么事啊?

认真想想,我炒股亏了100万,看似带了数据,看似表达清晰,其实什么都没有说!因为一件完整事情的7要素,这里只交代了2个。Who = 我,How much = 100万。可其他的一概不知。甚至连100万的单位是什么都不知道。炒过股的同学都知道,亏在不同人口中意思可能不一样。有些人管没抄底成功,少赚了叫亏。有些人管斩仓出逃,结结实实亏损了叫亏。所以这里要落实清楚细节,才知道到底是个什么事。

用数据分析的行话讲,这叫做:5W2H分析法。这个方法可能大家在学校看《管理学》《营销学》一类书都有看过。然而书上没有交代的是,在企业里真正用的时候,这5个W,2个H不是一竿子插到底的。而是这样分组(如下图):


前4个W用来定义问题。咱先搞清楚到底发生了什么,再谈后续为什么会发生,该怎么处理。在数据分析类问题上,这个分析还有另一层含义,就是确认数据指标的含义、统计时间、计算公式。既然要数据分析,那数据指标到底是什么总得先说清楚吧。这也是我们常听到的:数据敏感性。一个对数据敏感的人,会第一时间关注数据的含义、来源,而不是听到个数据就开始联想具体的事情了。

有些同学会好奇:这么简单、基础的事,也算是分析能力?当然是哈。人们看高楼大厦,看的都是外形、装修、彩灯、园林。可高楼大厦都是在地基上打起来的。数据指标的含义,数据来源真实性、准确性、全面性,就是数据分析的地基。地基不牢,地动山摇。

而如果大家按这个标准,试着看一下我们平时的生活对话,就会发现:我们自然状态下的对话,大部分都是不严谨不规范的。特别是涉及我们和经常打交道的人之间的对话,太熟悉了就会省略很多细节。更不用说,类似自己老妈唠叨自己的话,自己女朋友抱怨自己的话,很多时候都是在简单的发泄情绪,而不是在描述事实。所以,在生活中,我们有着大量练习5W2H分析法,提升数据敏感性的地方。说不定练多了,不但数据分析能力能提升,连和女票吵架的次数都少了很多。

在工作中这种场景就更多了。诸如运营跟你说:我们的活跃用户减少了,分析下为什么?市场部给你说:看看哪类用户更容易响应营销活动。看似清晰,实则跟没讲一样。如果不细细理清需求,后边可以预见的是返工、加班、抱怨哈。


Step2.这到是个多大的事?

假设我们确认了,真的是结结实实损失了100万RMB,又怎样呢?对于不同的人,不同的场景可能完全不同。试着感受下以下场景的区别:

1. 我身价1个亿,损失了100万

2. 我身价1个亿,但9千万是房子,流动资金一共1千万,损失100万

3. 我身价1个亿,1千万流动资金,但欠债1200万,股票又损失100万

4. 我身价1个亿,1千万流动资金,欠债1200万,股票又损失100万,但股票已经止跌回升

四个场景完全不同,对不对。单纯的了解问题,还不能帮助我们导出解决问题的结论。解决问题,要先看轻重缓急。不同程度问题有不同的处理方式。这里可以有多种分析方法

结构分析法(杜邦分析法简化版)帮我们看清楚问题结构,看到出问题的部分在整体中的位置、占比,这样可以理解问题的轻重。身价1个亿亏100万和身价20万借债又亏100万,肯定是两个层面的问题。


对比分析法帮我们看清楚问题大小。对比分析,关键是要树立标杆,通过不同的标杆对比,看到问题在哪个方面影响比较大。比如即使身家1个亿,但一把亏了100万心理也很定难受。这时候就说明,存在两个标杆,一个现实中资金需求,一个是心理期望值。很多时候我们过不去某个坎,不是因为现实中离了XX就不能活,而是心理接受不了这个事实。所以树标杆对比的时候,得多角度考虑才行。


趋势分析法帮助我们看清问题的缓急。比如炒股,至少能看大盘、板块、个股三个维度。如果看起来跌的很厉害,但是大盘向好、板块稳固,个股也开始回暖,那很有可能个股也会很快止跌回升。如果一直阴跌不止,那问题可能不会自己好转,就急需我们主动解决。


这些方法计算非常简单,用行话讲叫:描述性统计。然而描述性统计摆在一起,就能解释许许多多的问题。做好描述性统计也是进一步建模分析的基础。实际工作中,描述性统计用处比建模多得多,因为很多时候我们没有那么多数据建模型,很多时候问题的紧迫性也容不得我们慢悠悠的调参训练。练好描述性统计是数据分析能力提升的重要一步。

在现实生活中,这种场景就更多了。比如之前深圳中兴的著名悲剧跳楼事件。如果大家根据事件中透漏每月还贷金额,深圳市近3年的平均房价,房贷利率等参数,就很容易推算出来:这个不幸跳楼的哥们如果卖掉深圳的房子,就至少有560万以上的净资产,很有可能导致悲剧的不是现实困难,而是思想拧巴了。数据分析本质上就是用理性思维指导决策,避免感性的一时冲动。现实生活中,我们冲动的时候可比工作上多多了。所以平时好好练习,不但对工作有帮助,有减少生活中的烦恼也可能有帮助呢。


Step3.为什么会出这件事?

知道问题的原因才容易找对策。而我们恰恰容易在找原因的时候lost。比如这个问题:我为什么炒股会亏100万。大家第一反应都是:哪个股亏了那么多啊?然后就把问题引导到:到底选个什么股上。可实际上,仔细想想:别人问我们的也不是选什么股啊?即使我们真的有本事帮他选到一个股又怎样?很有可能下次照样来哭哭啼啼问:又亏了怎么办。辨别眼前的问题是什么很重要,如果不能深度解读,至少把问题限定在别人正面提问的东西上,不要多度发散。

既然人家问的是:“我”该怎么办。那就从“我”的角度来分析,为什么会亏这么多。这里可以用矩阵分析法。矩阵分析法其实就是屌丝版的聚类分析,当数据没那么多,指标维度少的时候,就简单的用两个最关键指标做二维分类,从而提炼出含义。比如这里我们可以做个这样的矩阵:


这里的分析假设就是:如果一个人每次交易都能盈利,并且总盈利金额也大大超过某个炒股APP的网友平均水平的话(这个数据APP一般会自己统计)那么我们认为他有能力炒股比一般人强,那这一次失手的原因就是老司机偶尔马失前蹄了。

如果一个人大部分交易都是不盈利的,但偶尔一两次赚了很多钱,怎么说?可能他真的是吉星高照,虽然没本事炒,但是偶尔碰上一两次好运就赚很多。然而这一次为什么亏了这么多呢?好运到头了。如果一个人是反过来的,经常赚钱,但都赚的很少,那这次一下巨亏,很有可能是对自己过于自信,想赌一把,结果赌漏了。当然,还有那种屡战屡败、屡败屡战的,这种就洗洗睡吧。

通过这样的分析,即使我们不懂具体股票是怎么炒的,也能从结果反推出来大概的情形。从结果反推原因,是一个非常重要的数据分析能力。很多同学一想到因果分析,就急着上回归分析了。可很多时候具体的业务发生过程是我们不知道的,或者记录不到详细的数据。比如运营活动,我们能记录到每一步的转化,但到底这个文案顾客理解不理解,到底这个优惠力度人家care不care,数据很难记录,这时候就需要从一系列结果去反推原因。

在日常生活中,这种能力也能被大量锻炼。比如我写这篇时临近过年,大家或多或少都会回家遇到炫富的,比高低的,寒碜人的熊亲戚。挺住!别怂!不要被:我在京东年薪百万之类的吓倒!都年薪百万了,title呢?部门呢?是骡子是马拉出来猎聘、51JOB上溜溜。从岗位等级反推收入,也是练习分析能力的方式哈。

当然,如果能直接问问题最好。如果不是数据分析师,而是市场研究员分析这个问题,可能就会直接出一张问卷,形如:

【单选题】Q1.请问您为什么会亏100万

A. 整体市场环境不好

B. 个人选股能力不行

C. 操作当时脑子昏了

D. 其他 【请填写】

然而如果只简单这么问,是会有问题的。第一、人家不一定有这个心情回答;第二、谁会承认自己不行呢?肯定是怨天怨地;第三、即使是选了能力不行,到底有多不行还是不知道,所以即使有问问题的机会,还是要结合数据验证。最简单的验证方法就是对比分析法。比如一个人说大行情不好,所以我割肉跑路亏钱了。那可以把大行情好和不好的做成标签,看他之前的交易,在大环境好和不好的时候,交易亏、赚的比例。就能验证他有没有再说谎。

对比分析法在日常中,能训练的机会就更多了。实际我们生活中大量的习惯都能做对比检验。某天,我买了个红色盒子的MM巧克力回家。小宝宝非常喜欢玩。我就随口说了句:“你看宝宝喜欢红色的盒子”。我太太立马说:“是吗,马上检验一下啊!”然后立马设计了n组实验:都是盒子,不同颜色的摆在一起让宝宝挑;不同形状的摆在一起让宝宝挑;还调换摆放次序让宝宝挑。几轮下来,把俺的结论杀的大败。也让我总结了一个新经验:这小坏蛋就是单纯的不给他爹面子。T_T


Step4.要不要处理这件事?

最后要不要处理:我炒股亏了100万的问题呢?如果我们之前的工作都做的很好,对具体情况掌握的一清二楚,这里就很容易下判断了。简单来说,这就是选择题(如下图所示)


想复杂的话,可以做综合评估。综合评估的方法有很多,复杂的如神经网络分析、简单的如AHP、因子分析、专家法都可以做。其实无论算法简单还是复杂,核心都只有两个:参考因素、权重。在日常生活中,具体的分析过程肯定是练习不了了。但是不影响我们养成列举考虑因素和权重的好习惯。

因为当我们习惯了列举因素和权重以后,你就会发现,日常生活中很多问题压根就不是问题。或者说,很多问题是建立在我们的偏见、误解基础上的。比如过年回家(写这篇的时候刚好过年,多举几个过年的例子)大人催你结婚,给的都是啥考虑因素:

l 别人都结了(别人关我什么事)

l 这个年龄该结了(谁规定的)

l 我想你该结了(???)

l 我想抱孙子(???)

……

这些理由甚至都不是站在你的角度分析!为啥我要考虑跟我没关系的权重?????


Step5.怎么处理这个事?

最后终于到了建议环节,其实如果前4步做的好的话,建议简直就是水到渠成的。因为我们已经充分掌握了问题情况、问题轻重缓急、问题的原因、考虑重点因素,导出结论自然是易如反掌。只是有一点要提醒:具体的方法不一定依靠逻辑推导,也完全可以靠自己的创造力!其实那些惊为天人的神来之笔都不是计算出来的,而是创意出来的。所以通过数据分析可以评估方案的优劣,可以导出四平八稳的结论,但不能取代创作方案本身,因为伟大的成果最终是来自伟大创意。


所以总结一下,分析问题可以有一个很简单框架,涵盖了数据分析从定义指标到给出分析建议的全过程。这些过程其实渗透进我们生活的方方面面,即使没有电脑,也不影响我们每天进行练习。因为本质上讲,数据分析只是思维方法的一种,我们明天自己都在做着大量决策,自然也需要这种思维方法。


然而,从之前的大量例子也能看出:数据分析能力,或者说理性的思维,在日常生活中如同金子般珍贵。在生活中我们自己都充斥着各种不理性的决策:

l 不去区分模棱两可的概念

l 想当然的认为别人和自己理解一样

l 怕麻烦,不去收集数据

l 怕拒绝,不敢深入问问题

l 热血上脑,一冲动就拍脑袋

l 习以为常,习惯怎么来就怎么来

这就给了我们大量在业余时间锻炼的机会,不断自我挑战,剔除自己不理性那部分,让思维尽可能科学化。

从上边的分析过程也能看出:好结论是大量前期分析之后,水到渠成的产物。可我们偏偏又习惯于先入为主的给意见,屈服于习惯、大众说的、主流媒体的态度,甚至连多几句沟通都嫌费事。这种时候做出不那么聪明的决策,也就在做难免了。

生活如此、工作亦如此。要知道数据分析师是拿死工资的。可销售、市场、运营肩头背着业绩压力,他们在更大压力、更多挑战、更多未知的环境下工作,就很容易冲动,更容易理所当然。这时候如果我们自己没有养成良好的分析习惯,只是甩一些数字给人家,当然会被当做不专业,当然会被当做没水平,当然会被当做提数机器:因为我们也只给了一个数啊。

当然,生活中有可能不能获取那么精准的数据。有可能我们列出指标、假设、考虑因素,也很难100%的量化,但就和我们在工作中不能收集100%完善的数据一样,少,不代表不能练习,更不代表不能做一些深度思考。好的数据分析师就应该像《三国演义》中的诸葛亮一样,兵多了我能摆八卦阵,兵少了我能摆空城计,没有兵,我还能草船借箭不是。与大家共勉。



大家都在看

数据分析职场路上有困惑?不妨花几分钟来看看...

有哪些典型的「学生思维」?

超级菜鸟怎么学习数据分析?

听了煎饼大妈忽悠,你也推着小车上路以后

边浪边学习的秘籍!不看又亏一个假期

商业分析能力是怎样炼成的?

拒绝鸡汤,我要挣钱!用数据分析找到销售成功背后的真正秘密

那些小城里的分析大师们为什么发不了财?

非常认真地完成现有工作,却得不到加薪待遇?



作者:陈老师,在咨询行业打拼了9年,在如何诊断经营问题、建立分析体系、解决专项问题上有超过30个大型项目积累与实战,天善智能特邀专家。

个人公众号:接地气学堂

博客:https://ask.hellobi.com/blog/chenwen


数据分析职场路上有困扰吗?不妨到《数据分析师八大能力培养课程》https://edu.hellobi.com/course/272 里聊聊!

视频课程特色:

从真实数据分析工作场景出发,训练实战能力

启发式教学+大量实际操练,培养属于自己的能力

不依赖于某个具体技术,也适合对数据分析感兴趣的学生、业务部门人士学习

☟☟☟ 猛戳阅读原文,即刻加入课程。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存