打好基础再炫技,不然面试过不去。分析师需重视数据来源
从一场面试事故看基本功重要性
本周,陈老师把一个面试者问崩溃了。
事由是,隔壁组的领导想找一个有较强分析能力的高级策划。
对我说:“老陈,这个第一眼看还行,分析能力这块你把把关”
我就随便问了问,他就崩了 ╮(╯_╰)╭
我看他带了分析报告,就让他讲一下思路
他涛涛不绝的讲完,我把手指向第二页:
“就这里,这个数据,男女比例,这个数哪里来的?”
他愣了一下,回答:“这个是360大数据啊,我标注了的”
陈老师说:“360大数据是吧……”
“360平台是怎么收集这个大数据的?”
“360用户覆盖率是多少?”
“没有覆盖到的是否会影响结果?”
“360如何知道用户就是男的?他有审核流程吗?”
“拿到外部数据以后,你是否有内部数据进行验证?”
“OK,你口头说进行了,那你们内部数据是怎么收集的?”
“内部收集完男女后是否有验证?”
“没有验证这个指标的准确度有多少?”
“没有准确度为什么敢用在用户画里并且作为决策重要依据?”
……
KO!
事后隔壁组领导总结道:“恩,看来这个人是见过一些高大上的报告,但是没有自己实操过。”
“恩恩,这是您自己说的哈,我只是单纯和他探讨一下为什么报告要放这个数”——陈老师无辜的说
菜鸟谈模型,老手谈质量
在部队有句话,叫:新兵怕炮弹,老兵怕机枪。
新兵们见到个大的,动静大的家伙就害怕。
只有老兵知道,上了战场要你命的是那些小到看不见的子弹。
数据分析领域也是这样:
吃瓜群众知道的是啤酒尿布,麦肯锡方法,波士顿矩阵,好高深,好有深度;
刚入门的爱好者最爱争论大数据的定义,问工作中用什么模型,收藏一堆深度学习的文章;
老鸟们交流经验,第一句都是:你们的数据在什么地方采集的?
因为老鸟们知道:长袖善舞,多钱善贾,数据质量越好,能做的分析越多。
如果连数据质量都保证不了,就别谈什么建模分析类的
完善的系统 + 清晰的流程 = 好数据
以银行信用卡业务为例:
事前有目标:比如车主卡要求驾驶证,白领要求工牌照,企业主要求营业执照。
事后有审查:不但会审核资料,而且会进行电话复查。
流程有考核:业务员提供的申请表如连续出现数据问题,数据不规范,直接扣工资!
系统有支撑:所有数据在后台集中保存集中管理。
在这套流程支持下,客户信息,特别是白金卡以上高端客户的信息有着相当的准确度,特别是陈老师待过的XX银行,这种很重视信用卡业务的行,要求格外严格,使得数据质量格外好,能做的分析,能建的模型相当多。
差的数据吗,想想你的毕业论文
特别是本科毕业论文,谁做谁知道O(∩_∩)O
是不是很多人都从统计年鉴随便捞点什么数回归,相关一下:
是不是很多人出过这种问卷:“您对公共行业服务的满意程度如何,1-10分,10分是满分”
是不是很多人把问卷发到问卷星然后各个群转发求填写
转发的群包括但不限于:LOL战队群,单身狗交流群,小初高同学们,……
最后出来的数据一塌糊涂自己都搞不懂
胆大的直接做个百分比画个饼图条图贴上去,管他合不合理
胆小但有节操的做加权,做平滑,做归一,合理的改数据
胆小但没节操的直接手动改数据,有能耐的改原始问卷,没能耐的改输出模型的参数
反正只要指导老师不戳破就没关系,都是这么想的,是吧o(>﹏<)o
前线的销售也是这么想的!
门店的营业员也是这么想的!
APP的终端用户也是这么想的!
只要企业没人主动戳破就关系,哈哈
因此缺少流程的管理,缺少好的APP设计,太过功利的或者生硬的收集数据的时候
就会出现一系列的问题,比如:
业务员图省事,客户基本资料不填,瞎填,故意填错(客户是我的,不是公司的,哼)
门店为了套取优惠,自己办几张会员卡,促销来了全部刷到这几张卡里
APP用户反复注册,套取新手补贴,七姑八姨手机全部来一下
APP,微信数据没有打通,明明一个用户,在微信和App有两套数据
……
所以啊,在讨论数据的时候一定要了解数据来源与流程,知道潜在问题。
想要面试不被问倒,至少要清晰最基础数据来源
来源1:
业务员/门店/经销商/客服/服务中心/用户手动填写
来源场景:
一般会员注册的资料都是这么来的,线下渠道的是业务员填,网站/APP的是用户自己填
典型问题:
没有严格的管理,没有事后审核,随意填,瞎填,空白
注意事项:
l 这是数据最容易出问题的地方。
l 最好亲自走一趟流程,以一个真实用户的身份体验一下,看看是否存在漏洞,看看自己愿意填什么不愿填什么。
l 自己走过流程以后,就知道报告上能不能放:男女比例这种看似简单实则大坑的东西。
来源2:
POS机/网站/APP的交易记录
来源场景:
用户购买交易
典型问题:
l 买单没有要求出示会员卡,导致交易记录不能匹配用户
l 促销活动影响,导致拆单,拼单,大量新用户涌出……
l 数据没打通,不同平台记录混乱
注意事项:
l 交易数据是所有数据里相对真实的,毕竟涉及到钱
l 但是会受政策的影响比较大,被人为改变形态
l 第一要了解企业的交易流程(最好自己亲自买一遍)看看数据收集了哪些
l 第二要经常收集企业的信息,了解市场上可能对交易影响较大的事件
来源3:
网站/APP的互动行为
来源场景:
用户在自己APP/网站/服务号互动行为,第三方平台发布的数据
典型问题:
压根没收集,常见于刚开始电商化的传统企业
数据采集不全,只有整体统计,不能具体到用户
数据本身有偏,没有一个第三方平台能包打天下,因此数据总是有偏的
注意事项:
l 互动数据与运营紧密挂钩,使用互动数据需结合运营场景(拉新/促活/保留)。
l 第三方平台的数据要和内部对应的数据做对比和匹配,不能乱用,不能全信。
来源4:
街头访问/定点访问/网络访问/电话访问的调研问卷
来源场景:
各种报告,公开的,企业内部的
典型问题:
一大堆o(╯□╰)o
抽样,投放渠道,受访对象,问卷结构,问法,是否有测试,是否有复审……
注意事项:
l 调研问卷是获得数据最简单廉价的方式,在网上出几个选项勾一下不是啥难事。
l 因为来的太廉价所以会有各种问题,数都数不完
l 因此,网上的来路不明的调研报告不要随便信,不要随便用
l 引用调研报告一定要讲清楚这个调研是什么目的,在什么范围内做的
l 调研是一种传统但不是很适合大量样本的方法,范围越小,目的越聚焦,成果越好
l 调研的问题越聚焦,越容易量化,成果越好
l 所以那些“你幸福吗”的调研结果大家乐乐也就过去了。^_^
以上,请大家参照自己企业情况,自行了解。
回归到主题,在面试的时候,第一顺位要展示的是自己是一个靠谱的干活的人。
因此不要急着炫耀自己的技能多牛,打好基础,不要光顾着吹吹漏了都不知道。
然而你还是需要一些硬技能打动面试官的,戳这里:
https://ask.hellobi.com/blog/chenwen/6445
更多面试要点,戳这里:
https://ask.hellobi.com/blog/chenwen/6414
今天的依然很严肃,轻松一刻戳这里:
https://ask.hellobi.com/blog/chenwen/6286
这是给认真看完全文的同学的福利:面试问题,转行难题,业务问题可邮件咨询陈老师ccxxmmin@163.com
热门职位推荐:
铂金智慧招聘 (最高薪资:30 K,阅读量:1400+)
马达数据招聘(最高薪资:32 K,阅读量:2000+)
卓越教育招聘(最高薪资:50 W,阅读量:1600+)
陈文,天善智能社区特邀专家,在金融,零售领域8年经验数据分析师,资深业务顾问,特别擅长梳理业务需求,推动数据分析项目成果转化。
Blog:https://ask.hellobi.com/blog/chenwen
想了解更多关于大数据招聘的岗位和技巧
还在等什么
快到碗里来
数据招聘,与你携手遇见更好的未来!
找工作发简历,招人发JD!