查看原文
其他

打好基础再炫技,不然面试过不去。分析师需重视数据来源

陈文 数据招聘 2019-04-07

从一场面试事故看基本功重要性


本周,陈老师把一个面试者问崩溃了。

事由是,隔壁组的领导想找一个有较强分析能力的高级策划。

对我说:“老陈,这个第一眼看还行,分析能力这块你把把关”

我就随便问了问,他就崩了 ╮(╯_╰)╭


我看他带了分析报告,就让他讲一下思路

他涛涛不绝的讲完,我把手指向第二页:

“就这里,这个数据,男女比例,这个数哪里来的?”

他愣了一下,回答:“这个是360大数据啊,我标注了的”


陈老师说:“360大数据是吧……”

“360平台是怎么收集这个大数据的?”

“360用户覆盖率是多少?”

“没有覆盖到的是否会影响结果?”

“360如何知道用户就是男的?他有审核流程吗?”

“拿到外部数据以后,你是否有内部数据进行验证?”

“OK,你口头说进行了,那你们内部数据是怎么收集的?”

“内部收集完男女后是否有验证?”

“没有验证这个指标的准确度有多少?”

“没有准确度为什么敢用在用户画里并且作为决策重要依据?”

……



KO!



事后隔壁组领导总结道:“恩,看来这个人是见过一些高大上的报告,但是没有自己实操过。”

“恩恩,这是您自己说的哈,我只是单纯和他探讨一下为什么报告要放这个数”——陈老师无辜的说


菜鸟谈模型,老手谈质量


在部队有句话,叫:新兵怕炮弹,老兵怕机枪。

新兵们见到个大的,动静大的家伙就害怕。

只有老兵知道,上了战场要你命的是那些小到看不见的子弹。


数据分析领域也是这样:

吃瓜群众知道的是啤酒尿布,麦肯锡方法,波士顿矩阵,好高深,好有深度;

刚入门的爱好者最爱争论大数据的定义,问工作中用什么模型,收藏一堆深度学习的文章;

老鸟们交流经验,第一句都是:你们的数据在什么地方采集的?

因为老鸟们知道:长袖善舞,多钱善贾,数据质量越好,能做的分析越多。

如果连数据质量都保证不了,就别谈什么建模分析类的


完善的系统 + 清晰的流程 = 好数据


以银行信用卡业务为例:

事前有目标:比如车主卡要求驾驶证,白领要求工牌照,企业主要求营业执照。

事后有审查:不但会审核资料,而且会进行电话复查。

流程有考核:业务员提供的申请表如连续出现数据问题,数据不规范,直接扣工资!

系统有支撑:所有数据在后台集中保存集中管理。


在这套流程支持下,客户信息,特别是白金卡以上高端客户的信息有着相当的准确度,特别是陈老师待过的XX银行,这种很重视信用卡业务的行,要求格外严格,使得数据质量格外好,能做的分析,能建的模型相当多。


差的数据吗,想想你的毕业论文


特别是本科毕业论文,谁做谁知道O(∩_∩)O


是不是很多人都从统计年鉴随便捞点什么数回归,相关一下:

是不是很多人出过这种问卷:“您对公共行业服务的满意程度如何,1-10分,10分是满分”

是不是很多人把问卷发到问卷星然后各个群转发求填写

转发的群包括但不限于:LOL战队群,单身狗交流群,小初高同学们,……


最后出来的数据一塌糊涂自己都搞不懂

胆大的直接做个百分比画个饼图条图贴上去,管他合不合理

胆小但有节操的做加权,做平滑,做归一,合理的改数据

胆小但没节操的直接手动改数据,有能耐的改原始问卷,没能耐的改输出模型的参数


反正只要指导老师不戳破就没关系,都是这么想的,是吧o(>﹏<)o


前线的销售也是这么想的!

门店的营业员也是这么想的!

APP的终端用户也是这么想的!

只要企业没人主动戳破就关系,哈哈


因此缺少流程的管理,缺少好的APP设计,太过功利的或者生硬的收集数据的时候

就会出现一系列的问题,比如:

  • 业务员图省事,客户基本资料不填,瞎填,故意填错(客户是我的,不是公司的,哼)

  • 门店为了套取优惠,自己办几张会员卡,促销来了全部刷到这几张卡里

  • APP用户反复注册,套取新手补贴,七姑八姨手机全部来一下

  • APP,微信数据没有打通,明明一个用户,在微信和App有两套数据

……

所以啊,在讨论数据的时候一定要了解数据来源与流程,知道潜在问题。


想要面试不被问倒,至少要清晰最基础数据来源


来源1:

业务员/门店/经销商/客服/服务中心/用户手动填写

来源场景:

一般会员注册的资料都是这么来的,线下渠道的是业务员填,网站/APP的是用户自己填

典型问题:

没有严格的管理,没有事后审核,随意填,瞎填,空白

注意事项:

l  这是数据最容易出问题的地方。

l  最好亲自走一趟流程,以一个真实用户的身份体验一下,看看是否存在漏洞,看看自己愿意填什么不愿填什么。

l  自己走过流程以后,就知道报告上能不能放:男女比例这种看似简单实则大坑的东西。



来源2

POS机/网站/APP的交易记录

来源场景:

用户购买交易

典型问题:

l  买单没有要求出示会员卡,导致交易记录不能匹配用户

l  促销活动影响,导致拆单,拼单,大量新用户涌出……

l  数据没打通,不同平台记录混乱

注意事项:

l  交易数据是所有数据里相对真实的,毕竟涉及到钱

l  但是会受政策的影响比较大,被人为改变形态

l  第一要了解企业的交易流程(最好自己亲自买一遍)看看数据收集了哪些

l  第二要经常收集企业的信息,了解市场上可能对交易影响较大的事件



来源3:

网站/APP的互动行为

来源场景:

用户在自己APP/网站/服务号互动行为,第三方平台发布的数据

典型问题:

压根没收集,常见于刚开始电商化的传统企业

数据采集不全,只有整体统计,不能具体到用户

数据本身有偏,没有一个第三方平台能包打天下,因此数据总是有偏的

注意事项:

l  互动数据与运营紧密挂钩,使用互动数据需结合运营场景(拉新/促活/保留)。

l  第三方平台的数据要和内部对应的数据做对比和匹配,不能乱用,不能全信。



来源4:

街头访问/定点访问/网络访问/电话访问的调研问卷

来源场景:

各种报告,公开的,企业内部的

典型问题:

一大堆o(╯□╰)o

抽样,投放渠道,受访对象,问卷结构,问法,是否有测试,是否有复审……

注意事项:

l  调研问卷是获得数据最简单廉价的方式,在网上出几个选项勾一下不是啥难事。

l  因为来的太廉价所以会有各种问题,数都数不完

l  因此,网上的来路不明的调研报告不要随便信,不要随便用

l  引用调研报告一定要讲清楚这个调研是什么目的,在什么范围内做的

l  调研是一种传统但不是很适合大量样本的方法,范围越小,目的越聚焦,成果越好

l  调研的问题越聚焦,越容易量化,成果越好

l  所以那些“你幸福吗”的调研结果大家乐乐也就过去了。^_^



以上,请大家参照自己企业情况,自行了解。

回归到主题,在面试的时候,第一顺位要展示的是自己是一个靠谱的干活的人。

因此不要急着炫耀自己的技能多牛,打好基础,不要光顾着吹吹漏了都不知道。


然而你还是需要一些硬技能打动面试官的,戳这里:

https://ask.hellobi.com/blog/chenwen/6445

更多面试要点,戳这里:

https://ask.hellobi.com/blog/chenwen/6414

今天的依然很严肃,轻松一刻戳这里:

https://ask.hellobi.com/blog/chenwen/6286

这是给认真看完全文的同学的福利:面试问题,转行难题,业务问题可邮件咨询陈老师ccxxmmin@163.com


热门职位推荐:

铂金智慧招聘     (最高薪资:30 K,阅读量:1400+)

马达数据招聘(最高薪资:32 K,阅读量:2000+)    

卓越教育招聘(最高薪资:50 W,阅读量:1600+)

柠檬科技招聘     (最高薪资:16 K,阅读量:1200+)

CVTE招聘    (最高薪资:30 K,阅读量:1300+)

网易招聘    (阅读量:2400+)

美团招聘    (阅读量:800+)


陈文,天善智能社区特邀专家,在金融,零售领域8年经验数据分析师,资深业务顾问,特别擅长梳理业务需求,推动数据分析项目成果转化。 

Blog:https://ask.hellobi.com/blog/chenwen


想了解更多关于大数据招聘的岗位和技巧

还在等什么

快到碗里来

数据招聘,与你携手遇见更好的未来!

找工作发简历,招人发JD!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存