大数据解密之你的同事都跳槽到了哪些公司
关于跳槽
过了元宵节,意味着狗年春节正式结束,也意味着跳槽高峰期正式开始。
每年年后都是跳槽的高峰期,所以二胖就花了5个夜晚,收集了知乎500万用户的信息,统计了下大家职业经历的信息,于是就有了这份统计报告。
首先来看看这次统计的内容,拿一个用户举例(当然是帅气的二胖):
可以看到,二胖同时在公司A和公司B出任过总经理(假装是真的)。
根据这个信息我们可以知道,对于公司A来说,它的一个员工是来自于公司B;而对于公司B来说,它的一个员工去了公司A。所以,基于这个关系,我们可以知道公司之间的员工流动情况。
当然,为了统计出员工的流动情况,用户的职业经历中至少有两个公司才是有效数据,所以二胖过滤掉了只写了一个职业经历和没有写职业经历的用户。
01
互联网公司
1.腾讯
上图为在腾讯工作过的员工还在哪些公司工作过。
可以看到,在腾讯工作过的员工跳槽到阿里和百度,或曾在阿里和百度工作过的人数相对较多。其实,在下面所展示的阿里及百度的员工信息中,我们会发现,BAT三家之间员工的相互流动是比较频繁的。
毕竟BAT。
上图为在腾讯工作过的员工所就职过的公司。
词云图较为全面地展示了腾讯员工的跳槽去处和跳槽来源,大家可以仔细看看有哪些公司,也许有意想不到的发现。
2.百度
上图为在百度工作过的员工还在哪些公司工作过。
上图为在百度工作过的员工所就职过的公司。
3.阿里巴巴
上图为在阿里工作过的员工还在哪些公司工作过。
上图为在阿里工作过的员工所就职过的公司。
4.网易
上图为在网易工作过的员工还在哪些公司工作过。
上图为在网易工作过的员工所就职过的公司。
5.微软
上图为在微软工作过的员工还在哪些公司工作过。
上图为在微软工作过的员工所就职过的公司。
6.谷歌
上图为在谷歌工作过的员工还在哪些公司工作过。
上图为在谷歌工作过的员工所就职过的公司。
7.华为
上图为在华为工作过的员工还在哪些公司工作过。
上图为在华为工作过的员工所就职过的公司。
8.新浪
上图为在新浪工作过的员工还在哪些公司工作过。
上图为在新浪工作过的员工所就职过的公司。
9.新美大(美团+大众点评)
上图为在新美大工作过的员工还在哪些公司工作过。
上图为在新美大工作过的员工所就职过的公司。
10.小桔科技(滴滴)
上图为在滴滴工作过的员工还在哪些公司工作过。
上图为在滴滴工作过的员工所就职过的公司。
11.京东
上图为在京东工作过的员工还在哪些公司工作过。
上图为在京东工作过的员工所就职过的公司。
12.今日头条
上图为在今日头条工作过的员工还在哪些公司工作过。
上图为在今日头条工作过的员工所就职过的公司。
13.奇虎360
上图为在360工作过的员工还在哪些公司工作过。
上图为在360工作过的员工所就职过的公司。
14.知乎
上图为在知乎工作过的员工还在哪些公司工作过。
上图为在知乎工作过的员工所就职过的公司。
15.搜狐
上图为在搜狐工作过的员工还在哪些公司工作过。
上图为在搜狐工作过的员工所就职过的公司。
16.苹果
上图为在苹果工作过的员工还在哪些公司工作过。
上图为在苹果工作过的员工所就职过的公司。
02
金融&咨询&银行
1.普华永道
上图为在普华永道工作过的员工还在哪些公司工作过。
可以从上图及下面的图表中看到,四大会计事务所之间的员工流动是相对频繁的。
2.德勤
上图为在德勤工作过的员工还在哪些公司工作过。
3.安永
上图为在安永工作过的员工还在哪些公司工作过。
4.毕马威
上图为在毕马威工作过的员工还在哪些公司工作过。
5.高盛
上图为在高盛工作过的员工还在哪些公司工作过。
可以从上图和下面的图表的中看到,几家顶尖咨询公司之间的人员流动也是相对频繁的。
6.摩根大通
上图为在摩根大通工作过的员工还在哪些公司工作过。
7.摩根士丹利
上图为在摩根士丹利工作过的员工还在哪些公司工作过。
8.埃森哲
上图为在埃森哲工作过的员工还在哪些公司工作过。
9.中国银行
上图为在中国银行工作过的员工还在哪些公司工作过。
由于篇幅有限,这里只列举了几个大家比较常见的公司。
可是,二胖可不仅仅只分析了这几个公司,为了让大家看得更尽兴,二胖对500家公司做了可视化,并且将可视化之后的结果打包上传,观看下面的视频,让二胖告诉你怎么使用这个数据查看自己感兴趣的公司吧。
https://v.qq.com/txp/iframe/player.html?vid=x0564hajggx&width=500&height=375&auto=0
除此之外,二胖还给大家留了一个编程小练习,让我们在看文章的同时提升编程能力。快戳一戳下面的视频了解吧,附带文章中的技术讲解哟。
https://v.qq.com/txp/iframe/player.html?vid=g0564tbqjjs&width=500&height=375&auto=0
如果视频不清晰,请关注微信公众号【二胖并不胖】,后台回复【知乎公司】获取高清视频,1000份可视化代码,以及相关的公司数据。
技术分析
数据抓取: python 3.5
由于数据量较大,所以采取分布式抓取策略。
抓取环境:
计算机1:
操作系统:macOS
内存:16 GB 1600 MHz DDR3
处理器:2.2 GHz Intel Core i7
计算机2:
操作系统:Ubuntu 14.04
内存:8 GB
处理器 :Intel Core i5
分布式工具:redis
存储:mongodb
可视化:echarts
【二胖并不胖】一个集八卦、大数据、计算机教程、干货、金融等内容于一身的微信公众号,欢迎关注。
我们会在每篇技术文章下分享实现方法于过程哦。
查看历史消息还有更多好玩的文章。
近期热文
长按二维码关注我们 ▶▶▶