查看原文
其他

爬了 100 万码农招聘需求,我竟发现这些技能最值钱!

2017-07-23 文若、勃勃 51CTO技术栈

现在流行这么一句话:“找工作的时候,只有两种专业——计算机系的和非计算机系的。”这些年,选择了计算机系的人都在虐人模式的人生游戏里开挂,而非计算机系的人则在被虐模式里挣扎。


可是你注意到了吗?即使是同为计算机专业的人,薪酬待遇也有高低差别。


计算机方向不同行业的薪酬价值,各大招聘网站每天写来写去,想必大家都看烦了。今天想和大家聊聊不同的东西——抛开物质回报不谈,身为码农的你,在工作中积累的各种技能,究竟值多少钱?


从招聘需求中挖掘技能价值


从招聘网站上爬取了 100 多万条有关计算机专业的职位招聘文本,每条文本主包含职位工资和职位要求。我们要做的是从文本中识别“技能”,然后将其和职位工资关联起来。


为了从职位要求描述中抽取技能,我们采用 weak-supervised learning 的方法。


我们首先对职位招聘文本进行句法分析,生成一个粗略的职位技能集合,这个集合是满足语义树正则表达式的所有名词或动名词短语。


然后进行少量的人工标注建立训练集,采用 BiLSTM 的实体识别模型对招聘要求描述中的技能进行识别和抽取。


最后不断迭代“标注-训练-预测”这个过程,优化识别结果。


算法框架如图所示:

图一


最后,将抽取的技能实体和职位工资关联,并人工分为了几组。下面让我们看看每一组技能价值的结果吧。


PHP 是最好的语言?


好吧,这其实是一个广为流传的笑话。说是有三个程序员坐在格子间里编程。第一个程序员一言不发。第二个程序员写一会儿就按一下编译,然后就玩会儿手机。


第三个程序员坐在那里浏览网页,不时飞快的键入一些字符,看起来不怎么干活,尽在上网。请问,他们分别是用的什么语言?

图二


言归正传,学会各种编程语言究竟能给你增加多少身价?


我们的文本挖掘结果显示,排名第一的编程语言是 Scala,价值 17.68k,而最后一名是 C 语言,仅有 9.46k,是Scala的一半多一点。


Scala 作为大数据处理、建模的函数式语言,之所以这么值钱,主要源于前些年大数据产业的爆发。但随着近几年大数据产业重归理性,以及 Scala 人才数量的增加,其价值也会逐渐回归到正常价值。


还有一个在数据挖掘领域讨论比较激烈的话题是,我该学 Python 还是学 R?


文本挖掘结果显示,Python 的价值比 R 高出 30%。这可能是由于,在近年来越来越火的人工智能领域里,很多算法框架都优先支持 Python,从而导致 Python 的价值逐年升高。所以,如果是初入数据分析行业,还是学 Python 吧。


其他的处座就不一一分析了,反正除了 PHP,你们都是最好的语言……


码农生存工具鄙视链


聊完了编程语言,我们再聊聊码农们赖以生存的开发工具。


如今,做移动应用的码农要使用 Recat Native、Weex、Cordova 或者 Ionic 等框架;做深度学习的算法工程师要使用 keras、theano 或者 tensorflow 等框架;做项目管理的架构师要使用 word、excel 和 ppt 等。


那么,不同的开发工具,在价值上有多大的差别呢?

图三


分析结果显示,排名前三的工具分别是 keras、theano 和 tensorflow,其价值分别达到了 45k、29.29k 和 26.71k,在码农生存工具鄙视链上远远超过其他工具。


随着人工智能概念的火爆和深度学习人才的稀缺,掌握这三款用来进行深度学习建模的框架,对码农个人价值的提升是极大的。


当然,从另一个角度来看,这不合理的差距,也说明了深度学习产业存在泡沫。作为深度学习的算法工程师,也当居安思危,多掌握一些其他的工具框架,以应对泡沫破灭的到来。


另一个有趣的点是处于码农生存工具鄙视链最底端的办公三兄弟 word、excel 和 ppt。


十年前有一句老话说:写 word 的不如写 excel 的,写 excel 的不如写 ppt 的,写 ppt 的不如讲 ppt 的,讲 ppt 的不如听 ppt 的……


从鄙视链上来看,确实如此,ppt 技能价值 8.36k,excel 技能价值 8.05k,而 word 技能仅价值 7.30k。


在这一节的最后,处座想说,其实生存工具鄙视链并不应该存在,做深度学习的并不优于做移动开发的。这不过是因为技术的发展和经济结构的转型而造成的误会而已。


有人曾感叹:“现在在公司的格子间里面哼哧哼哧做 ppt 的那些人,和当年踩着缝纫机的女工们,其实没有本质的区别。”


是的,没有本质的区别,而我们的表现并没有优于我们的父母,这一切都不过是经济结构转型造成的生存工具的变化而已。


哦,不,还是有区别的。起码纺织工做完一个成品以后,可不会被关到一个小房间里,投到一个大屏幕上,然后让一群人围着羞辱你……


学子们该如何选专业?


计算机专业出身的学生有很多方向可以选择(你在问为什么只说计算机?请重读本文第一句话)——计算机硬件、大数据、人工智能、互联网开发等。下面处座列出了这四个方向技能树价值,供学子们选专业时参考。


计算机硬件技能价值表

图四

大数据技能价值表

图五

互联网开发技能价值表

图六

人工智能技能价值表

图七


最后,希望这篇文章对于处在人生节点的你能有所帮助,愿你能活在自己的节奏里,修炼内功,点好自己的技能树,让自身越来越有价值。


作者:文若、勃勃

编辑:陶家龙、孙淑娟

本文转载自朝阳 35 处微信公众号


文若

Gammar Lab成员

自然语言处理爱好者一枚,致力于将人工智能技术应用于金融领域。


勃勃

Gammar Lab成员

麻省理工博士,爱好讲故事的算法工程师,擅长金融+人工智能产品研发。


精彩文章推荐:

太可怕了,朋友圈晒完自拍后你绝对想不到的事情,正在发生!

刚写了一百万行代码,现在迷之自信!

一件有趣的事:我用 Python 爬了爬自己的微信朋友

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存