查看原文
其他

PNAS刊文揭秘三千万员工大数据:初创公司要想生存,就应该这样招人!

Frank Xu 集智俱乐部 2021-02-09


导语

对于初创公司的生存与发展来说,更应该看重员工的教育背景、岗位技能、行业认知还是地区认知呢?最近PNAS刊载的一项研究通过分析巴西全行业3000万员工的数据,发现员工的行业背景知识最为重要,这为初创公司的招聘工作带来新的启示。


论文原题:

The role of industry-specific, occupation-specific, and location-specific knowledge in the growth and survival of new firms

论文地址:

https://www.pnas.org/content/115/50/12646


长久以来,人力资本被认为是经济增长的重要决定因素之一。人力资本并不仅仅指员工的学历,还包括相应的行业技能和人际关系网络。学历只是敲门砖,而有资历的员工带来的是多年的工作经验,这些行业经验与地区认知对初创先锋企业来说尤为重要。


那么这些有资历的员工将如何影响初创公司的成败呢?


最新的研究发现初创公司的成功非常依赖于初始员工带来的相应知识,比如行业认知、地区认知。具体来讲,初创公司的存活与初始员工在该地区的工作经验和行业认知息息相关,却与员工对特定岗位的认知无太大联系。



研究数据与研究方法


研究对象


这项研究中,研究者将初创公司定义为在新区域内新开的公司(同区域内无雷同、无官方记录的公司)。对于初创公司来说,所有的员工都是新来的,他们给公司带来的知识与公司的初始劳动力紧密相关。由于数据范围有限,研究人员选取了个体在初创公司创立前的两年在其岗位的表现。比如一个员工以前是电信公司(行业)的柜员(职业),我们假设她能给初创公司带来两种知识:电信行业知识和做柜员的知识经验。


研究数据


研究者采用了巴西劳动部分编撰的2012年-2013年巴西年度社会安全报告中(RAIS)的数据。这些数据包括国家经济活动分类和巴西职业分类,这些数据都经过巴西国家统计局校正。


RAIS数据集涵盖了巴西97%的劳动力,包括个体员工的细致信息,这其中有5570个市政区域,501个职业,284个行业,3000万员工。RAIS数据集还有一个好处,就是可以追踪到个人层面上,这样非常详尽的数据使得RAIS是巴西劳动力市场上最重要的信息。


相关性测试:工作历史与相关活动网络



图1巴西2008-2012年间新成立公司的空间分布。(A)所有公司;(B)初创公司;(C)员工分布;(D)每年产生的公司数目。


现代社会各个行业之间都有着千丝万缕的关系,所以研究者摒弃了把行业知识和岗位经验作为二分变量的想法,而采用相关性测试。比如,鞋业制造和衬衫制造业是两个领域,但是这两个领域很相似,一个员工从那个鞋业制造业转到衬衫制造业,和一个员工从毫不相关的领域(比如畜牧业)转到衬衫制造业,研究者考虑的是衬衫制造业的行业知识与之前行业知识的相关性。



图2A显示就是初创公司的三种人员构成:第一种和第三种的员工来自于同一岗位的不相关行业,第二种员工来自于相关行业的不同岗位。图A显示的是个体工作历史带来的相应知识经验是如何进入初创公司的。每个员工的颜色代表他们的职业,边框的颜色代表行业。比如,黄色的员工有货运司机的经验,进入初创公司也在相同岗位工作,但他来自一个非常不相关的行业。淡蓝色的员工之前在相关行业中担任不同的职位。



图2B显示的是相关行业的网络,图表C显示的是相关岗位的网络。在图表C中,点的颜色与岗位与行业划分相对应。图中显示的只是各个网络的重要边界,由相应整合算法选出。



幸存的初创公司特征


初创公司偏好有行业认知的员工



图3A显示的是初创公司拥有的行业知识和岗位认知的数量二分直方图。


研究发现行业知识和岗位认知的相关性中位数是0.4,大多数初创公司会雇佣那些行业和职业相关的员工。我们可以在直方图中看到初创公司更愿意雇佣有具体岗位认知的员工,而对于有行业知识的员工则体现出中等程度的喜爱。


图3B显示的是初创公司平均三年存活率的直方图。


令人惊讶的是幸存下来公司的分布与所有初创公司的分布大为不同。初创公司倾向与雇佣有更多岗位认知的员工,而那些幸存下来的初创公司却倾向于雇佣有更多行业知识的员工。事实上,当员工都有基本的行业认知时,初创公司3年的平均存活率就从60%上升到了85%。(平均存活率60%是员工无行业知识而有特定岗位认知时)




图3D显示的是幸存的初创公司的雇佣数目的上升。从图3E中我们可以看到,那些有整体行业认知的公司发展的比那些缺乏行业知识的公司快。


模型验证


假设f公司,在r区域的i领域运作,研究者用 来表示三年存活率,用 来表示雇佣数的增长。用逻辑回归来预测三年存活率,用最小二乘法来预测雇佣增长数。这个模型中包括行业知识(Φ),岗位认知(Ψ),员工平均受教育时长(edu),初始员工数目n₀ ,平均工资w,地区认知(ρ),地区认知指的是员工在相同区域内的工作经历。模型详见方程1与2,方程1是逻辑回归,变量 ,和 分别是行业,年份和地区固定效应。


方程1:


方程2:


表1显示的是模型验证结果,这其中 Φ, Ψ, edu, 和 ρ 都是标准差。



我们可以发现行业知识Φ在预测存活率和雇佣数增长都有着显著的作用,而职位相关信息Ψ和教育背景edu则预测所用很小。



行业知识的长期作用


为了衡量这些知识的长期作用,研究者聚焦于成立于2005年的公司,使用了方程7类似的Cox比例风险模型。



图3F和3G显示的是初创公司幸存率的预测变量。可以看到行业知识比岗位认知有着更为显著的预测作用。


实际操作过程中,公司的招人却另有一套逻辑。也许是高效的公司更倾向于招来自相关行业的员工,也许是职位相关的知识不重要,因为公司只是期望招来的人有能力填补岗位技能的空白。公司的选择自然有很多现实的内部考量,所以研究者用当地人力资源供应受到的冲击这样的外部衡量标准来作为招聘的依据


因此,研究者建立另一个巴蒂克劳动力供给冲击模型  ,就是用行业    整体的增长或衰减,来作为对员工数量增减的供给冲击。比如说,摩托车制造业和汽车制造业在行业知识方面有关联,汽车制造业的兴起会造成摩托车制造业有相关行业知识的员工数目锐减。所以,当摩托车制造业兴起的时候,可能会出现一个摩托车行业的初创公司招的人是仅有少量行业知识的员工。研究者把某种行业知识(在地区r,行业i)的巴蒂克冲击定义为以下方程:



这其中  是行业 i 与行业 在时间段t-1到t之间的相关性,是指除地区r之外其他所有地区行业i的增长员工数, 指的是在t年行业i除r地区外的员工数目。


表4 用测量行业知识 Φ的工具来估计行业知识在初创公司发展中的作用。



结果也与用最小二乘法得出的结果一样,行业知识对初创公司的发展和存活有着非常重要的作用。


行业知识也并非万金油


那么行业知识仅仅是对初创公司很重要还是对所有新公司都很有用呢?


表2显示的就是初创公司和新公司的对比。


我们可以看到,跟初创公司相比,行业知识对非初创公司来说没那么重要。



着眼行业更关键


研究者通过对整个巴西工作历史数据的统计发现,行业知识对初创公司发展和存活至关重要,而令人惊讶的是,岗位相关知识与教育背景对初创公司的作用并没我们想象的那么大。


员工在不同行业的迁移,他们所携带的知识经验能给经济的增长和多样化带来好处。这不是新鲜观点,而知识经验和人力资源也常常被当成多年辛勤工作与学习的结果(比如多年的寒窗苦读)。然而研究者却发现,知识经验更应该被当成相关性的概念来理解,因为员工不仅拥有的总体知识经验不同,而且在各个细分领域的知识经验也不一样。总体的知识经验可以用多年的教育背景来衡量,研究却发现这不是初创公司生存的关键。而恰恰是那些细分领域知识经验的相互联系才是初创公司希望拥有的。


行业知识比职位认知更重要有很多可能的原因。可能是因为行业知识需要更久的时间获得,也可能是因为有行业知识经验的员工带来的不仅仅是对与行业的整体认知,还会带来与客户的联系,带来的是隐藏在背后的社交关系网络。这样的行业相关的社交人力资本其实是行业知识经验的一种。


尽管此研究所有数据均来自巴西,但多样性的数据以及巨大的数据量让我们有理由相信这样的结论可以推论到其他地区或国家。当地区经济下行,所有的初创公司都在寻找新的突破口,而这项研究替初创公司在招聘人才方面提供了一种可行性方针:多招有相关行业知识的员工。


对于求职的新人来说,在应聘前应尽可能多了解公司所在行业,这不仅仅能在面试中祝你一臂之力,也可以更科学的符合公司的招人需求。对于跳槽的员工来说,也应该尽量去寻找原行业与未来行业之间的联系,思考一下能如何利用原有的行业知识给未来的公司带去帮助。对于研究者来说,从不同维度测量各种知识的作用有着光明的应用前景,而个人的工作史将是测量与理解各种知识经验的重要途径。


作者:Frank Xu

编辑:王怡蔺



推荐阅读


计算社会经济学:行为数据驱动预测性管理

数据时代下,社会经济发展的新范式

Nature子刊揭示团队获胜规律

公司有衰老死亡,而城市却长生不老?

加入集智,一起复杂!

集智学园:

https://campus.swarma.org





集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存