查看原文
其他

火了! 携程网梁建章Top5上的文章在COVID-19期间火遍欧美学术界!

计量经济圈 计量经济圈 2021-10-23

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于一些计量方法的合辑,各位学者可以参看如下文章:实证研究中用到的200篇文章, 社科学者常备toolkit”、实证文章写作常用到的50篇名家经验帖, 学者必读系列过去10年AER上关于中国主题的Articles专辑AEA公布2017-19年度最受关注的十大研究话题, 给你的选题方向2020年中文Top期刊重点选题方向, 写论文就写这些过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图。后面,咱们又引荐了使用CFPS, CHFS, CHNS数据实证研究的精选文章专辑!这40个微观数据库够你博士毕业了, 反正凭着这些库成了教授Python, Stata, R软件史上最全快捷键合辑!关于(模糊)断点回归设计的100篇精选Articles专辑!关于双重差分法DID的32篇精选Articles专辑!关于合成控制法SCM的33篇精选Articles专辑!最近80篇关于中国国际贸易领域papers合辑!最近70篇关于中国环境生态的经济学papers合辑!使用CEPS, CHARLS, CGSS, CLHLS数据库实证研究的精选文章专辑!最近50篇使用系统GMM开展实证研究的papers合辑!

正文

关于下方文字内容,作者:杨青清,湖南大学经济与管理研究中心经济所,通信邮箱:mikiyqq@163.com
携程董事长梁建章发表过“携程网梁建章(博士)用携程内部数据做了一篇CER文章!”。
今天这篇《在家工作可以吗?来自中国实验的证据》by@梁建章等,通过在携程公司内部做实验搜集数据,并最终发表在The Quarterly Journal of Economics上。
主要观点:现在,越来越多的员工定期在家工作(WFH),但是有人担心这会导致“在家中偷懒”。本文对携程呼叫中心的员工进行实验。实验发现,自愿参加实验的呼叫中心员工被随机分配在家中或办公室工作9个月,在家工作使绩效提高了13%,其中9%是由于每班工作的时间更长(更少的休息时间和病假),而4%的原因是每分钟接听了更多的电话(归因于更安静,更方便的工作环境)。另外,在家工作员工的工作满意度有所提高,其离职率降低了一半,但晋升率还要取决于绩效。由于实验的成功,携程将在家办公的选择权推广到了整个公司,并允许实验的员工在家和办公室之间进行重新选择。有趣的是,超过一半的人改变了之前的选择,这也使得在家办公的收益几乎翻了一番,达到22%。这凸显了采用WFH等现代管理实践时学习和选择效应(learning and selection effects)的好处。

I.  Introduction

在家办公(working from home,也称为远程办公)正变得越来越普遍。在美国,过去30年中,主要在家工作的员工比例增加了两倍多,从1980年的0.75%上升到2010年的2.4%。而且涉及的职业范围也很广泛,从销售员到软件工程师。
在美国,最高和最低工资的十分位数主要是在家工作(Figure 1)。

Figure II显示了在2012-2013年间作者对3,000多家中型(50-5,000员工)制造公司进行的一项主要电话调查中,被允许在正常工作时间内在家工作的经理所占的比例。

但是,在家工作面临着两个问题。第一,这种实践是否可以提升生产率和利润率;第二个问题则涉及到工作与生活平衡的恶化,而在家办公是否有助于解决这一问题。
携程的高管认为,在家工作可以减少办公室租金,而且还可以减少长时间通勤员工的离职率。但是,在家工作也有一定的缺陷。呼叫中心的工作人员主要都是年轻员工,他们很可能难以在没有直接监督的情况下集中精力工作。
基于以上考虑,携程的管理层决定进行这次随机对照实验。
 实验时长为9个月。他们询问了上海呼叫中心机票和酒店部门的996名员工,是否有兴趣每周在家工作四天,第五天在办公室工作。在报名的503个员工中,249人获得参加实验的资格。经过抽签,生日为偶数的员工在家工作,而生日为奇数的员工留在办公室作为对照组。两组员工使用相同的IT设备,面对来自同一台中央服务器的工作指令,执行相同的任务,薪酬体系也相同。唯一的区别就是工作地点。
实验发现,首先,在家工作员工的绩效大幅上升,在实验的九个月里增长了13%。这种改善主要来自于他们在轮班期间工作的分钟数(即他们登录打电话的时间)增加了9%。这是由于家庭工作者减少了休息时间、休假时间和病假。剩下的4%来自家庭工作者增加的每分钟所打电话的数量。在采访中,员工们将工作时间的增加归因于便捷性(例如,容易喝茶、咖啡、吃午餐或上厕所),而每分钟增加的产出归因于工作环境安静。第二,这样的效果似乎没有外溢到其他群体。将对照组与未参与实验的携程南通呼叫中心的类似员工进行比较发现,尽管对照组在抽签中失利,但他们的表现没有下降。第三,离职率在家庭工作者中急剧下降,与对照组相比下降了50%。处理组的工作满意度也显著提高,并且有更积极的态度。第四,以绩效为条件,在家工作和大约50%的晋升率降低有关。
接着,作者对这个结果进行深入的分析。首先,家庭工作着是不是为了数量而牺牲了质量?作者使用两种不同的质量指标,发现在家工作的质量并没有受到影响。第二,结果是否可能是由于对照组员工在分组时失利而变得沮丧,从而表现更差?为了验证这一点,作者将上海的对照组与南通的类似员工进行了比较,发现几乎没有相同的结果。第三,也许结果是由离职偏差(attrition bias)导致的。该公司使全要素生产率提高了20%到30%,为每个员工每年节省了2000美元。大约三分之二的改进来自于办公空间的减少、员工绩效的提高和人员流动的降低。
基于实验所发现的较好的结果,携程把选择是否在家工作的决策推广到全公司。然而,超过一半的员工改变了之前的想法,这也表明了员工了解自己适合在家工作的程度。
这次实验是第一个关于在家工作的随机实验,它提供了因果证据以作为之前案例和调查研究的补充。虽然这次发现的对绩效的直接影响局限于基本工资较低、绩效占较大部分薪酬这种类型的职业,但是作者相信,本次实验得到的关于离职和晋升的结果具有广泛的适用性。

II.  Modeling WFH Decisions

作者建立了三个简单的模型,发现在家工作对公司利润、雇员的时间以及选择效应三方面的影响方向是不确定的,以此证明进行这项实验的必要性。
II. A Firm Profits
在家工作的利润主要由以下四个方面驱动:
(i) 小时数(hours):从正式轮班开始工作的小时数(与休息时间相对);
(ii)通话率(call rate):每小时完成的通话次数(quality adjusted);
(iii)离职(attrition):对离职率的影响(这推动了招聘和培训成本);
(iv)资本(capital):通过办公空间和设备要求对资本投入的影响。
假设员工每周轮班的时间为每周H小时,每小时处理c通电话。每通电话的价值为v。员工实际工作的小时数为H=40-B,其中B是他们中途休息的时间,40小时则是名义上的轮班时长。公司的成本包括三个方面。一是员工的固定基本工资f,每次通话计件价格w。二是如果员工离职,公司则会产生招聘和培训费用t。本文定义员工离职的可能性为a。三是公司需要支付租金率为r,面积为k的办公室费用。那么,每个员工为公司所带来的利润可以视作工作地点的函数:

这里,工作地点为θ,它可能会影响员工休息的时间、通话率c、离职率以及资本需求。如果公司将在家工作的θ设定为一个正值,并对求导,则一阶导数为:

在家工作会减少离职,即;资本成本也会减少,即;每通电话的收入大于边际成本,即。因此,一阶导的符号主要由决定。然而工作地点对通话率的影响是不确定的。在办公室工作可以得到监督者的帮助,但在家工作又可以享受安静的工作环境。另外,如果是像写论文这种需要集中精力的工作,在家工作更好;如果是需要团队合作的工作,在办公室则更优。
II.B. Employees’ Hours
在这个模型中,本文定义员工的效用由收入Y、工作时的休息时间B、员工在工作外的娱乐时间L以及工作地点所决定。其中,80为一周中员工不需要上班的小时数,T则为一周的通勤时间。为了简便起见,假设效用与收入为线性关系,则有以下模型:

对B求导,代表了在更少的收入与从更多休息中得到的效用的权衡。接着再对工作地点θ求导,得到。其中表示:如果在家工作的生产率更高,那么员工休息的时间也会更少;第二项反映了通勤时间减少带来的娱乐时间增加对break吸引力的影响,由于break 和leisure 是互补品,因此该项的符号可能为负。最后一项则反映了工作地点对break 吸引力的直接影响。但是这一项的符号是不确定的,因为在办公室休息时可以进行社交,在家休息时可以看电视和打游戏。因此在家工作对工作时长的整体影响也是不确定的。
II.C. Selection Effects
最后,作者转向了选择问题:如果员工可以选择,他们会选择在家工作吗?定义为员工最佳在家时长。在携程的案例中,为0或θ,但是现在我们将它看作是不受约束的。则员工的效用函数可以视作的函数:

其中给定时最佳休息时间。类似的,有导数

首先,在=0时导数的符号无法确定,因此事前很难预测员工是否会选择在家工作。其次,该条件不同于在家办公增加工作时间的条件,,以及增加公司利润的条件。因此,选择效应可以是正的,也可以是负的。
综上所述,三个模型的导数符号都是不确定的,无法准确判断在家工作对公司和员工的影响,因此进行以下的随机实验是非常必要的。

III. The Experiment

在这一部分,作者首先介绍了携程公司的基本情况,接着介绍了实验的设计和数据的收集情况。
实验在携程上海呼叫中心的酒店和机票部门进行,处理组的员工有四天在家工作,第五天在办公室工作。而对照组的员工五天从早上9点至晚上五点都在办公室工作。从表面上看,两组唯一的区别在于工作地点的不同,而工作类型和时长都是相同的。
但是两组除了工作地点外,也有一些不同:
1.处理组的通勤时间减少,这意味着他们不需要休息或者早退便可以照顾个人和家庭。
2.处理组得到的主管的帮助要少于对照组。
3.两组的工作环境不同。一个人工作的孤独感可能会降低效率,但是安静的工作环境又会提高效率。
Table I 介绍了影响员工参与实验的一些因素。在家工作的员工必须满足至少六个月的任期,家中有网络以及独立的工作区。最终有249个员工满足条件,其中生日为偶数的被选为处理组,奇数的则为对照组。

实验于2010年12月6日开始,持续了9个月。实验结束后,携程在2011年9月1日向机票和酒店预订部门的有资格并希望在家里工作的员工提供在家工作的机会。然而处理组中约50%的员工立即选择回到办公室,这说明他们非常看重社交;而对照组中只有35%的员工选择在家工作(他们之前希望在家工作)。Figure V展示了实验前后在家工作员工的比例变化。

IV. Impact on the Firm

在这一部分,文章从五个方面分别研究在家工作对公司和员工的影响。
IV.A. Individual Employee Performance
作者首先估计了实验前与实验间在家工作对员工每周绩效的意向处理效果(intention-to-treat effect)。具体模型如下:

其中是虚拟变量,当员工在处理组时,该变量为1;也是一个虚拟变量,当时间为实验期间(12月6日至次年8月14日);为工作绩效指标,它具体包括了每周接听电话的对数;每分钟接听电话的对数;每周总接听分钟数的对数以及一个整体绩效的z-score(根据实验前每个任务的表现情况进行标准化的绩效分数)。为周的时间虚拟变量,以说明旅游需求的季节性变化,则是个体固定效应。

Table2 展示了回归结果。实验开始后,处理组的总体绩效比对照组高0.232个标准差,且在1%的水平上显著。第(2)栏只使用了实验期间的绩效数据,且没有控制个体固定效应,系数虽然变小,但是相差不大。第(3)栏将样本限制在134个命令接收员(order takers),并使用电话接听数作为绩效衡量指标,发现处理组高于对照组0.248个标准差。第(4)栏中系数为0.12,意味着处理组的员工每周多接听13%的电话(注意:13% = exp(0.120))。
Figure VI则直观的展示了实验前和实验期间两组员工每周接听电话数量的变化情况。实验前,两组的变化趋势是相似的,都随着需求的季节性变化而变化。但是实验开始后,处理组的表现变开始优于对照组,每人每周多接听约40通电话。

IV.B. Individual Employee Labor Supply

在对个体员工的劳动供给方面,Table III分析了导致处理组员工工作时间更长的因素。第(2)栏显示,大约四分之三的通话时间差异是由处理组每天在电话上花费更多的时间造成的,这种现象的原因可能是在家工作更准时、休息时间更少等。第(3)栏显示,处理和控制组之间工作时间差异的另一个四分之一是由处理组员工的工作天数所解释的(因为他们请的病假更少)。作者还将在家工作的treatment dummy 与长通勤时间的指标进行交互以进一步分析。结果也证明,对于每天通勤时间超过120分钟的员工而言,每周通话时间和每天工作时间的差异更大(第(4)-(6)栏)。
IV.C. Quality, Spillovers
接着,作者考虑了处理组的产出增加是否与服务质量有关,并构建了两个衡量质量的指标:转换率与周记录分数(conversion rates and weekly recording scores)。并发现在家工作对工作质量没有任何影响。另外,作者也思考了与WFH相关的改善是来自处理组的实际改善还是来自对照组的恶化(对照组可能会因为没有选中他们而表现消极)。作者选用了两个准对照组来解决这个问题。一组是南通呼叫中心的员工,他们本来可以根据实验的选择规则获得资格;另一组是上海呼叫中心的190名员工,他们没有自愿参加WFH实验,但满足在家工作的资格要求。结果说明,处理组和对照组之间的差距来自处理组的表现改善,而不是对照组表现的恶化。(详见Table IV)

IV.D. Potential Hawthorne and Gift-Exchange Effects
进一步,作者还提出一种对于处理组表现优异的解释是霍桑效应(Hawthorne effects),也就是说员工可能是因为实验而故意为之。另一种解释是交换礼物式的回应(gift-exchange type response),因为携程允许他们在家工作,所以通过更加努力工作来回报他们。但是作者分别论述了这两种因素是无关紧要的。
IV.E. Postexperiment Selection
2011年8月,管理层估计,携程每位在家工作的员工每年多挣2000美元左右,因此他们决定将在家工作的选择权推广到整个酒店和机票部门。这些部门的员工被告知实验已经结束,他们有权选择工作地点,之前没有被选中在家工作的员工现在便有了机会。

Figure VIII 表明,实验后的选择大大增加了在家工作对绩效的影响。作者分析原因是那些在家工作表现较差的员工往往都会回到办公室工作。具体的结果从Table V中可以看出。

V. Impact on the Employees

V.A. Employees’ Self-Reported Outcomes
携程管理层还对员工自我报告的幸福感如何受到该实验的影响感兴趣。因此,他们提出了两套调查:满意度调查和每周一次的工作态度调查。实验开始后,满意度提升且在统计上显著;工作态度方面,虽然在实验之前处理组就报告了更高的积极态度(在10%的水平上显著)、更少的消极态度以及更少的工作疲劳度(可能因为他们知道自己在抽签环节赢了),但是实验开始后,处理组与对照组之间的差距进一步扩大,即处理组有显著的更高的积极性和更少的工作倦怠。
V.B. Attrition
携程开展这项实验的关键原因之一是为了降低员工流失率。Figure IX分别描绘了实验期间处理组和对照组的累积离职率。实验开始后不久,两组之间的累积离职率出现了差异,并且差异迅速地具有统计学意义。到实验结束时,处理组的总离职率(17%)小于对照组的一半(35%)。50%的差距是非常大的,不过作者也指出,如果所有的公司都推行在家办公的话,处理组的离职率可能不会降低这么多。

同时,作者通过probit 回归检验了是否存在选择性离职,回归结果见Table VIII。从第(1)栏可以看到,两组差异为17%,从而进一步证实了Figure IX的结论。从第(2)栏可以看出,表现越好的员工离职的可能性越小。第(3)栏则表示,在家办公会直接降低离职率,间接提升员工的绩效。第(4)栏中的交互项并不显著,说明相比对照组,处理组的离职率对绩效不是很敏感。第(5)和(6)栏则分别估计了在家办公对离职率的影响。另外,作者还提出处理组的效果可能存在低估的偏误。

V.C. Promotions and Career Concerns
在这一小节,作者考虑了在家办公是否会影响到晋升。Table IX的第(1)栏表明,在家工作对晋升没有整体影响。在第(2)栏中,我们发现绩效与晋升显著正相关。第(3)栏表明,在控制了他们的绩效后,在家办公有一个微弱显著的负效应。作者认为,负相关的原因之一是由于他们在家,主管不太注意他们的表现;另一个原因是在家办公的员工缺乏发展人际交往技能的机会。

VI. Profit, Productivity, and Firm Learning

VI.A. Profit and Productivity Impact
作者在这一节分析了公司和个人员工在家工作的成本和收益。在对利润和生产率的影响方面,实验表明,在家工作使每名员工每年可节省约1900美元 。不仅如此,全要素生产率(TFP)也有20%-30%的提升。
VI.B. Firm Learning
公司从这次实验中了解到:
1) 在家办公会提升绩效;
2) 允许员工选择办公地点所产生的效果远远大于员工被要求在家办公的效果;
3) 拥有大量的员工可以作为处理组和控制组,使公司能够评估对不同类型员工的影响;
4) 管理层对于离职率差异如此之大的情况表示,这是超出预期的。
VI.C. Employee Learning
衡量员工学习程度的一个直接指标是改变了在家工作想法的员工数量。经过调查,有47%的人改变了想法。其中24%的人从“是”或“不确定”变为“否”,原因之一是他们发现在家办公会给同住的人带来不便;而12%的人从“否”或“不确定”变为“是”,原因之一是他们看到了在家工作的同事的成功。
VI.D. Why Did the Firm Not Introduce Working from Home Before?
原因有两个:第一,在各种形式的创新过程中都出现了经典的搭便车问题,由于缺少知识产权,很难防止被人模仿。携程会因此承担全部的实验费用,却仅能获得部分的收益。第二,在携程旅行网中,高级管理人员的激励机制使实验结果具有有限的上升空间和广泛的下降空间。他们从成功的实验中几乎得不到什么好处,并且如果实验失败了,就有可能损害其职业生涯。作者还指出,模仿的威胁以及高管对职业风险的规避可能也是阻碍管理和运营实践实验的普遍力量。

VII. Conclusions

此次实验有三大贡献:首先,发现了呼叫中心员工的工作特别适合远程办公;其次,借助广泛的集中式数据库,该公司可以密切监视员工的绩效和劳动力供给;第三,在家办公的程度是有限的,因此不需要在工作场所进行重大重组。
Reference: Nicholas Bloom, James Liang, John Roberts, Zhichun Jenny Ying, Does Working from Home Work? Evidence from a Chinese Experiment , The Quarterly Journal of Economics, Volume 130, Issue 1, February 2015, Pages 165–218, https://doi.org/10.1093/qje/qju032

拓展性阅读:

关于各种因果识别方法的120份经典实证文献汇总”,②哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code,③因果推断的统计方法总结, 177份文献政策评估的计量方法综述, 包括最新因果推断方法在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献,⑥看完顶级期刊文章后, 整理了内生性处理小册子,⑤工具变量精辟解释, 保证你一辈子都忘不了,⑦DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征,⑧关于双重差分法DID的32篇精选Articles专辑!关于(模糊)断点回归设计的100篇精选Articles专辑!匹配方法(matching)操作指南, 值得收藏的16篇文章等,⑪MIT广为流传的政策"处理效应"读本,⑫DID的研究动态和政策评估中应用的文献综述,⑬最新政策效应评估的四种方法,⑭政策效应评估的基本问题

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存