性别研究专题
职业特征如何影响性别间的收入差距
(照片由作者本人提供)
杨一纯
中国人民大学社会学系
(照片由作者本人提供)
谢宇
北京大学光华管理学院社会研究中心,美国普林斯顿大学当代中国研究中心
原文刊于《社会》2020年第3期
摘 要:本文使用2010年第六次全国人口普查数据和借用美国O*Net职业数据库构建了一系列职业特征指标,并结合中国家庭追踪调查(CFPS)2010年的职业信息数据,系统分析和探讨了职业特征具体作用于性别收入差距的机制。研究发现,在控制了一系列职业特征后的性别效应与控制了193个具体的职业类型所得到的性别效应基本一致。利用Oaxaca分解显示,职业内部的男性比例和不同性别的职业技能是职业特征影响性别间收入差距的重要机制,而工作环境方面的性别差异并不能用来解释性别间的收入差距。此外,我们的分析证实了职业特征在经济发展程度不同的区域存在收入回报的异质性。本文有助于我们更好地理解中国的性别不平等和收入分层现象。
自1949年以来,伴随着妇女解放运动和教育扩张,中国女性的受教育年限和劳动力市场的参与率都得到提升,女性的受教育年限甚至已经反超男性(李春玲,2010,2014),但劳动力市场的性别不平等现象仍然存在,其中最重要的表现就是性别间的收入差距问题。作为现代社会一种重要资源和生活机会的结构性分配机制,职业通过将男性和女性分配在具有不同特征的职业内部,来维持劳动力市场的性别不平等,进而影响性别间的收入差距(England,et al.,1988,2002;Jacobs,1989;Reskin,1993;Petersenand Morgan,1995)。因此,研究职业特征作用于性别收入差距的具体机制,可以帮助我们更好地理解劳动力市场中的社会分层与性别不平等问题。国外的相关研究显示,男性和女性在职业特征上的分布差异对劳动力市场中两性的收入差距有很强的解释力。女性占比越高的职业,其收入回报越低(England,1992)。同时,也有研究指出,女性相对集中的职业对硬性技能的要求更低(Treiman and Hartmann,1981;England,et al.,1994,2002;Anker,1997),而更加强调发挥具有女性特征的技能,例如,提供沟通交流以及服务与照料的技能(Steinberg,1990;Folbreand Nelson,2000)。男性和女性在这些职业技能方面的差异,又会进一步使男女的工资差距加大。那么,男性和女性在职业特征上的分布差异到底在多大程度上以及如何影响性别收入的差距呢?相关研究多来自美国,例如,基尔伯恩等(Kilbourne,et al.,1994)发现,职业内部的性别构成加上职业技能一共可以解释8%—17%的性别收入差距,舒曼(Shauman,2006)针对大学生初职收入的研究显示,职业技能可以解释12%—21%的收入差距。但是,以上研究均针对的是发达的资本主义工业体系,中国现在仍处于产业结构升级的后发工业化阶段,因此,对中国的相应分析可能会得到与之前研究不同的结论。目前,国内的相关研究也关注到职业对于性别间收入差距的影响。这些研究主要使用三种研究指标,第一种是使用Oaxaca分解,将收入差距分解为可以解释的部分和工资歧视(Oaxaca,1973;Jones and Kelley,1984);第二种使用Brown分解,将收入差距分解为职业内部和职业间,并关注职业间的解释比例(Brown,et al.,1980);第三种使用Appleton分解法(邓峰、丁小浩,2012)。这三种分解方法对模型构建都非常敏感。尽管之前的研究肯定了职业对性别不平等存在重要影响,但因为数据资料等因素的限制,这些研究仍具有一些局限性。一是使用的职业分类过于笼统,而使用粗略的分类系统会掩盖职业大类内部的职业小类间职业特征的分布差异。例如,李实、马欣欣(2006)的研究仅将职业分为6种类型,邓峰、丁小浩(2012)的研究也同样只将职业类型分成6类,其他相关研究的分类方式也相类似(何泱泱等,2016)。国内外的相关研究已经指出,职业类型的详细划分对于研究职业对收入的影响至关重要,当职业分类非常详细时,它几乎能完全解释职业对性别间收入差距的效应(Peterson and Morgan,1995),这会使我们的估计更加准确。采用笼统的职业分类则可能会使测量和分解结果存在很大偏差,也难以与西方国家进行比较。之前研究的第二点局限是只考虑了职业内部的性别构成对性别收入差距的影响,例如,吴愈晓、吴晓刚(2009)克服了第一个问题,他们使用了第六次人口普查详细的职业分类,发现职业内部的性别比是影响国有部门性别收入差距的重要因素,这给我们理解职业特征与中国劳动力市场性别不平等的关系很大启示,也为我们的研究奠定了基础。但是,可能是因为当时相应数据的缺乏,他们的研究仅考虑了职业内部的性别比例,而没有考虑不同职业所需要的职业技能,以及工作环境对于收入差距的影响。这可能会因为关键影响变量的遗漏而使分析结果出现偏差。一方面,由于其他职业特征与职业内部的性别构成高度相关,如果只考虑职业内部的性别构成,就会使得其他职业特征变量对性别收入差距的效应被这一变量吸收,从而高估职业性别构成这一变量的影响。另一方面,即使是女性比例非常相近的职业,技能的要求也可能不同,例如,幼儿教师和医疗辅助人员。第三,也是最重要的一点,尽管国内很多文献都注意到职业是影响性别不平等的重要因素,但对于其作用于收入差距的具体机制还缺乏系统探讨,这会使我们无法清楚地知道究竟是哪些职业特征真正影响性别间的收入差距。职业的作用机制是通过多种路径共同实现的,仅考虑职业内部的性别构成这一因素,也可能会使分析结果不够全面。第四,之前的研究也较少关注职业特征在不同区域的回报是否存在异质性。由于职业特征的分布具有明显的性别差异,因此,地域层面的回报异质性也可能会影响收入的性别不平等,我们有必要对这部分内容进行探讨。西方国家建立了成熟、统一的劳动力市场,因此,职业特征的回报在这些国家内部基本不存在显著的地区差异。不同于西方国家,中国的经济发展和市场化改革是渐进的,不同区域的经济发展水平、自然资源禀赋和劳动力市场发展的阶段都存在明显差异(Walder,1995;Xie andHannum,1996),不少研究在此基础上检验了区域因素对收入的影响,但它们基本的关注点是人力资本和政治资本因素的异质性回报(Xie and Hannum,1996;边燕杰、张展新,2002;郝大海、李路路,2006),而对于职业特征的区域回报异质性关注较少。因此,我们还将对这一问题进行探索性研究。有鉴于此,本研究借用美国O*Net职业数据库详尽丰富的职业信息,与中国2010年的第六次全国人口普查数据共同构建了一系列职业特征指标,并结合使用2010年中国家庭追踪调查(CFPS)详细的区县层次数据,以期回答三个问题:在中国,职业特征到底在多大程度上影响性别间的收入差距?职业特征又如何影响性别间收入差距?职业特征的收入回报是否存在地区异质性?
(一)职业特征的作用机制
除了探讨职业特征的分布对于性别间收入差距的影响幅度外,社会学家也对职业特征为何作用于性别间收入差距提供了相应的理论解释。职业特征能够解释性别收入差异需要满足两个前提条件:一是这些职业特征的分布在男女之间存在不同(Path A);二是这些职业特征会获得不同的薪酬回报(Path B)(如图1b所示)。
我们的研究目的,首先是看职业特征在多大程度上影响性别间的收入差距,其次是看职业特征的作用机制,也就是它具体是通过哪些职业特征来影响收入差距的。为了说明职业特征的作用路径和研究策略,我们参照了谢宇、舒曼(Xie and Shuaman,1998)的图示(图1)。图1a中性别的二元效应(Path A*)是指只纳入性别变量时的情况,即性别对收入的全部效应。图1b中性别对于收入的全部效应则被分解为两部分,一部分是直接效应(Path C),另一部分是性别通过职业对收入影响的间接效应(Path A和Path B),也就是我们所关心的职业的中介效应。目前有两种普遍的策略来估计职业对于性别间收入差距的中介作用。一种是传统的方法,即直接纳入职业类型的虚拟变量。从模型设定来看,纳入职业类型的虚拟变量是控制了职业层面的固定效应,可以最大限度地估计男性和女性在职业间的分布差异所造成的收入差距,也就是图1b中性别通过职业分布(Path A)影响收入(Path B)的全部间接效应。这种方法的优势在于它能准确地估计职业性别隔离的影响程度,缺点是过于保守并浪费了更多的自由度。而直接纳入这些职业类型只具有统计学意义,并不能让我们了解究竟是哪些职业特征影响收入差距。因此,本研究将采用另一种方法进行估计,即纳入符合前文提到的两个前提的职业特征变量,并将这个模型的性别系数与职业的固定效应模型进行比较。如果两组模型的性别系数是基本相似的,就说明我们纳入的这些职业特征变量最大限度地捕捉到了男性和女性在原始的职业类型分布上的差异所导致的收入差距,从而达到简化分析的目的。进而,我们再对这些职业特征的贡献率进行分解,就可以知道职业性别隔离具体是通过哪些职业特征来影响性别间的收入差距的。
(二)研究假设
本文将主要讨论和检验职业特征作用于收入差距的三种主要机制:不同性别的个体所拥有的职业技能的差异;不同职业内部男性的比例差异;不同职业工作环境的差异。对于这三种机制的分析,我们将从职业特征分布的性别差异和这些职业特征对收入的不同影响两方面展开。除此之外,我们还将讨论和检验职业特征在地区层面对收入回报影响的异质性。
性别角色的社会化理论强调男性和女性在一系列人力资本投资上的差异是在社会化过程中形成的(Corcoran and Courant,1985),男性和女性通过一系列的社会化过程逐渐培养出符合性别角色的观念和职业期望(Okamoto and England,1999;李汪洋、谢宇,2016),并进而选择不同的专业课程(Davies and Guppy,1997),发展出一系列不同的职业技能(Polavieja and Lucinda,2014),最终进入不同的职业。社会化的过程主要通过两种途径来形成或加强性别化的角色实践。一方面,男性和女性自儿童时期便开始根据自己的性别选择符合自己性别角色期望的活动和课程,而这些不同活动和课程的训练是造成男女思维能力差别的重要影响因素(Coyne,et al.,2016)。这使得男性和女性在以下的职业技能层面存在明显差异:在社会技能层面,女性被培养出更多的同情心和照料他人的能力(Shauman,2006);在认知能力层面,男性和女性在量化能力和语言沟通能力上的表现也存在很大差别(Feingold,1992;Merrill,et al.,2016),男性更擅长量化方面的工作,而女性更擅长语言沟通。此外,男性和女性在身体能力上也存在差异,相比于女性,男性被培养出更多的动手和操作工具或机器的能力(Shauman,2006)。另一方面,在社会化过程中形成的性别刻板印象也影响个体对自我能力的评估。有研究指出,即使女性的数学成绩与男性一样优秀,她们也会倾向于低估自己的水平,进而没有信心选择进入需要量化能力的职业(Correll,2001)。相应的,这种带有性别偏见的能力评估也会影响雇主的判断,形成对职业的性别定位,导致女性更难进入被认为是男性擅长的需要量化能力和操作技能的职业。上文提到的不同性别所具有的职业技能与职业报酬相关,从而导致女性从事的职业报酬较低。人力资本理论认为,雇主需要支付大量的费用,雇佣那些拥有需要投入大量精力学习并可以提供高生产率及高利润的技能的员工(Becker,1962;Dickensand Lang,1988),这些技能既包括认知能力层面的技能,也包括身体和社会技能,这已得到很多研究的验证。例如,在控制一系列人力资本变量和工作环境后,对认知能力要求越高的职业的收入回报越高,如语言能力和量化能力(England,1992;Shauman,2006)。尽管女性进入对语言能力要求高的职业机会更大,却难以进入对量化能力要求高的职业。由于与照料或服务技能相关的职业被看作家庭劳动的延伸,需要长期面对面的指导和服务,难以看到即时的生产效率,从而存在收入惩罚(Kilbourne,et al.,1994;England,et al.,1999,2002),同时,女性则大量集中在这类职业中,如教师、护士等。身体能力同样会对收入产生影响,例如,在控制其他因素后,一定的操作修理技能4对收入可能存在正向影响(England,1992)。由此,我们提出职业性别隔离的第一个作用机制假设:
假设1(性别类型化的职业技能假设):职业技能是影响性别间收入差距的机制。根据不同的职业技能影响收入的不同方向,我们又进而提出如下四个子假设:假设1a:职业所需要的量化能力越高,收入回报越高;假设1b:职业所需要的语言能力越高,收入回报越高;假设1c:职业所需要的操作技能越高,收入回报越高;假设1d:职业所需要的照料技能越高,收入回报越低。
2. 职业内部的性别构成
职业内部的性别构成同样会影响工资收入,其中,女性比例与收入回报表现为负向关系。对于职业内部的性别比例为何影响收入的问题,主要存在两种观点。人力资本理论认为,这是因为女性集中在对人力资本要求低的职业,收入回报的差异是由这种人力资本的差异造成的(Baron and Newman,1989)。但是,这种理论被一系列相关研究反驳。有研究发现,即使在控制了人力资本以及其他的职业特征之后,女性比例与收入仍然为显著的负向关系(England,et al.,1994),也就是说,职业间的性别比例本身会独立发挥作用,因此,它也是影响性别间收入差距的一个不可忽视的职业特征。社会学家对于这种负向关系的解释是“贬值假设”,这种假设认为劳动力市场上存在对于与女性相关工作的“价值性歧视”(England,1992;Peterson and Morgan,1995),当一个职业内部的女性比例增加时,会使雇主认为这种职业的价值降低而给予更低的工资。经济学家用“拥挤理论”来解释女性比例的增加所带来的收入负效应。基于这种理论,男性和女性都排队想进入理想的“男性职业”,但大部分的女性不会被“男性职业”雇佣,这就导致女性在劳动力市场上的供给量增加,从而导致与女性相关的职业的贬值。基尔伯恩等(Kilbourne,et al.,1994)还指出,劳动力市场上存在的“价值性歧视”还进一步使得与女性相关的职业技能贬值,例如,前文提到的照料服务技能。由于这种技能在一定程度上被看作家务劳动的延伸,并且多为女性所占据,相应的职业因此也会受到收入惩罚。
根据“价值性歧视”理论,我们提出第二个作用机制假设:假设2(职业内部的性别构成假设):职业内部的性别构成是影响性别收入差距的机制,职业内部的男性比例越高,收入回报就越高。
3. 工作环境
新古典经济学提出“补偿性差异理论”来解释当控制了人力资本之后仍然存在的工资差异(Smith,1979;Rosen,1986)。这种理论认为,工作回报包括金钱和非金钱两个层面,后者可能包括对于这份工作的兴趣、舒适感,以及工作中可能遇到的危险等。依据这种理论,在控制了其他条件的情况下,那些经常在恶劣的工作环境中工作的雇员收入会更高,这是因为他们需要获取一部分的报酬来补偿他们工作中所面对的风险。相对于女性来说,男性更容易从事户外的劳动,接触一系列污染物或进行高空作业等,而女性更可能从事室内的工作,工作环境相对更加舒适。因此,这种工作环境上的差异可能会导致男女的收入差距。尽管“补偿性差异理论”认为恶劣的工作环境可能会产生正向的工作回报,但对于工作环境和收入的关系,采用不同的测量方式进行检验,得到的结论和方向并不一致。例如,一些研究发现,只有当工作环境有使人致死的风险时,工作环境与收入的关系才是正向的,而一般的恶劣环境与收入没有关系(Smith,1979;Brown,1980);英格兰德(England,1992)则发现恶劣的工作环境对于工作回报没有显著影响。另外,还有研究发现工作环境的恶劣程度与收入之间的关系是负向的(Shauman,2006)。但是,基于中国目前的发展现状,我们认为恶劣的工作环境可能会带来高经济回报。由于中国仍处于工业化快速发展阶段,因此,与工业化发展相关的资源开发、城市建设等工作,例如矿物勘探行业、核能行业、土木工程类行业,虽然工作环境较为恶劣,但它们同时也是一些高风险、高收入的工作。因此,我们在中国的环境下试图对这一假设再次进行检验,并探索在中国环境下这一理论是否可以得到验证。根据“补偿性差异”理论,我们提出第三个作用机制假设: 假设3(工作环境假设):工作环境是影响性别收入差距的机制,工作环境越恶劣,收入回报就越高。
4. 职业特征的异质性回报
之前的三个假设讨论了职业特征分布的性别差异,以及几种职业特征可能影响收入回报的方向。考虑到中国劳动力市场存在明显的区域差异,职业特征在不同区域的回报异质性可能也会在一定程度上影响性别间的收入差距,因此,我们也将对此进行探讨。中国在改革开放之前实行的是计划经济体制和单位制,并不存在真正的劳动力市场。在经济体制改革之后,由于政府首先在沿海地区建立试点,并逐步在不同地区推行不同的优惠扶持政策,再加上不同区域的自然资源禀赋也存在差异,这使得不同区域在经济发展水平、劳动力市场发育程度和不同类型的劳动力供需水平上都存在明显差异。相关研究也证实了区域因素是导致中国城镇地区居民收入差距的一个重要因素(Xie and Hannum,1996;边燕杰、张展新,2002;王天夫、王丰,2005;郝大海、李路路,2006;齐亚强、梁童心,2016)。这些研究基本围绕倪志伟(Nee,1989)提出的“市场转型论”进行检验,关注的焦点在于不同地区经济发展水平的差异如何影响个体的人力资本(受教育年限、工作经验),以及政治身份收入回报的变化。与之相关,上文所讨论的几种性别类型化的职业技能也是人力资本的一种体现,而不同经济发展阶段的区域由于产业结构存在明显差异,对不同类型的职业技能的劳动者的需求数量和层次以及相应劳动力供给的比例因此也存在差异(郝大海、李路路,2006;齐亚强、梁童心,2016;Xie,et al.,2016),这可能会使得职业分布在不同区域存在差异,从而影响职业特征在不同区域的回报。一方面,经济发展程度更高的地区的劳动力市场可能更需要和依赖某些职业技能,相关职业技能因此可能有更高的回报;另一方面,这也会吸引有这些职业技能的人大量涌入相应地区,使这类职业的分布更广。我们认为,职业特征区域回报的异质性具体表现在以下几个方面:首先,相关研究证实,经济发展程度更好、个人平均受教育年限更长的地区更需要高新技术的产业发展(Murphy and Welch,1993;Witte and Kalleberg,1995;Van de Werfhorst,2011),因此,这些地区的劳动力市场可能更需要和依赖认知技能,语言能力和量化能力在这些地区有更高的溢价,从而可能进一步促使此类职业的人涌入相应地区,使得该地区的此类职业分布更广。其次,一般来说,照料服务类的职业报酬较低。然而,由于劳动力成本高,市场需求大,经济发达地区的照料服务类职业的劣势相对于经济欠发达地区要小一些。经济发展程度更高的地区的第三产业更发达(Witte and Kalleberg,1995),需要包括照料服务类在内的职业。尽管第三产业中更被市场重视的是高端服务业,但相对于经济发展程度较低的地区来说,照料服务类职业的收入可能也会相应更高一些,例如,北上广深等城市的家教、心理咨询、护工、保姆等,这可能是因为,相对于经济发展程度较低的地区,这些地区对于此类职业的市场需求更大。由于工作压力大,使得这些地区的人更愿意付出更多的金钱雇佣照料服务类职业的雇员以减少人力和时间成本,这可能会使得照料服务技能的惩罚作用在这些地区被削弱。操作修理技能类职业一般来说收入回报较高,但在经济发展程度高的地区,这类职业的优势相对于经济欠发达地区可能会更小一些。这是因为,操作修理技能类职业中虽然也有一部分是强调高技能的职业,如航空、航天等行业中机械或精密仪器的装配/修理人员,但其中有很大比例的职业对相应技能的要求并不高,职业门槛较低,例如,一些电器、机械的安装/修理工作等。在经济不那么发达的地区,操作修理类职业更受到重视,即使是一些不那么强调技术的职业也会受到市场重视,这是因为在这些地区具备此类技能的人员较少。而在经济发展程度较高的地区,由于竞争更加激烈,市场上相应劳动力的供给也更为充分,因此,只具备较为初级的此类技能的人员可能供给更多,这可能会使这些职业的溢价水平在一定程度上被削弱,从而使得这类职业的溢价水平整体上被拉低。此外,不同经济发展水平的地区在价值层面上也可能存在差异,“价值性歧视”作用的程度可能也会不同。例如,经济发展水平更高的地区的劳动力市场可能更看重个体的人力资本,从而削弱了“价值性歧视”的作用。最后,我们还关注所处工作环境的回报是否在不同地区也存在明显差异,由于高风险、高回报的职业更可能集中在经济发展程度更高的地区,因此,相比于经济欠发达地区,工作环境恶劣的职业在经济发展程度高的地区可能回报更为丰厚。由此,我们提出以下假设:假设4(职业特征回报的异质性假设):职业特征的回报在不同地区存在明显差异。根据区域影响职业特征回报的不同方向性,我们进而又提出以下六个子假设:假设4a:经济发展程度更高的地区,语言能力的溢价更高;假设4b:经济发展程度更高的地区,量化能力的溢价更高;假设4c:经济发展程度更高的地区,照料技能的负向效应会被削弱;假设4d:经济发展程度更高的地区,操作技能的正向效应会被削弱;假设4e:经济发展程度更高的地区,职业男性比例的正向效应会被削弱;假设4f:经济发展程度更高的地区,工作环境(恶劣程度)的正向效应更高。(一)数据
本研究所使用的数据来源主要有三个。第一个是微观层面的数据,也就是我们在分析中最主要使用的数据,是由北京大学中国社会科学调查中心设计调查的中国家庭追踪调查(CFPS)2010年的基线调查数据。CFPS采用多阶段、内隐分层和与人口规模成比例(PPS)的方法,收集了职业、家庭、婚姻和收入等方面详细丰富的信息(谢宇等,2014)。本研究将研究对象界定为16—65岁“当前正在工作并且有收入的非农职业劳动者”,因此,样本中排除了在调查时点失业、无业、退休等退出劳动力市场的人,同时也排除了所有从事农林牧渔的劳动者。经过数据清理,我们最终得到包括5828人的总样本,其中,女性2324人,男性3504人。我们主要通过这个微观数据获取个人的教育、家庭、职业和收入信息。第二个数据来源是使用中国2010年第六次全国人口普查的公开数据获得每个非农职业的职业性别隔离程度的变量,在本研究中就是职业内部的男性比例。由于目前还缺乏中国对于职业特征信息的测量数据,而之前的研究显示职业特征在不同国家间是较为普遍的(Horowitz,2018),例如教师、经理、护士等职业在不同国家所使用的职业技能和工作环境是较为相似的,因此,我们借用了美国的数据来研究我们提出的问题。最后一个数据来源是美国职业信息数据库(O*Net),这个数据库对974个职业小类在职业所需要的知识、技能、工作能力,职业具体的活动,职业价值观以及工作风格、工作环境等方面进行了详细的职业描述,本研究主要通过这个数据库构建一系列职业特征变量,并将职业性别隔离程度和职业特征变量合并到CFPS数据库中。这三个数据库的结合是目前研究职业特征作用机制的最理想选择。值得注意的是,这三个数据库所使用的职业代码系统不同。CFPS2010和第六次全国人口普查使用的都是“2009年中国标准职业分类”,这套编码系统共包括410个职业小类,其中,非农职业380类。但是,O*Net使用的是“2010年美国标准职业分类”,这套职业分类系统更细,包括974个职业小类,其中非农职业953个。例如,中国职业系统的一个类别是企业负责人,而美国系统则分为人力资源经理、销售经理、广告经理等。因此,有必要建立一个统一的职业分类体系。本研究以“2009年中国标准职业分类”为标准,参照对每个职业具体活动的描述,将中国的职业分类系统与美国O*Net系统的职业分类进行对接,建立起对应关系,所遵从的原则是:尽可能保留多种职业类型,同时保证每个类别内部的所需要的活动职能和工作技能具有一致性。最后通过归类得到238个非农职业。
(二)变量测量
此次研究的因变量是与被访者这份职业相关的所有月收入的对数,包括工资收入、浮动工资、奖金和福利等。最关键的一组自变量是职业特征变量,在参照之前同样也使用O*Net职业数据库构建相应的职业特征的研究的基础上(Hadden,et al.,2003;Shauman,2006),我们主要使用因子分析的主成分分析法和最大旋转法构建了238个非农职业一系列职业特征的变量,并保留了与研究假设相关的核心职业特征变量。最终得到5个与研究相关的职业特征变量,包括2个认知能力层面的变量——语言能力和量化能力;还包括操作修理能力、照料服务技能以及工作环境的恶劣程度,这5个变量的取值区间基本都为(-3.5,3),均值为0,标准差为1。我们将这5个职业特征变量合并到CFPS2010的数据中,经过数据清理,2010年的CFPS数据中共包括193个非农职业,因此,我们获得了这193个职业的特征信息。本研究所使用的职业内部的男性比例是根据“六普”数据计算得到的,需要注意的是,由于需要配合使用O*Net数据库,我们将一些职业进行了归类,并重新计算了这些职业的男性比例。在进行数据合并时,我们尽可能地保证了合并的职业类型在职能和对职业技能方面的要求是基本相似和一致的,同时这些职业的性别比例也很相近,因此,这种合并对我们的计算结果不会有明显影响。此外,本研究还控制了个体层面的人力资本变量和个人特征变量,包括受教育年限、工龄和工龄的平方和、每月工作小时及其平方和、户口类型(“城市”=1)。除此之外,考虑到中国社会中单位体制的分割同样会影响性别间的收入差距(吴愈晓、吴晓刚,2009),因此,本研究也纳入了“体制内/外”的变量。我们将在政府部门、党政机关、国有/集体企业、事业单位工作的人赋值为1,将在民办、私营、外资企业和个体工商业等工作的人赋值为0。最后,本研究还纳入了一系列家庭层面的变量。由于相关研究发现婚姻状态也会影响收入(Cheng,2016),因此纳入了“个体是否结婚”变量(“当前在婚”=1,“丧偶、同居、未婚”=0)。参与家务劳动的时间同样也会影响个人的工资水平,这是因为,在精力有限的情况下,从事家务劳动的时间越多,就越会分散投入工作的时间和精力(於嘉、谢宇,2014),因此,我们纳入了工作日每天从事家务劳动的时间。本研究所使用的家务劳动时间的测量方式是根据问卷中两个问题相加得到的,其中第一个是问卷中询问的个体报告每天从事家务劳动的时间,另一个是每天用于照料老人的时间。由于中国不同区域的收入存在明显差异,本研究还控制了区县层面的变量,主要是三个反映当地的经济发展水平和工业化程度的变量,分别是“区县人均GDP”“区县平均受教育年限”和“区县非农人口比例”。由于三个变量之间高度相关(郝大海、李路路,2006),我们在分析职业特征的作用机制时仅纳入“区县人均GDP”作为控制变量(见表2的模型2—模型5),在分析职业特征的异质性回报时则分别纳入“区县人均GDP”与其交互项(见表6的模型6—模型11)。此外,我们还使用另外两个测量区县经济发展水平的变量分别拟合了交互效应模型进行稳健性检验,但由于篇幅限制,我们仅在正文报告了模型6—模型11的结果,稳健性检验的部分在文中脚注的相应部分提及。
(三)统计模型与分析策略
本文的数据分析包括四部分。第一部分是描述性统计分析,主要是看原始的性别收入差距以及比较男性和女性在一系列职业特征分布上的差异;第二部分将使用最小二乘法多元线性嵌套模型估计职业特征对性别收入差距的影响,尤其是在控制了其他变量的基础上,比较纳入6个职业特征变量与纳入具体的193个职业类型的虚拟变量后性别系数上的差别;第三部分计算和分解这些职业特征作为中介变量对于解释性别收入差距的贡献率,本研究不仅关注各种职业特征对于收入差距的独立解释力,还关注所有职业特征对收入差距的共同解释力;第四部分着重讨论职业特征在不同地区的回报是否存在异质性。(一)收入、职业特征的性别差异
表1报告了样本中男性和女性职业特征的分布差异。可以看到,女性月收入是男性的72.6%。在职业特征方面,表1的数据显示存在明显的性别差异。具体来说,男性所在职业对于语言能力和照料服务技能的平均要求显著低于女性所在职业,反之,对于量化能力和操作修理技能的平均要求则显著高于女性。同时,男性所处职业的工作环境也更加恶劣。这与我们的预期和以往的相关研究(Kilbourne,et al.,1994;Shauman,2006)相符。此外,男性职业的平均男性比例显著高于女性,差距大概为21%。同时,男性也更多地占据了体制内的优越工作岗位。
从人力资本特征来看,样本中男性的受教育年限反而低于女性,但男性在工龄和每月工作时间上高于女性。而从家庭特征来看,女性比男性承担了更多的家务,这也意味着男性在家务劳动中可能付出较少从而能有更多的时间投入工作。
(二)职业特征对于收入差距的影响
为了估计各种因素,尤其是职业特征对收入差距的影响,本研究使用嵌套模型拟合了5个模型(见表2)。模型1仅纳入性别这一变量,然后从模型2到模型4,逐步纳入人力资本、地区特征、家庭特征和职业特征变量,以观察性别系数的变化。模型5在模型3的基础上纳入了193个职业的虚拟变量,以比较模型4和模型5的性别系数是否相似。
首先,基准模型中的性别系数为-0.295,且在0.001的统计水平上显著。模型2在加入了人力资本变量和地区变量后,性别系数反而降低了,也就是说,男女的收入差距增加了,这是由于受教育年限与收入存在正向关系而女性的受教育年限分布优于男性的原因。同时,样本中女性所在的区域经济发展程度更高,这一变量与收入的关系也是正向的。模型3在加入家庭特征变量后,性别系数上升为-0.282,这说明性别间的收入差距在很大程度上来源于男性和女性在婚姻和承担家务劳动方面分布的差异,它们一共可以解释约17%的性别效应。模型4在加入职业特征后,性别系数上升为-0.232,这代表纳入的职业特征变量总体可以解释大约18%的性别效应。模型5纳入了模型4中除了职业特征以外的全部变量,同时也纳入了职业的虚拟变量,用来与模型4比较性别系数的差异。可以看到,模型5的性别系数与模型4几乎一致,模型4的系数为-0.232,模型5的系数为-0.227,仅相差0.005。这说明本研究所纳入的一系列职业特征变量几乎完全捕捉到了男性和女性在原始职业类型分布的性别隔离所造成的收入差异,这些职业特征变量具有很好的解释力。表3报告了模型4(全模型)的回归模型。表2的模型我们没有考虑人力资本、家庭特征和职业特征回报存在的性别异质性,而表3不仅报告了对于全部样本的总体模型,还报告了分性别的模型,用以讨论同一特征是否对男性和女性的影响存在差异。同时,分性别的回归模型也可以为之后对不同要素的贡献分解做准备。这部分着重讨论职业特征(6个变量)的作用大小和方向,同时对其他的重要变量也会进行解释。
首先,我们来看各种性别化的职业技能对收入的影响。表3显示语言能力对男性和女性都有正向作用,并且系数都是显著的。总体来看,全样本模型显示,所在职业要求的语言能力每提高一个标准分,个体所处职业的平均收入就会增加9.7%,假设1b得到证实。量化能力对于男性和女性的影响不同,这与假设1a的预期不完全一致。具体来说,分性别来看,在控制其他条件的情况下,量化能力仅对女性样本存在显著的正向影响,女性所在职业的量化能力分数的标准分每提高一分,女性的工资会就会提高6.7%,但男性的这一系数并不显著。为了对这一结果进行更深入的分析,我们查看了所使用的数据中男性所从事的职业对量化能力要求高的是哪些,结果发现,男性中量化能力高的职业很大比例是蓝领职业中的工程技术人员,比如负责勘探和化学合成的人,而医生、研究员、金融从业人员等对于量化能力要求高且收入回报高的职业比例则相对较小,这可能导致男性样本中量化能力的系数被拉低。而女性中量化能力高的职业基本上是白领中的会计等职业,与我们的预期一致,女性的这一系数是显著正向的。从照料服务技能来看,表3数据显示,所在职业对于服务技能的要求越高,这个职业总体上就越贬值,这也与我们的预期相符合,假设1d得到证实。从性别角度看,男性所在职业对于服务技能更敏感,在控制其他条件的情况下,男性所在职业服务技能要求每提高一分,男性的收入就会降低8.9%。操作修理技能对男性和女性的影响也存在差异,对操作修理技能要求越高的职业,其收入回报就越高。但从性别角度看,这一影响只对男性显著,男性所在的职业对于操作修理技能要求每提高一个标准分,收入就会提高4.5%,虽然女性的系数也为正,但并不显著,这可能是因为这种操作、修理、搬运技能更强调男性本身的体力特征,而对女性有所排斥,因此,即使女性在对这方面有所要求的职业内部,也可能只是处于边缘状态,并不能显著提高收入。因此,假设1c也部分得到证实。其次,我们来考察职业内部的男性比例的影响。表3数据显示,这一变量对收入有正向影响,并且对男性和女性都是显著的,系数也基本一致。具体来说,在其他条件不变的情况下,职业内部的男性比例每提高10%,个体的收入就会提高2.5%左右。这表明,这一变量的效应无法被其他的人力资本和职业特征变量所解释,在控制了其他职业特征和个人特征的分布之后,这一变量仍独立发挥作用,因此,在中国情境下,“价值性贬值假设”仍然稳定地发挥作用。职业内部的性别比例与收入密切相关,职业内部的女性比例越高,就越会使得职业贬值,假设2的后半部分得到证实。对这一结论的检验和证实也显示了构建和纳入其他职业特征变量的必要性,只有在尽可能地控制了一系列可能影响收入的人力资本和职业特征变量后,我们才有经验证据证实“价值性歧视”的存在,而不能被其他可以观察到的特征变量所解释。此外,纳入其他与性别比例密切相关的职业特征变量后,在后面的分解部分才可以剥离这些变量的影响,以更为准确地估计职业性别比例发挥的效应对解释性别收入差距的贡献。最后看的是职业工作环境的影响。从表3工作环境的系数看,所在职业的工作环境越恶劣,收入反而越低,这不符合新古典经济学的“补偿性差异”的假设,假设3的后半部分没有得到证实。这可能有两方面的原因:一方面,正像之前的研究所指出的,恶劣的工作环境未必会带来高收入回报,只有那些可能有死亡风险的工作环境才有可能带来收入溢价(Brown,1980),而使用O*Net数据所测量的工作环境的恶劣程度只不过是一般层面上的,并没有极端的死亡风险;另一方面,这也可能是因为,工作环境越恶劣的工作,越可能是那些职业地位较低、没有技术含量的工作,这些工作本身也与低廉的收入挂钩。而在本研究的样本中没有捕捉到那些高风险、高收入的职业类型,因此,对于这部分的检验,我们也期待之后国内有其他的数据可以做更细致严谨的分析。除此之外,其他一些变量和控制变量也值得关注。首先,一个有意思的结果是家务劳动时间对收入有显著的负向影响,在控制其他变量的情况下,每天的家务劳动时间每增加1小时,就会使得个体收入减少约5.7%。区域层面的变量显示,区县人均GDP越高,个体的收入回报也越高。此外,本文的研究结果没有显示体制内工作的溢价效应,这可能是因为体制内工作的溢价效应在一定程度上是来源于不同职业特征在体制内/外的分布。当控制了这些职业特征后,体制的溢价效应也就不再显著了。这一结果也与之前使用同一数据得到的结论基本一致(孙文凯、樊容,2017)。
(三)不同职业特征对于性别收入差距解释的贡献
从前文的结果可知全部的职业特征一共可以解释多少性别间的收入差距,为了进一步确定不同的职业特征各自对性别收入差距有多大的解释度,同时也为了便于将结果与国内外的相关研究结果进行对比,本文采用了相关研究中普遍使用的Oaxaca分解来对不同的要素的贡献进行分解(Kilbourne,et al.,1994;吴愈晓、吴晓刚,2009)。收入的性别差异主要来源于三部分:第一部分是男女在职业特征的分布上存在差异(表1),第二部分是不同的职业特征带来的收入回报的差异(表3),这两部分共同构成可解释的部分,第三部分则源于不可解释的部分。这种方法是根据拟合的影响性别收入差距的回归模型,利用回归模型的各项系数和男性和女性在这些变量上分布的均值差异来分别计算不同的变量对于性别收入差距的贡献(Oaxaca,1973;Jones and Kelley,1984)。其具体的公式为:
其中,βf是利用女性样本拟合的回归系数,βm是利用男性样本拟合的系数,βfs是使用全样本拟合的系数。Xm 和Xf 是X变量分别在男性和女性样本中的均值,LnWm和LnWf分别为男性和女性月收入的自然对数。对于使用哪个模型的回归系数计算结果,相关的研究还存在争议(Marini and Fan,1997)。为了保证结果的稳健性,我们采取了两种方式对每个要素的贡献率进行分解,一种方式是采用全样本模型的回归系数(Wellington,1994),另一种方式是采用男性样本和女性样本两个模型回归系数的均值(Shu and Bian,2003),这可以使我们避免由于单一样本的回归系数对奇异值过于敏感而导致分解结果出现偏差。表4报告了对不同的职业特征贡献率进行分解的结果,可以看到,所有的变量一共可以解释性别收入差距的21.36%,略低于模型5的23.05%,其中,职业特征变量一共可以解释其中的17.26%。首先看不同职业技能的贡献率,在职业技能中贡献率最高的是照料服务技能,为7.47%—8.31%,其次是操作修理技能,两者一共可以解释约12%的性别收入的差异。但是,量化能力对于男女收入差距的贡献率较低,这一点还有待以后的研究继续探索。此外,语言能力的贡献是负值,这是因为女性所在职业的语言能力要求高于男性,而语言能力对于收入的影响是正向的。尽管如此,研究结果仍然显示,男性和女性在不同职业技能上分布的差异对于性别间的收入差距共有7.93%—8.68%的贡献率,假设1得到证实。
其次,职业内部的性别比例是所有职业特征中对于解释收入差距贡献率最大的一个,为15.02%—16.09%,这也证实了假设2,即性别间的收入差距在很大程度上是由职业内部的性别比例构成造成的。这个结论与之前西方的相关研究相差不大,它们对这一特征的解释力在12%左右(Kilbourne,etal.,1994),这说明“价值性歧视”在各个国家是一个较为普遍的现象。但本文的研究结果略低于之前国内的研究的数据结果,这可能是当时受限于数据而没有控制其他的职业特征变量的缘故。正像前文所指出的,由于职业特征变量与性别比密切相关,可能使其他职业特征变量对性别收入差距的效应被这一变量吸收,从而使之前的研究在一定程度上高估了职业性别构成这一变量的影响。最后,数据显示工作环境的贡献为负值。正像我们之前所指出的,工作环境的恶劣程度对收入有负向影响,同时,相对于女性来说,男性的职业更可能分布在恶劣的工作环境中,所以,工作环境的恶劣程度并不能解释性别收入的差距,假设3未得到证实。
值得注意的是,分解结果显示,家务劳动的时间对于解释性别间的收入差距也有很大的影响,贡献率大概在18.41%—19.40%,这也说明了家务劳动分工的性别差异可能对收入有影响。由于性别分工的差异,女性会投入更多的时间承担照料家庭的责任,这可能在很大程度上影响了女性对工作的投入,进而影响了她们的收入。家务劳动的解释效力之高超出我们的预期,但目前国内对于家务劳动与性别收入不平等的研究还比较少,这也启发我们之后去做进一步的探索。
(四)职业特征回报的地区异质性
本部分将对职业特征回报的地区异质性进行一个探索性分析,其中所讨论的职业特征对收入的影响与地区的关系是一种相关关系,而不是严格的因果推断(参见表5)。
从地区变量与职业特征变量的交互效应来看,区域经济发展水平不同的地区,职业特征的回报也存在明显差异,假设4得到证实。首先,表5结果显示,更好的地区区域发展水平与更高的认知能力的回报相关。这一结果并未证实“蛙塘效应”,即在高认知能力的职业比例更高的地区,并未因为此类职业分布更多而降低这些职业技能的回报,反而是提高了这些职业技能的溢价水平。具体来看,在控制其他变量的情况下,对于语言能力和量化能力来说,区县人均GDP每提高1万元,两者的收入回报就会分别提高约1.3%和1%。这一结果可能是因为经济发展水平更高的地区的职业对于这些职业技能高度依赖(Murphy and Welch,1993;Witte and Kalleberg,1995;Van de Werfhorst,2011),从而会使得语言能力和量化能力有更高的溢价。同时,这些高收入回报也吸引相应人群大量进入这些区域。在经济发展水平较低的地区,劳动力市场对于职业认知技能的要求不高,即使个人有很高的语言能力和量化能力也难以施展。假设4a和假设4b都得到证实。其次,从照料技能与区县变量的交互效应来看,经济发展水平更高的地区照料技能对收入的负向效应会变小(照料技能变量的系数为负,交互项为正),但这一效应仅在0.1的统计水平上显著,假设4c基本得到证实。这可能是因为这些地区的市场对此类职业的需求更大,对此种职业技能有更强的依赖,使得相对于经济欠发达地区照料服务类技能的收入劣势更小一些。但是,这并不意味着在经济发达地区照料服务类职业是优势职业,这一结果仅表明在这些地区照料技能的劣势效应相对降低。此外,从模型中可以看到,职业男性比例与区县变量的交互项是负向的,这说明,与经济欠发达地区相比,职业男性比例的正向效应在一定程度上被削弱,即在经济发展程度更高的地区,“价值性歧视”发挥的作用被削弱,假设4e得到证实。再次,我们看到操作技能在区域经济发展程度高的地区收入的正向效应也被削弱(主效应为正,交互效应为负),这可能是因为在经济发展程度高的地区竞争更激烈,市场上此类职业的供给也更为充分,使得这类职业的优势地位相对于经济欠发达地区有所变小。但是,这并不意味着此类职业就是劣势职业,这个结果仅表明在经济发展程度更高的区域,操作修理类职业的优势效应相对降低。假设4d也得到证实。最后,正如前文所讨论的,我们的分析结果显示工作环境的恶劣程度对于收入回报的效应是负向的。同时,在区域经济发展更高的地区,这一负向效应更为明显(主效应为负,交互效应为负),这可能是因为我们所使用的数据中更多是一些地位较低的职业,在经济发展程度较高的地区竞争更加激烈,从而使得这些职业的劣势影响更大,假设4f没有被证实,对于这部分的结果还需要之后做进一步的探索。我们以上的分析也证实了在中国社会中区域不仅是一个地域符号,也是一种准入门槛和生活机会的获得。尽管我们已经尽可能地控制了相关变量,但仍不能完全排除自我选择的问题,因此,这一结果主要是一种相关关系的讨论。本研究对于现实的就业也具有一定的启示意义:虽然女性在进入强调量化能力/操作技能的职业仍然存在困难,但如果女性能够进入经济发展程度更高的地区的语言能力和照料能力的职业,也能提高她们的收入,这在一定程度上可以扭转女性在收入上的劣势地位。尽管国内之前的研究已经证实了职业是影响性别间收入差距的重要因素,但还缺乏对于职业特征如何影响性别收入差距的具体作用机制的全面分析和探讨。此外,关于职业特征对收入回报的区域异质性问题也少有关注。本研究正是试图弥补这一研究空白。本文使用2010年中国家庭追踪调查的数据,结合“六普”数据并借用美国O*Net数据库构建的一系列职业特征指标,并利用分解的方法全面地检验和分析了职业特征可能会影响收入差距的三个具体的作用机制。第一,研究显示,纳入6个职业特征变量后与纳入193个职业的虚拟变量得到的性别效应基本一致,这表明纳入的6个职业特征变量几乎完全捕捉到了原始职业的分布所导致的性别差异。总体来看,职业特征一共可以解释约17%的性别收入差距,也就是大约五分之一的性别间收入差距,而它的最主要来源是职业内部的性别比例。正像之前研究所指出的,人力资本、职业特征和家庭特征都不能很好地解释这种性别比例的影响,因此,这很可能是由于劳动力市场中存在的“价值性歧视”。雇主普遍将与女性相关的职业和技能视为是贬值的,而最主要的与女性相关的职业技能就是照料服务技能,与之相关的职业,如幼儿园老师、护士等,与这些职业所要求的职业技能和学历相比,普遍有更低的职业报酬。英格兰德等(England and Folbre,1999;England,et al.,2002)将这种现象称为“照料代价”,这类职业之所以存在收入惩罚,可能的原因是:一方面,这类职业本身是以助人为目的,会使雇员得到内在价值的回报,而雇主在雇佣时会选择那些追求内在回报而愿意牺牲高收入的员工;另一方面,这类职业生产的是一种社会层面的公共物品(Coleman,1990),如培养儿童、照料病人等,虽然可以使社会各方受益,但这种效益又不像普通商品那样容易衡量,无法产生可以测量的利润。第二,男性和女性职业技能的差异也是职业性别隔离影响收入差距的一个重要的作用机制。除了上文提到的照料服务技能的影响外,与西方研究结果不同,本研究显示,操作、搬运和修理这类与男性的体力相挂钩的职业技能对于收入差距也有一定贡献。这可能是因为与西方成熟的工业体系不同,中国还处在快速工业化和产业结构转型时期,对体力劳动的要求高。根据第六次全国人口普查数据估算,中国蓝领职业的就业人数占全部劳动力的39.43%,约 2.75亿人,其中,男性1.65亿人,女性1.1亿人,占比比较高。随着中国产业结构的转型和升级,由这部分因素导致的收入差距可能会进一步缩小。第三,工作环境的恶劣程度并没有对性别间的收入差距有影响,正如前文所指出的,这可能与这些职业本身的地位较低有关,另外,也可能与测量工作环境的方式有关,我们也期待日后能通过更好的测量方式对这一问题做更深入的分析和探索。第四,家庭层面的控制变量对本研究也有一定启发。研究显示,家务劳动的时间对收入差距的贡献很高,甚至与职业内部的性别比例相似。这也直接验证了在“男主外,女主内”的社会分工模式下,女性由于要承担更多的家庭责任是性别收入差距的一个重要影响因素。家庭与工作的冲突正是职业女性所面临的生活困境之一。 最后,研究证实了职业技能在不同区域也存在收入回报的异质性,这也是中国的劳动力市场与西方国家的一个显著差异。中国不同区域的经济发展和职业分布存在很大差异,从而影响不同职业特征的回报,进而也可能会影响性别间的收入差距。这对于女性群体寻求就业机会可能会有一定启示。综上所述,本研究表明,职业是影响性别间收入差距的一个分配性机制,而职业内部的性别构成和不同性别间的职业技能的差异是具体的作用路径。本研究加深了关于劳动力市场性别不平等的认识,尤其是验证了不同性别的职业技能会显著影响性别间的收入差距,这在以往的国内相关研究中是一个被忽略的重要部分。如前所述,劳动力市场中的“价值性歧视”可能是导致女性比例高的职业存在收入惩罚和产生“照料代价”的重要原因,因此,有必要推动社会对有关职业的价值重新认识和评估。除此之外,传统的社会分工也可能是造成收入差距的一个重要因素,因此,鼓励男性在育儿和家务方面承担更多的责任,也是减轻劳动力市场上性别不平等的有效手段。当然,本研究仍存在一些局限和可改进之处。一是目前所使用的是截面数据,无法估计不同职业和性别的工资增长轨迹,而工资增长轨迹可能会存在职业和性别差异,从而使得某些职业具有累积优势/劣势,因此,对于动态层面的性别不平等还需要之后做进一步的探索。二是受限于数据,本研究是基于认为同种职业技能在不同职业内部的回报是相同的这一强假设,但不同职业对于不同类型的职业技能的重视和依赖程度存在差异,例如,量化能力在律师职业中并不那么重要,却是数学家最看重的技能。这可能会导致同种职业技能在不同职业中所对应的经济回报也存在一定差异。三是我们目前主要关注职业间的差异,而没有考虑同种职业内部的异质性。尽管已经尽可能地保留了目前中国相关数据中最详细的职业分类,但每种职业内部仍然可能存在更细的职业类别,例如,企业管理人员可能又分为人力资源经理、销售经理等,这些职业小类也可能会在收入上存在一些微小差异。四是本研究使用的测量职业技能和工作环境的变量主要来自美国的数据库,而中国和美国的职业结构和每种职业的职能及工作环境可能存在一些差异,尽管我们已经按照中国的职业结构对数据重新进行了整合,但仍可能会在一定程度上影响测量效度。同时,随着时代的变迁,职业结构和职业技能也可能在发生转变,因此,我们也期待之后中国会有更好的数据来改善这些问题,以期更好地认识中国劳动力市场的性别不平等问题。