查看原文
其他

顶刊中的再中心化影响函数(RIFs): RIF回归和RIF分解全解析, 附code, 数据和示例

计量经济圈 计量经济圈 2022-09-03

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

前面引荐过“再中心化影响函数RIF回归和分解的Stata操作程序”,但无论在理论上还是在操作上都较为粗糙,这次给各位学者带来一份极为全面的RIF解析文章,作者还对软件上的操作实现给以了细致讲解。

正文

关于下方文字内容,作者:许婉莹, 中南财经政法大学财政税务学院,通信邮箱:1226278950@qq.com
再中心化影响函数RIF回归和分解的Stata操作程序

Rios-Avila, F. (2020). Recentered influence functions (RIFs) in Stata: RIF regression and RIF decomposition. The Stata Journal, 20(1), 51–94. https://doi.org/10.1177/1536867X20909690

Recentered influence functions (RIFs) are statistical tools popularized by Firpo, Fortin, and Lemieux (2009, Econometrica 77: 953-973) for analyzing unconditional partial effects on quantiles in a regression analysis framework (unconditional quantile regressions).The flexibility and simplicity of these tools have opened the possibility to extend the analysis to other distributional statistics using linear regressions or decomposition approaches. In this article, I introduce one function and two commands to facilitate the use of RIFs in the analysis of outcome distributions: rifvar() is an egen extension used to create RIFs for a large set of distributional statistics, rifhdreg facilitates the estimation of RIF regressions enabling the use of high-dimensional fixed effects, and oaxaca_rif implements Oaxaca-Blinder decomposition analysis(RIF decomposition)

目录

一、摘要

再中心化影响函数(RIF)是由Firpo、Fortin和Lemieux(2009,Econometrica 77:953-973)推广的统计工具,用于分位数无条件部分效应的回归分析框架(无条件分位数回归)。对于使用线性回归或分解路径的分布统计量,这些工具的灵活性和简单性为对其进行拓展分析提供了可能。在本文中,我介绍了一个函数和两个命令,以便将RIFs应用于结果分布的分析:rifvar()是一个egen扩展,用于创建大量分布统计量的RIF,rifhdreg使得在估计RIF回归中可以使用高维固定效应,oaxaca_ rif实现了Oaxaca-Blinder分解分析(RIF分解)。

1.简介

影响函数(IFs)是一种用于分析分布统计、泛函或数据中微小扰动稳健性的统计工具(Cowell和Flachaire,2007),或者是作为估计复杂统计量的渐进方差的简化策略(Cowell和Flachaire 2015;Deville 1999)。最近,Firpo、Fortin和Lemieux(2009)建议使用IFs——特别是再中心化影响函数(RIF),作为分析解释变量X分布变化对Y无条件分布的影响的工具。

Firpo、Fortin和Lemieux(2009)介绍的方法侧重于无条件分位数回归(UQR)的估计,这使得研究人员能够获得解释变量对被解释变量的任何无条件分位数的部分影响。这种方法的最简单版本称为RIF–OLS,由同一作者在社区提供的命令rifreg轻松实现。作为他们结论的一部分,作者强调了这一策略的潜在推广:分析其他分布统计数据以及对于Stata中使用再中心化影响函数(RIF)进行传统Oaxaca-Blinder(OB)分解,以此分析组间结果分布差异。

在最近发表的一篇文章中,Firpo、Fortin和Lemieux(2018)讨论了RIF回归对方差和基尼系数的应用,并强调了RIF应用对OB分解的推广。Borgen(2016)在Firpo、Fortin和Lemieux(2009)工作的基础上,提供了命令xtrifreg,在单一高维固定效应的情况下可对UQR有效估计,但xtrifreg不能用于其他分布统计量。

虽然RIF回归和RIF分解已成为经验文献中重要的分析工具,但提供简化框架使得RIF作为标准分析工具的尝试是有限的。在Stata中,只有社区贡献的命令xtrifreg可以从Stata日志档案中随时获得。rifireg命令也可以从作者的网站上获得,但它仅限于分析与排名相关的指数。启动这一切的命令rifreg仅限于估计RIF统计,并且在统计软件组件档案中不可用,但可以从作者的网站手动访问。此外,虽然RIF和重加权回归(reweighted regressions)广泛应用在不限于均值的统计量,并对其进行OB分解,现有命令只能获得基于多步骤过程的分解。

在本文中,我将介绍一个函数和两个命令,以便于使用RIFs进行回归和分解分析。第一个函数rifvar()是一个与egen配合使用的插件扩展,可用于估计大量分布统计量的RIF,如Firpo、Fortin和Lemieux(2018);Essama Nssah和Lambert(2012);Cowell和Flachaire(2007);Heckley、Gerdtham和Kjellsson(2016)。第一个命令rifhdreg,是regress和reghdfe(Correia 2016)的打包命令,该命令与rifvar()一并用于在高维固定效应和不平等处理效应下估计RIF回归。第二个命令oaxaca rif,是命令oaxaca(Jann 2008)的打包,可用于实现标准和重加权的OB分解(参见Fortin、Lemieux和Firpo[2011]和Firpo、Fortin和Lemieux[2018]),并在Firpo、Fortin和Lemieux(2018)中描述了其多步骤过程。

本文其余部分的结构如下。第2节概述了什么是IFs以及如何对其进行估计。第3节介绍并解释了使用rifvar()来估计RIF变量。第4节描述了rifhdreg在估计标准RIF回归以及估计不平等处理效应方面的使用。第5节描述了oaxaca_rif在使用RIF分解估计标准分解和重加权分解时的使用。第6节对全文进行总结。

2.RIF和分布统计量

2.1分布统计量:基础

在分析社会福利、不平等、贫困或描述相关结果分布特征的其他指标时,有必要获得以下信息之一。最常见的情形是获得在总体或样本中每个观察值相对应的全套值。如果总体或样本大小n有限,则可以将其称为Y=[y1,y2,…,yn],其中yi是第i个人的相关结果(例如收入)。

2.2  IFs 和RIFs估计量:加托导数

向样本中添加一个新个体的思想实验也可以被视为在原始分布中的一种数据污染,式子(1)可以用来估计这种思想实验对统计量v的影响。通过量化 [∆(GY− FY)]分布变化的方法将统计量∆v的变化标准化,由此得到与分布Y从的变化相关的统计量v变化率的量化。


方程式(4)表明,使用的所有值构造的IFs期望值等于0。由于这个性质,(5)意味着RIFs的期望值等于该分布统计量本身。方程(6)和(7)表明,任何统计量的渐近方差都可以通过基于样本数据估计IF或RIF的方差来获得

如(3)所示,在回归分析中选择IFs或RIFs作为因变量是没有影响的,但会在RIF–OLS情况下产生截距的变化。是因为对于一个常数而言,IFs和RIFs是等价的。如(5)所示,使用RIFs的优势在于,在使用简单均值下,可以使用它们来恢复基本分布统计量。该属性有助于解释RIF回归,并实现分解分析。

3.估计RIFs:rifvar()  egen函数

RIFs的估计是一项复杂度跨度很大的任务。一些具有简单数学表达的统计量需要几行代码来定义相应的RIF。最简单的例子是平均值的RIF,因为任何的RIF平均值就是它本身。然而,其他统计数据可能需要许多中间步骤才能正确定义相应的RIF。

社区提供的命令rifreg可用于估计RIF回归并创建相应的RIFs,但它仅限于方差、分位数和基尼系数的分析。如果对分析其他分布统计数据感兴趣,建议使用一个名为rifvar()的新函数。这是一个在命令egen中添加了新功能的插件命令,有助于估计大量分布统计数据的RIF。

该命令的语法如下:

其中,varname是要分析的变量,newvar是存储RIF的新变量名,并给定if、in或两者均有的限制。所有统计数据都可以使用选项by(varname),用于表示将估计的RIF变量(即性别或种族组;而选项weight(varname),用于表示估计RIF的权重。seed(str)则表示特定的随机数种子以复现秩相关指数。

RIF选项允许用户指定使用哪些分布统计数据来获取RIF统计信息。表1提供了目前可用于估算的统计数据的详细列表。在附录B中,我提供了功能模拟汇总来展示RIF标准误差与所有这些统计数据的模拟标准误差的近似程度。

4.RIF回归:rifhdreg

4.1 标准RIF回归

如前文所述,IFs和RIFs是在统计中被用作分析统计量对异常值稳健性的工具,以及从复杂统计量中获得统计推断的方法(Cowell和Flachaire 2015;Deville 1999;Efron 1982;Hampel 1974)。最近由Firpo、Fortin和Lemieux推广使用(2009年);Heckley、Gerdtham和Kjellsson(2016);Essama Nssah和Lambert(2012)是对RIF回归的估计。

Firpo、Fortin和Lemieux(2009)使用此策略估计分布统计量v上自变量X分布的微小变化的无条件局部效应(UPE)。作者使用此策略估计UQRs,使用线性模型作为逼近这些部分效应的最简单方法。RIF回归估计可描述如下。

假设存在联合分布函数=,且用于指定因变量y与所有自变量或外生变量X之间的线性和非线性关系。使用此函数,y的无条件分布的p.d.f.和c.d.f.可以写成:

在线性假设下,Stata中RIF回归的估计可以通过社区提供的命令rifreg(用于基尼、方差和分位数)、xtrifreg(用于具有一个高维固定效应的分位数)或rifireg(用于秩相关变量)来轻松实现。然而,对于其他分布统计数据或者当需要估计两个或更多高维固定效应时的RIF回归估计时,没有相关命令。

为了估计这两种情况下的RIF回归,我引入了命令rifhdreg,它是与使用rifreg中相同的两步过程的打包命令。第一,它使用了前面介绍的rifvar()函数估计特定分布统计的感兴趣样本中每个观测值的相应RIF。第二,它使用RIF作为因变量,并使用Stata官方命令regress(不使用固定效应)或reghdfe(Correia 2016)(使用固定效应)建立线性模型来计算RIF-OLS模型。命令语法如下:

regress和reghdfe命令之间的主要差别在于rifhdreg需要带有rif(RIF_options)特定的分布统计。查看help rifhdreg 了解关于所有选项的描述。

rif(RIF_options)明确了所有相关的统计量,并首先内部估计了相应的RIF。它使用了表1中相同的语法。例如,为了估计分位数间份额比率的RIF回归,可以输入是必要的。

对于在新变量名回归下使用的受限样本,会保存其内部构造的RIF。

如果replace与()一起使用,且指定的newvar已经存在,会替代内部构造的RIF。

abs(varlist)识别要纳入的固定效应。此处列出的每个变量均表示一组固定效应。

当使用abs(varlist)时,rifhdreg调用reghdfe来访问RIF-OLS模型,且reghdfe中的所有选项均可用。否则,它使用regress来访问模型,且允许所有regress选项。

iseed(str)用于创建备用随机变量,以获得秩相关指数的可重复估计量。

scale(real)提供一个值,用于重设因变量比例。它可能对洛伦兹坐标或分位数份额等统计量有用,且这些衡量值介于0和1之间。在此情况下,使用比例(100)会将比例更改为0-100之间。默认值为比例(1)(无重设比例)

默认情况下,rifhdreg报告OLS渐近标准误,但可以请求regress或reghdfe命令中允许的其他标准错误,例如,稳健和聚类标准误。如果不包括固定效应,也可以通过选项svy获得简单的调查设计标准误(survey design standard errors)。

根据Firpo、Fortin和Lemieux(2009)中提供的建议以及附录A中提供的模拟当感兴趣的统计数据是无条件分位数或与无条件分位数相关时,应使用bootstrap标准误,或者至少应要求稳健标准误。其原因是在于无条件分位数的RIF需要密度函数的估计,且密度函数在此作为估计渐近标准误差的已知参数。为了正确估计bootstrap标准误,应该在rifhdreg命令之前使用bootstrap前缀。也可以使用社区提供的命令bs4rw(Kolenikov 2010)估计bootstrap标准误从而实现复杂的测量设计。

为了说明如何使用此命令估计RIF回归,表2提供了所选分布统计量的RIF回归结果。使用网上查询到的瑞士劳动力市场调查摘录。为简单起见,仅使用教育年限、经验年限、工作年限、性别和单身状态作为解释变量。在表底部,平均RIF被报告为UPE解释的参考。此表报告了三种形式的标准错误:默认或OLS标准误、稳健标准误和基于500次重复的bootstrap标准误。将与基尼相关的估计参数比例扩大为100,以便于解释估计系数。所有解释都参考当前的不平等水平,从而使结果在不同的不平等衡量标准之间具有可比性。

正如预期情况,对于所有模型中的大多数解释变量,OLS标准误往往小于稳健标准误。Firpo、Fortin和Lemieux(2009)指出,Bootstrap标准误差最适合于统计推断,但对于涉及分位数统计的回归,其误差要大得多。然而,与RIF模拟的结果一致的是,bootstrap误差与关注基尼系数和对数工资方差的回归的稳健标准误相似。

所有模型的结果都与工资不平等的不同衡量指标的不同见解一致。如果人口的平均受教育年限增加一年,预测的基尼系数将下降0.5%多一点(相对2.32%而言),工资对数的方差将下降12.7%(-0.036/0:2818),最富有的10%人与最贫穷的10%人的工资比率14.2%(-0.86/6.0285)。第90个分位数和第10个分位数之间的对数工资差距和工资比率或许会下降,但这样的变化在统计学上并不显著。增加工作年限似乎可以减少工资不平等,但年龄增加对最高和最低工资分布之间的差距影响较小。对于其他工资分布的统计数据而言并没有观察到这样的情况。

也许对于UPE而言,在解释中最具挑战性的变量类型之一是分类变量。一方面,由于RIF和标准RIF回归旨在估计自变量分布中微小变化的影响,因此不应将分类变量的系数解释为从0到1的变化。否则,该操作意味着分类变量的分布发生了很大变化,从0%的观察值被分类到该组到100%的观察值被分类,这可能会对预测的UPE产生很大偏差。另一方面,根据(15)和(16)式,应将UPE分析为与观察到的无条件平均值的偏差。例如,如果妇女在人口中的比例将增加10%,从目前的47.6%增加到57.6%,那么最富有的10%与最贫穷的10%的工资比例将增加2.3%(1.437/6.0285×0.1),预测基尼系数将增加1.4%(3.502/24.603×0.1).

为了说明rifhdreg命令在多个固定效应情况下估计RIF回归的能力,将表2中的模型重置,包括职业、年龄和单身状态作为固定效应。含稳健标准误和bootstrap标准误的结果如表3 所示。

在本例中,控制年龄和职业的固定效应是对这些变量与因变量之间的所有线性和非线性关系的有效控制。该结果表明,即使是不同的衡量不平等的标准及其他因素保持不变的情况下,平均受教育年限增加一年可能会使不平等增加约2.9%。相反,如果工作年限增加一个单位,不平等程度将下降1.3%至2.7%,这也具体取决于不平等程度。与表2中的结果一致的是,如果样本中的女性比例增加了10个百分点,那么通过分位数间份额比率、基尼系数和对数方差将增加1.4%至3.3%。

4.2 不平等的处理效应:高级选项

如前文所述,标准RIF回归不应用于估计自变量分布的巨大变化,尤其是考虑分类变量的情况。事实上,Essama Nssah和Lambert(2012)强调,RIF回归的主要缺点之一是系数仅提供自变量分布变化影响的局部近似值。

为了克服这一弱点,文献中的其他研究,包括Rothe(2010)、Donald和Hsu(2014)、Firpo和Pinto(2016)以及Firpo、Fortin和Lemieux(2018),提出了估算Firpo和Pinto(2016)所称不平等处理效应的方法。本质上,这些方法使用参数或非参数策略来获得可用于识别反事实分布和识别对分布统计的处理影响的反向概率权重。按照Firpo和Pinto(2016),不平等处理效应的估计描述如下:

使用类似于(22)式的识别,RIF回归估计处理效应的优点在于,可以通过将其作为模型识别中的控制变量,从而直接控制特征分布的差异。此外,如果变量T有两个以上的类别,(22)仍然可以通过使用T中的所有类别构建的RIF进行估计,与T相关的系数可以解释为处理效应,而其他变量的系数可以解释为其他由T决定分布的UPE。

命令rifhdreg提供了三个高级选项,可以用于估计上述模型中的不平等处理效应。

第一个选项是over(varname)它用于指定RIF估计的变量,就像rifvar()函数中使用的选项by()一样。例如,如果使用命令,其中T是一个分类变量,则该命令将首先估计由T定义的所有组的y的第10个分位数RIF,并将其用作回归模型中的因变量。当over(varname)中使用的变量为二项式时,回归也可以被视为代替OB分解的OLS。

rwlogit(varlist)和rwprobit(varlist)是指定用logit或probit模型估计重加权因子的选项,并使用over()中指定的变量作为因变量。如Firpo和Pinto(2016)所述,这些选项可用于在外生性假设下,使用基于(22)的加权最小二乘法估计分布处理效应。使用这些选项时,用户还应指定要估计的处理效应类型。选项包括平均处理效应、(默认);处理后的处理效应,;未处理的处理效应。使用此选项时,将在名称下创建一个新变量,其中包含估计值 。将rwlogit( )或rwprobit( )与模型中包含的自变量相结合,可以与处理效应的逆概率加权回归调整估计量进行比较。

此处提供一个使用高级选项估计不平等处理效应的示例,表4(下文)提供了与表2相同模型下估计的总体处理效应,但其相应的RIF是在女性处理变量上计算的。使用了四种规格:i)无控制,ii)无控制,但使用了重加权调整(IPW),iii)如表2所示添加控制,但没有重加权调整,iv)同时添加控制和重加权调整。使用probit模型估计处理的条件概率,且该模型使用与结果模型相同的变量。

表4中的第一列展示了在不使用任何控制变量情况下的总体处理效应估计。这些估计结果说明了男女之间的原始分布差距,且很可能为处理效应带来有偏估计。总的来说,这一结果表明,女性平均工资低17.4%,在第10个分位数的差距较大(24.8%),但第90个分位数的差距较小(13.9%)。这一列还表明,女性之间的工资不平等程度略高。

第二列、第三列和第四列以不同方式控制特征差异,表明在平均数和第十和第九十个分位数处的性别负向处理效应小于原始差距(尽管该差距很小)。在不平等方面,控制其他特征后的结果表明,性别处理效应增加的不平等不会像原始性别差距所显示的那么多。这三种控制特征差异的方法提供了类似的结果,而在基尼系数和分位数间比率上观察到的处理效应差异最大。

5.RIF分解:oaxaca_rif

如前所述,第4.1节中所描述标准RIF回归的主要优点之一在于,可以很容易地将用于它们分析独立特征分布的微小变化如何影响分布统计量v。此外,第4.2节中描述的修正RIF回归也可以用于估计外生处理引起的不平等处理效应。

然而,人们通常有去兴趣分析是什么因素导致了两组之间的分布差异。OB分解是劳动经济学中使用最广泛的方法之一,旨在分析两组之间的结果差异(Blinder 1973;Oaxaca 1973)。这些差异被描述为特征差异(成分效应)和与这些特征相关的系数差异(工资结构效应)的函数。

虽然最初的方法是为了分析平均结果的差异,但随后的几篇文章提供了扩展和补充,以将分析扩展到其他分布统计量(参见Fortin、Lemieux和Firpo[2011]的综述)。此外,在条件独立性(无约束)和重叠支持的假设下,总体结构效应可以被识别和解释为处理效应。

Fortin、Firpo和Lemieux(2018)结合重加权策略(DiNardo、 Fortin和Lemieux 1996)描述了RIF回归,并作为一种分解不限于平均值的分布统计量差异的方法。该方法被称为RIF分解。与文献中的其他策略相比,该方法有三个优点:实施简单,获得单个协变量对总体分解的具体贡献,以及将分析扩展到任何可以定义RIF的统计量。该策略可以描述如下。

在Stata中实现OB分解很简单。用于此类分析的常用命令是oaxaca(Jann 2008),该命令可用于分析组间的平均差异且实现许多拓展。通过详细计算条件分布的RIF并使用Oaxaca命令将其用作因变量,可以很容易地将OB分解分析扩展到均值以外的统计量。然而,目前还没有实施RIF分解估计和混合重加权RIF分解的正式方法。

为了估计这两种类型的分解,我提出了oaxaca_rif命令,它是oaxaca的打包命令,使用Firpo、Fortin和Lemieux(2018)中建议的过程来估计标准rif分解[如(24)]或混合重加权分解(25)。

命令语法如下:

与rifhdreg命令并行,oaxaca rif需要rif(rif选项)选项来确定用于分解分析需要分布统计信息。它在内部调用rifvar()来估计由by()定义的每组的RIF,并遵循(24)或(25)来识别反事实并实现所需的分解by()。

oaxaca rif的内部语法允许使用oaxaca中适合RIF分解估计的多种可用特征。这些选项包括relax(当某些变量显示某个结果模型没有变化时)和noisily(显示中间结果模型时)。与oaxaca命令相反,当使用noisly时,结果模型的系数存储为 e()中的矩阵。选项normalize()和语法( [name]:varlist)的总体子集也是可用的。

swap要求按相反的顺序估计差距(第2组-第1组)。默认情况是用分组变量中最低值组观察值减去最高值组的来估计的观察值之间的分布统计差距(第1组-第2组)。

wgt(#)定义了反事实分布。默认值为wgt(0),并根据(24)识别其分解。使用wgt(1)而不是作为反事实。非0或1以外的值不可使用。

scale(real)提供了重新校准因变量的值。它可能对介于0和1之间统计量,如洛伦兹序数或分位数份额等统计量有用。默认值为 scale(1)(无重新校准)。

对于标准误差,默认情况是报告稳健的标准错误,相当于在oaxaca命令中使用稳健选项。当要求重加权分解时,该命令报告聚类在个体级别的稳健标准错误。这样做是因为对于其中一个内部估计的分解[见(25)],两组使用了相同的样本。选项cluster(varname)代表个体聚类选项。当使用稳健或聚集标准误差时可使用权重。

retain(newvar)将内部生成的RIF存储到新变量中,或者使用replace替换现有变量。对于重加权分解,retain()不会为反事实选项生成RIF。

与RIF回归的局限性类似,模型样本中包含的线性项仅解释平均特征的差异。如(17)所示,可以通过在模型识别中添加来控制特征分散的差异。或者,可以使用选项s2var(varlist)计算所列变量的中心化二次项,并将其添加到结果模型中。这可以减少控制其他方面的自变量分布导致的模型设定偏误,从而产生的误差问题。这是估计重加权RIF分解时的首选方法。

rwlogit(varlist)和rwprobit(varlist)是用于使用logit或probit模型指定重加权因子估计的选项。当使用其中一个选项时,oaxaca _rif会估计重加权的RIF分解。

对于重加权的标准分解,oaxaca _rif首先使用概率模型,然后估计重加权因子,然后获得针对三种情况的RIF。分解结果可以从两个单独的分解中获得,以识别(26)中详述的四个部分。

选项rwlogit(varlist)或rwprobit(varlist)中包含的变量与主模型识别中使用的变量可能相同,也可能不同。虽然因子符号不能作为结果模型设定的一部分,但允许用于概率模型设定。为估计条件概率添加高阶多项式和交互项将提高重加权策略的质量,从而提高反事实情况下的平衡,但可能会产生过度匹配和违反交叠假设的问题。

如RIF回归的情况所示,渐近和稳健的标准误差可能不适用于分位数或阿特金森指数相关统计量的分解。此外,因为重加权因子是用于估计变量,分解因子的标准误则需要调整。考虑到在RIF分解框架中估计渐近标准误的复杂性,建议的替代方法是在整个过程中使用bootstrap标准误,可以使用bootstrap 前缀获得。bootstrap标准误不能与权重结合使用,但可以使用命令bs4rw来说明权重和调查设计

为了举例说明,我在表5中给出了一个简单的操作,使用类似的工资不平等的五种度量作为RIF回归的例子来分析性别差异。且仅显示重加权RIF分解的结果。使用与结果模型相同的识别,将logit概率模型用于估计重加权因子。

总的来说,所有模型都表明,与男性相比,女性之间的不平等程度更高,且比男性高11.5%-48%。四分位比率的差距最小,但工资的四分位份额比率的差距最大。从工资分布来看(四分位数份额比率和对数工资方差),控制教育年限、任期和经验分布的差异会略微减少近一半的工资不平等,但在分位数范围和分位数比率上有边际递增的影响。

四分位数份额比模型的识别误差很小,但在统计学上有显著意义,这表明更高阶的多项式应包含在内以减少样本偏差。重加权误差表明重加权结果良好,因为数值小且在模型中统计不显著(除分位数份额比率模型之外,对该模型而言经验年限的差异对模型仍然很重要。)

详细的分解结果表明,由于教育水平、经验和工作年限较低(改进这些特征似乎可以减少工资不平等),女性经历了更大的工资不平等。工资结构效应对不平等也有负面阐释,因为女性受教育程度、经验和工作年限不的平等减少效应相比男人而言更小。

与RIF回归的结果类似,稳健标准误差往往小于bootstrap标准误,尤其是与分位数相关的统计量(见表4第1-3列)。由于重加权过程的两步特征,仍建议使用bootstrap标准误。

6.结论

IFs和RIF是重要的统计工具,可用于分析统计量对异常值的稳健性,并获得其他复杂分布统计量的渐近标准误差(Cowell和Flachaire 2007;Deville 1999)。Firpo、Fortin和Lemieux(2009)对此文献进行了扩展,提出在回归和分解分析的背景下使用RIF。这是一种简单的策略,可以分析任何可以获得RIF分布统计上的无条件部分效应。

本文修正了IF和RIF背后的直觉,简要讨论了它们可用于回归和分解分析的设置。为了推进这些策略的实施,并使RIFs成为应用计量经济学家易于使用的工具,我引入了一个函数和两个新命令:rifvar(),用于估计大量分布统计量的RIFs;rifhdreg,用于估计RIF回归和不平等处理效应;和oaxaca _rif,用于估计标准和重加权OB分解,且不限于平均值等统计量。


关于因果推断书籍,参看:1.一本最新因果推断书籍, 包括了机器学习因果推断方法, 学习主流和前沿方法,2.社会经济政策的评估计量经济学, 提供书籍和数据和程序文件,3.诺奖得主Angrist的因果推断课程文献读物单子再次更新了, 还提供了其他三门课程,4.全面且前沿的因果推断课程, 提供视频, 课件, 书籍和经典文献,5.从网页上直接复制代码的因果推断书籍出现了, 学会主流方法成效极快,6.推荐书籍"用R软件做应用因果分析", 有需要的学者可以自行下载!7.哪本因果推断书籍最好?我们给你整理好了这个书单!8.“不一样”的因果推断书籍, 很多观点让我们能恍然大悟, 涵盖了不少其他书里没有的因果推断方法!9.搞懂因果推断中内生性问题解决方法必读的书籍和文献已搜集好!10.一位“诗人”教授写了本因果推断书籍, 现在可以直接下载PDF参看!11.使用R软件学习计量经济学方法三本书籍推荐,12.机器学习与Econometrics的书籍推荐, 值得拥有的经典,13.史上最全的因果识别经典前沿书籍, 仅此一份,14.用R语言做Econometrics的书籍推荐, 值得拥有的经典,15.Stata学习的书籍和材料大放送, 以火力全开的势头,16.USA经管商博士最狂热崇拜的计量书籍震撼出炉,17.推荐使用Python语言做因果推断前沿方法的书籍,18.哈佛教授因果推断经典之作推荐!通过数据,代码和示例手把手教你!

下这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

3.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存