查看原文
其他

TOP5被质疑用log(1+x)数据转换, 固定效应, 双重差分事件图, 结论不可靠!

计量经济圈 计量经济圈 2023-10-21

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

2016年Nicholas Bloom等在TOP5刊RES上发表了题为《Trade Induced Technical Change? The Impact of Chinese Imports on Innovation, IT and Productivity》的论文。该文讲的是来自中国的进口竞争促使欧洲专利申请、IT采用和全要素生产率(TFP)在20世纪90年代末到21世纪初增长了多达30%。

因为这篇文章与Autor等(2021)得出的结论竟然相反,从而在学术界产生了很大的影响(😄,实际情况未必),也就引起了Douglas L Campbell, Karsten Mau极大兴趣去复现文章的结果。

最后,他们也在RES上发表评论公开质疑该文存在编码错误、回归式子设置存疑等相关问题。他们认为这篇文章显著为正的结果是错误的,相反,他们通过正确编码,并设定正确的回归式子后发现结果显著为负数或不显著。

关于Nicholas Bloom,我们都比较熟悉,参看:1.火了! 携程网梁建章Top5上的文章在COVID-19期间火遍欧美学术界! 2.前沿: 携程梁建章又用自己公司做大型随机实验写文章了! 数据和结论真香!3.携程梁建章的QJE合作者自己打脸了!在家工作于我简直就是一场灾难!4.中国经济政策不确定性指数, 你必须了解它,5.AER重磅: 好ideas越来越难找到吗? 回应任正非教育和创新忧思!

下面是他们在RES上的具体评论。

总结成一小段话

Bloom等(2016)发现,来自中国的进口竞争促使欧洲专利申请、IT采用和全要素生产率(TFP)在20世纪90年代末到21世纪初增长了多达30%。我们发现其结果中一个重要的稳健性检验存在几个编码错误(coding errors)。纠正后,结果显示来自中国的进口竞争与欧洲专利之间不存在统计学意义上的关系。原文中的其他回归使用了有问题的log(1+patents)转换。鉴于来自中国进口竞争行业的欧洲企业平均专利数量较低且整个样本中的专利数量迅速下降,这种数据转换会导致偏差。

具体一点

在过去30年的经济历史中,发达市场经济体中中国进口竞争的崛起是一件变革性的事件。一个重要的问题是这一事件对发达市场经济体创新产生了什么影响。在一项有影响力的贡献中,Bloom等(2016,以下简称BDvR)发现,在20世纪90年代末到21世纪初,中国在欧洲的进口竞争刺激了欧洲专利申请、IT和TFP增长多达30%。这是一个引人注目的结果,与Autor等(2021)的发现相矛盾,他们发现来自中国的进口竞争对美国专利产生了负面影响。
不过,我们发现,BDvR在他们的表7中对专利进行稳健性检验时,使用了负二项回归,但在编码中犯了几个错误。纠正后,发现中国的进口竞争要么减少了欧洲的专利申请,要么对欧洲的专利申请没有显著影响。BDvR的研究设计是一个直观的双重差分DID策略,比较了在中国加入世界贸易组织(WTO)前后,欧洲企业(在更多或更少地)暴露于来自中国的进口竞争的行业中持有的各种专利情况。由于有许多企业的专利数量为零,因此在他们文章大部分内容中,BDvR通过专利+1然后取对数做差分(例如Δlog(1+patents))来对专利变量进行转换。但,这种解决方式通常是有问题的,在本文这种情况下尤其如此。因为,变量X加一个小的正常数对较小的值影响更大,而在来自中国的进口竞争行业中的欧洲企业一开始就拥有相对较少的专利。此外,在他们的数据中,所有行业的专利都趋于零,这为初始专利较少的企业创造了专利增长的向上偏差。
尽管BDvR还使用负二项回归进行了稳健性检验,以估计包括频繁零观测值在内的计数数据模型,此时不需要对变量进行log转换。然而,在实施过程中,他们还是犯了几个编码错误,例如继续通过专利加1来标准化专利变量,并控制了与他们论文中描述不相同的各种固定效应。当我们使用实际专利数据而不进行转换来估计模型时,却发现中国的进口竞争与欧洲专利之间没有相关性。当还包括他们使用的固定效应时,我们发现两者竟然呈现显著的负向关系。
2.THE BDVR PATENT DATA
我们使用 BDvR 的数据。12 个欧洲国家的企业级变量主要来自 Bureau Van Dijk 的 Amadeus,然后使用Pierce 和 Schott(2012 年)的标准行业分类 (SIC) 命名法的 4 位数级别与联合国商品贸易数据库贸易数据相匹配。其他部门级变量来自欧盟统计局的 Prodcom数据库。
2.1. Difference-in-difference diagram
图1为 BDvR 使用的两个主要数据样本(基准样本和更长的样本)展示了一个标准的双重差分事件研究图。BDvR使用中国加入WTO 时欧洲取消纺织品配额作为进口竞争的代理变量或工具变量。我们比较了在取消配额之前对中国进口配额最具约束力的纺织部门(也自然是取消配额后对中国进口增加最多的部门)与不受配额约束的部门(也自然是是取消配额影响较小的部门)差异。
在图 1(a) 中,可以看出处理组与对照组的专利收敛于零。出现这种专利下降趋势的原因是每项专利都是按申请年份计算的,而在以后的几年中,这些专利在收集数据时可能仍处于未决状态。此外,来自中国进口竞争组的初始专利较低,这意味着通过专利+1的数据转换带来的偏差更大。更何况,处理组与对照组之间的政策前趋势(pre-trend)也存在差异。

BDvR使用长面板显示,在控制了部门和公司层面的时间趋势后是结果依然稳健的。然而,图 1(b) 中出现了相同的递减情况,从中可以看出,来自中国的进口竞争行业(红线)的专利也趋向于零。从 2000 年到 2005 年,来自中国的进口竞争组与非竞争组的初始百分比下降是相同的。

2.2. Implications of normalizing patents

如果处理组和对照组的专利百分比下降相似,为什么 BDvR 会发现来自中国的进口竞争会产生巨大且显著的影响?原因是他们的结果有偏差,部分原因是:(1)(专利+1)的标准化数据转换,(2)来自中国的进口竞争和非竞争部门的专利水平不同,以及(3)专利数据的逐年减少。每家公司的平均专利绝对数量少加剧了这种偏差。为了修正观点,在表1的A组中,我们显示在基准样本中,从 2000 年到 2005 年,在与中国竞争最激烈的行业中,每家欧洲公司的平均专利数量下降了 94%,而在与中国接触较少的行业中,欧洲公司的平均专利数量也下降了 94%。然而,如果首先通过专利+1来标准化专利变量,然后计算百分比变化,我们得出与中国进口竞争的欧洲公司专利下降了 39%,而其他不予中国进口竞争的欧洲公司专利下降了 63%。这种差异是对专利数据标准化和与中国进口相竞争的企业初始专利水平较低的结果。在表 1 的B组中,我们看到随着年份专利数量逐渐减少的情况也会在较长的样本中引起偏差。

3.NEGATIVE BINOMIAL PANEL REGRESSIONS

鉴于对专利+1的标准化操作的担忧,BDvR 的负二项式回归成为关键的稳健性检验。遵循专利文献中的实证基础模型(Hausman 等,1984 ),BDvR 采用以下负二项式面板回归形式:

然而,当实施这个回归时,他们在三个方面偏离了文中描述的模型:(1)他们继续使用专利+1作为他们的因变量;(2) 他们将 country*year 交互式固定效应替换为单独的 year 和 country dummy;(3) 他们包括了四位数的SIC固定效应。实际上,BDvR 没有提到这些固定效应已被包括在内,在本文的其他任何地方都没有出现;如果 BDvR 声称他们已经控制了公司层面的固定效应,那么这些固定效应应该是不必要的。
我们一一纠正这些错误。

在表 2 的第(1)列中,我们复现了BDvR 表 7第 (3) 列的结果,估计负二项式回归。该回归无意中使用专利+1作为因变量,并且还包含与其论文中描述不同的固定效应。在第 (2) 列中,我们使用实际专利数量(而不是专利+1)运行相同的回归,却得到了一个负的但微不足道的中国进口系数。当还包括 country*year交互固定效应时,符号翻转但在统计上仍然不显著。在第 (4) 列中,当我们排除4位SIC固定效应时,发现中国进口与专利之间存在显著的负相关关系。总之,我们发现来自中国的进口竞争与欧洲公司专利之间的正相关关系并不稳健。

4.CONCLUSION
BDvR 发现,在 1996 年至 2005 年期间,来自中国的进口竞争可能导致欧洲专利呈现30%的戏剧性增长。然而,我们在一项重要的稳健性检查中发现了几个编码错误,如果修复这些错误,其结果就会变得微不足道,甚至表明中国竞争与专利之间存在负相关关系。我们表明,专利(在他们的数据中)的下降对于来自中国的进口竞争和非竞争部门两者来说是相似的。本文发现 BDvR 的结果是其专利+1的标准化操作、来自中国进口竞争的行业专利水平相对较低以及专利数据逐渐减少的产物。得出的结论是,经常被引用的来自中国的进口竞争促进欧洲创新的发现并不可靠。更多侧重于改进方法和扩展专利数据系列的研究将会有所帮助。

作者肯定重视这种公开质疑,所以马不停蹄地作出回应,发表在RES上。承认尽管控制变量改变会影响回归系数和大小,但其结果仍然是稳健的。

在Bloom等(2016 )的文章中,有一组关于来自中国贸易的影响的九个结果。前三项表明,中国的贸易促进了欧洲企业以专利、生产力和信息技术 (IT) 的采用来衡量的技术变革。最后六项表明,来自中国的贸易也导致了资源重新配置给技术更先进的欧洲公司:那些拥有更多专利、更高生产力和 IT 采用率的公司增长更快,退出率更低。Campbell 和 Mau(2020,“CM”)认为,其中一个结果,即来自中国的进口竞争对欧洲公司专利申请的影响的结果,极易受到回归方程设定的影响。本文重点关注CM对我们计数数据模型的批评——在较长的回复中讨论了CM的其他方面。

里面就是回应具体内容,附上原文:

在 BDVR 中,我们认为中国的进口竞争在 2000 年至 2007 年期间对欧洲公司的技术升级起到了积极作用。这一结论基于许多基本的实证结果,表明中国的竞争将资源重新分配给欧洲高科技公司。CM认为中国的进口竞争对欧洲公司专利影响绝对回归方程选择极为敏感。的确,改变控制变量(例如,固定效应)会导致系数符号和大小的不同结果。与CM交锋的一个有用方面,是在几个维度,尤其是计数数据模型上进一步探索回归结果。尽管如此,当进行适当的更正时,我们原始论文的总体发现仍然稳健。

*原文以及评论文章的代码可以在计量社群直接下载。


就双重差分方法DID最新进展,之前推荐过系列文章,还有各种代码学习(计量经济圈公众号搜索功能及操作流程演示),例如:1.微软首席: 最全面的DID方法及最新进展, 示例, 代码和Slides全面开放,2.再分享几篇多期DID相关的文章及其操作代码和数据!3.前沿: 9份各种DID方法最新进展“阅读小组”Slides分享,4.分享: 交叠DID简明使用教程, 降低学者DID的学习成本!5.DID相关前沿问题“政策交错执行+堆叠DID+事件研究”, 附完整slides,6.最新Sun和Abraham(2020)和TWFE估计多期或交错DID并绘图展示结果!详细解读code!7.前沿双重差分DID进展的中文综述文章, 看了这篇可以省去看TOP英文文章了!8.前沿, 模糊双重差分法FDID方法介绍和示例, 附code和数据!9.面板数据政策评估方法(DID等)的最新进展与相关应用, 包括机器学习和因子估计法,10.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,11.将一般DID估计推广到多期干预前和干预后时期的政策效应, 附code和数据!12.前沿, 合成双重差分法SDID方法介绍和示例, 附code和数据!13.要想追赶上DID的最新发展, 你最好阅读一下下面这8篇文章!14.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习,15.国际上关注度和使用率最高的计量方法排行榜新鲜出炉!16.典范! 这篇AER在一图表里用了所有DID最新进展方法, 审稿人直接服了!

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

4年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存