查看原文
其他

2023年第3期《中国工业经济》用到模糊DID-fuzzydid分析的论文

推荐一篇2023年第3期最新用到异质处理效应模糊DID-fuzzydid分析的论文

来源:《中国工业经济》

文章题目:城市群人口集聚促进域内企业创新吗

作者:蔡庆丰,王仕捷,刘 昊,舒少文


城市群人口集聚促进域内企业创新吗

[摘要]人口和产业集聚带来的规模经济有利于区域经济增长,但跨行政区划的城市群人口集聚能否促进域内企业的创新活动仍有待检验。本文利用2007—2019年的上市公司样本,结合专利申请数据,在构建相关城市群人口集聚指标的基础上,对其创新效应进行实证检验和分析。研究发现,不同于城市自身发展所产生的集聚效应,跨区域城市群人口集聚有利于域内企业创新,并且在中西部地区、市场化程度较低地区促进作用更加明显,表明城市群人口集聚能够弥补本地市场发展条件的不足,对于区域经济协调发展有重要意义。机制分析表明,城市群人口集聚有利于城市在更大空间范围内的知识交流;区域一体化程度的提升能够有效降低要素流动壁垒,促进资源的跨区域优化配置;不同城市间的分工深化也能够进一步提升资源利用效率,推动企业创新。本文研究为更好发挥城市群的创新要素集聚和创新活动聚集、推动城市群协调发展以及创新驱动发展战略提供了相关经验证据和政策建议。

[关键词]城市群;人口集聚;企业创新;要素流动;知识交流 模型方法:DID模型


主要命令:reghdfe

稳健性检验方法:

  • 变换自变量测度等
  • 异质性处理效应分析
  • 内生性处理:
  • PSM
  • 因变量前置1期
  • 工具变量检验,使用命令:regress、ivreg2

异质性分析


模糊DID操作与应用


fuzzydid命令与Stata 13.1及以后的版本兼容。如果这个命令尚未安装,必须键入ssc install fuzzydid进行下载安装。

1、命令简介

语法格式为:


fuzzydid Y G T D [if] [in] [, did tc cic lqte newcateg(numlist) numerator partial nose cluster(varname) breps(#) ///
eqtest continuous(varlist)   ///
qualitative(varlist) modelx(reg1 reg2 reg3) sieves sieveorder(#) tagobs ]

在模糊DID设计中,fuzzydid计算局部平均和分位数处理效果的估计值。它还计算它们的标准误差和置信区间。

选项介绍

  • Y是结果变量;
  • G是分组组变量s;
  • T是时间段变量;
  • D是处理变量。它可以是任何有序变量。
  • Option选项介绍:
  • did计算Wald-DID估计量
  • tc计算Wald-TC估计量
  • cic计算Wald-CIC估计量。这个选项只能在没有包含协变量的情况下指定。
  • lqte计算lqte,对于5%、10%、…,95%。此选项只能在D、G和T为指定01变量时,没有协变量包括在估计中。
  • 必须指定上面四个选项中的至少一个。如果指定了其中的几个选项,该命令将计算用户请求的所有估计量。
  • newcateg(numlist)在估计Wald-TC和Wald-CIC时,将处理的一些值组合在一起。
  • numerator只计算Wald-DID、Wald-TC和Wald-CIC估计量的分子。
  • partial计算局部平均处理效果的界限。这个选项只能在没有包含协变量的情况下指定。
  • nose只计算估计值,而不计算它们的标准误差。
  • cluster(varname) computes the standard errors of the estimators using a block bootstrap at the varname level. Only one clustering variable is allowed.
  • breps(#)指定引导复制的bootstrap数量。默认值是50。
  • 当用户指定至少两个did、tc和cic选项时,eqtest在estimands之间执行相等测试。
  • tagobs创建了一个名为tagobs的新变量,它标识fuzzydid使用的观察结果。

2、操作应用

为了说明fuzzydid的使用,我们使用了与Gentzkow等人(2011)相同的数据集来研究报纸对选举参与的影响。

turnout dailies 1868-1928.dta是一个县级数据集。它包含变量有 interest, pres turnout 和 numdailies,分别代表从1868年到1928年美国每个县和每一次选举的投票率(Y)和可用报纸数量(D)。首先,我们加载数据集并给出摘要统计,代码为:

use "C:\ado\plus\f\turnout_dailies_1868-1928.dta"
sum pres_turnout numdailies

结果为:

. sum pres_turnout numdailies

    Variable |        Obs        Mean    Std. dev.       Min        Max
-------------+---------------------------------------------------------
pres_turnout |     16,872      .65014    .2210102   .0017981      2.518
  numdailies |     16,872    1.463134    2.210448          0         45



1868年至1928年总统大选的平均投票率为65.01%。报纸的数量从0到45份不等,平均为1.46份。 

代码为:

gen G1872=(fd_numdailies>0) if (year==1872)&fd_numdailies!=.&fd_numdailies>=0& sample==1
sort cnty90 year
replace G1872=G1872[_n+1] if cnty90==cnty90[_n+1]&year==1868
fuzzydid pres_turnout G1872 year numdailies, did tc cic newcateg(0 1 2 45) breps(200) cluster(cnty90)

结果为:

 gen G1872=(fd_numdailies>0) if (year==1872)&fd_numdailies!=.&fd_numdailies>=0& sample==1
(16,160 missing values generated)


. sort cnty90 year


. replace G1872=G1872[_n+1] if cnty90==cnty90[_n+1]&year==1868
(712 real changes made)


. fuzzydid pres_turnout G1872 year numdailies, did tc cic newcateg(0 1 2 45) breps(200) cluster(cnty90)
(running estim_wrapper on estimation sample)

Bootstrap replications (200)
----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
..................................................    50
..................................................   100
..................................................   150
..................................................   200

Estimator(s) of the local average treatment effect with bootstrapped standard errors.  Cluster variable: cnty90.
Number of observations:  1424 .

             |      LATE    Std_Err          t    p_value   lower_ic   upper_ic 
-------------+------------------------------------------------------------------
       W_DID |  .0047699   .0160903   .2964428    .766892  -.0230387   .0377381 
        W_TC |  .0266618   .0164816   1.617671   .1057335  -.0021458   .0586236 
       W_CIC |  .0133223   .0132744   1.003613   .3155653  -.0116416   .0348834 




输出表的列分别显示每个估计量的值、它的标准误差、t统计量、p值以及它的95%置信区间的上下限。所有的点估计值都是正的,但没有一个具有统计意义,可能是因为这个具有两个时间段的受限样本比较小。

操作应用:

.  fuzzydid pres_turnout G1872 year numdailies, did tc cic newcateg(0 1 2 45) breps(200) cluster(cnty90)
(running estim_wrapper on estimation sample)

Bootstrap replications (200)
----+--- 1 ---+--- 2 ---+--- 3 ---+--- 4 ---+--- 5 
..................................................    50
..................................................   100
..................................................   150
..................................................   200

Estimator(s) of the local average treatment effect with bootstrapped standard errors.  Cluster variable: cnty90.
Number of observations:  1424 .

             |      LATE    Std_Err          t    p_value   lower_ic   upper_ic 
-------------+------------------------------------------------------------------
       W_DID |  .0047699   .0160903   .2964428    .766892  -.0230387   .0377381 
        W_TC |  .0266618   .0164816   1.617671   .1057335  -.0021458   .0586236 
       W_CIC |  .0133223   .0132744   1.003613   .3155653  -.0116416   .0348834 



 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存