查看原文
其他

DID前沿论文推荐 |《中国工业经济》:交错DID及异质性—稳健DID(附代码实现)

最新更新的2023年第1期《中国工业经济》上1篇前沿DID论文:交错DID及异质性—稳健DID

来源:中国工业经济、《网络基础设施建设、信息可得性与企业创新边界


日前查看到更新的2023年第1期《中国工业经济》上涉及一篇前沿DID论文,里面稳健性检验后拓展分析部分用到了交错DID及异质性—稳健估计量(csdid)

背景介绍:

为进一步推进网络基础设施建设,国务院于 2013 年发布《“宽带中国”战略及实施方案》,并 在 2014 年、2015 年和 2016 年先后认定了三批“宽带中国”试点城市。“宽带中国”战略有力推动了 网络基础设施的整体建设和升级。

本文以“宽带中国”战略的推进作为一项准自然实验,检验了 “宽带中国”战略带来的网络基础设施水平的提升对企业拓展创新边界的影响,为本文的研究结论提供了进一步的支撑证据。

数据

考虑到“宽带中国”战略在 2014 年开始才推出第一批试点,而本文所使用的主要数据为截止至 2013 年的中国工业企业数据,因此,与当前大多数使用“宽带中国”战略作为研究内容的文献 相同,本文在此使用的数据为上市公司数据。依照同样的做法,本文将专利数据与上市公司进行 匹配,并识别计算得到上市公司每年申请的新技术领域专利数量。为保证样本间的可比性,本文 剔除了金融业、保险业、房地产业、教育以及零售批发业等行业的样本,并剔除了 ST、*ST、PT 以及数据缺失的企业样本,样本期为 2009-2017 年。

模型构建

为检验“宽带中国”战略对企业拓展创新边界的影响,本文构建如下交错双重差分模型:

变量介绍:

  • 其中,被解释变量 innov 同样表示衡量企业创新的相关指标,在此为企业新技术领域专利数 量加 1 后的对数值
  • broadband 为根据“宽带中国”试点政策构造的指示变量,城市 c 在入选 为试点城市的当年及之后年份取值为 1,否则为 0。
  • 参考已有相关研究,X 为企业和城市层面的控 制变量,与正文相同,既包括人均 GDP、产业结构、交通基础设施水平等城市层面的变量,也包 括企业规模、研发投入占比、股权结构、净资产收益率、资产负债率等表征企业特征的变量。
  • 同 时,本文还控制了省份—年份的交互固定效应以及行业—年份的交互固定效应,以控制来自省份 层面和行业层面的影响因素对结果的干扰。同样,αi 为企业固定效应, λt 为年份固定效应。

为随机误差项。

估计结果为:


结果解释为:

附表 5 第(1)列首先报告了双向固定效应模型的估计结果,估计系数在 5%水平上显著为正, 意味着以“宽带中国”表示的网络基础设施建设显著促进了企业新领域专利数量的增加。

考虑到 处理效应异质性可能导致双向固定效应模型的估计产生潜在偏误,本文进一步根据 Callaway and Sant' Anna(2021)的方法计算了“异质性—稳健”估计量,附表 5 第(2)列报告了以“未受处理组” 为控制组、以所有组所有时期为估计的组别—时期处理效应结果,尽管该方法会在计算过程中丢 失大量样本,但其估计结果显示,平均处理效应仍然显著为正。

Stata复刻代码结果为:


完整命令为:

 reghdfe patent_new did $control , absorb(id year#province year#sic_da) cluster(id)
(dropped 628 singleton observations)
(MWFE estimator converged in 13 iterations)

HDFE Linear regression                            Number of obs   =      7,603
Absorbing 3 HDFE groups                           F(  11,   1603) =       1.84
Statistics robust to heteroskedasticity           Prob > F        =     0.0426
                                                  R-squared       =     0.5847
                                                  Adj R-squared   =     0.4157
                                                  Within R-sq.    =     0.0047
Number of clusters (id)      =      1,604         Root MSE        =     0.7966

                                 (Std. err. adjusted for 1,604 clusters in id)
------------------------------------------------------------------------------
             |               Robust
  patent_new | Coefficient  std. err.      t    P>|t|     [95% conf. interval]
-------------+----------------------------------------------------------------
         did |   .1298855   .0574112     2.26   0.024     .0172766    .2424945
         gdp |  -6.63e-07   8.19e-07    -0.81   0.418    -2.27e-06    9.43e-07
        road |  -.0061418   .0084765    -0.72   0.469    -.0227681    .0104844
    highrail |   .0020894   .0083714     0.25   0.803    -.0143306    .0185094
     airport |  -.1405601   .1627545    -0.86   0.388     -.459794    .1786739
     rdspend |    .004758   .0039467     1.21   0.228    -.0029833    .0124992
   sharehold |   .0666924   .3453499     0.19   0.847    -.6106923    .7440772
         roa |  -.0318536   .0285641    -1.12   0.265    -.0878805    .0241733
    leverage |   .0758731   .1598949     0.47   0.635    -.2377519    .3894981
        size |   .0830696   .0312542     2.66   0.008     .0217663     .144373
       lnage |  -.1029675   .0570214    -1.81   0.071    -.2148119    .0088769
       _cons |   .1044914   .6220923     0.17   0.867    -1.115708    1.324691
------------------------------------------------------------------------------

Absorbed degrees of freedom:
---------------------------------------------------------+
     Absorbed FE | Categories  - Redundant  = Num. Coefs |
-----------------+---------------------------------------|
              id |      1604        1604           0    *|
   year#province |       234           0         234     |
     year#sic_da |       360           9         351     |
---------------------------------------------------------+
* = FE nested within cluster; treated as redundant for DoF computation


. csdid patent_new  $control , ivar(id) time(year) gvar(policy_year) method(dripw) agg(simple)
No never treated observations found. Using Not yet treated data
Panel is not balanced
Will use observations with Pair balanced (observed at t0 and t1)
......xx......xxxxxxxxxx
Difference-in-difference with Multiple Time Periods

                                                         Number of obs = 2,962
Outcome model  : least squares
Treatment model: inverse probability
------------------------------------------------------------------------------
             | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
         ATT |   .3079178   .1794665     1.72   0.086    -.0438302    .6596657
------------------------------------------------------------------------------
Control: Not yet Treated

See Callaway and Sant'Anna (2021) for details


 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存