Stata：非线性模型的中介效应检验-khb

Original 连享会连享会 2023-10-24

收录于合集 #因果推断 468个

👇 连享会 · 推文导航 | www.lianxh.cn

🍎 Stata：Stata基础 | Stata绘图 | Stata程序 | Stata新命令
📘 论文：数据处理 | 结果输出 | 论文写作 | 数据分享
💹 计量：回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归
⛳ 专题：SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析
🔃 因果：DID | RDD | 因果推断 | 合成控制法 | PSM-Matching
🔨 工具：工具软件 | Markdown | Python-R-Stata
🎧 课程：公开课-直播 | 计量专题 | 关于连享会

连享会课程 · 2023 暑期班

作者：陈炜 (中山大学)
邮箱：1139457876@qq.com

温馨提示： 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码，直达原文：

1. 中介效应的研究

1.1 什么是中介效应
1.2 中介效应的一般检验方式 (常见的线性模型)
1.3 中介效应的特殊检验方式 (非线性模型)

2. KHB 方法原理

2.1 常规方法对于连续变量
2.2 常规方法对于非连续变量
2.3 KHB 方法对于上述问题的解答

3. KHB 方法代码及实操

3.1 KHB 命令介绍
3.2 KHB 法数据实操

4. KHB 方法总结
5. 参考文献及资料
6. 相关推文

1. 中介效应的研究

1.1 什么是中介效应

在进行研究的过程中，有时自变量对因变量的影响并不那么直接，可能对一部分作用是通过先对产生影响，再对产生影响。也就是说不仅自身会对产生直接的影响，也可能同时找一个“中间人”来影响。这个“中间人”就是中介变量，影响再影响的这个过程就是中介效应。

1.2 中介效应的一般检验方式 (常见的线性模型)

国内学者在研究中介效应的时候往往会参考温忠麟和叶宝娟在 2014 年写的《中介效应分析:方法和模型发展》一文，该文章提出了逐步回归法、系数乘积法 (Sobel 检验)、差异系数法、Bootstrapping 检验法四种中介效应检验方法。文章自身引用量也破万，成为中介效应学习与研究的重要参考。

我们对一般的连续变量进行中介效应的分析是检验假设或者 ( 对的总影响可以由直接效应与间接效应 () 得到，所以此时 )。

1.3 中介效应的特殊检验方式 (非线性模型)

上述的方法对一般连续变量是有效的。但是如果因变量是分类或者等级变量等非连续变量，而自变量是连续变量，应该用 Logistic 回归代替通常的线性回归，回归系数的尺度也将由连续变量量尺转换为 Logit 量尺。

但是，这样一来，中介变量对的回归系数 (连续变量的量尺)，与对与的回归系数 (Logit 量尺) 不在相同的尺度上，不同方程得到的回归系数只有量尺相同才具有可比性，，中介效应大小不等于 ，导致上面检验或是的简单方式不再适用。

对于这样的模型，目前学者已提出多个解决方法：

通过标准化 (standardization) 转换实现回归系数的等量尺化 (Winship and Mare，1984；Long，1997；MacKinnon，2008；MacKinnon, Lockwood et al.，2007)；
平均偏效应 (average partial effect)，它反映某一自变量在其均值附近发生微小变动时，对因变量成功发生概率 (而非几率) 带来的边际影响，各子样本的平均偏效应不容易受到误差方差变异的干扰 (Wooldridge，2002；Cramer，2007)；
二元响应模型 (binary response model) 的分解 (Erikson et al.，2005)。

除上述方法之外，还有学者提出 KHB 方法，即本文介绍重点。KHB 方法与上述方法相比往往有相同或者更好的结果 (这里的结果是指在多大程度上调节和之间的关系) 。而且更重要的是通过简单直观的计算，分离了离散变量和连续变量的影响，将线性模型的可分解性拓展到了非线性概率模型。

2. KHB 方法原理

在这一部分，为了更好的理解 KHB 方法的原理，会将一般方法与 KHB 方法进行对照，再说明 KHB 方法使用原因的同时说明其原理。

2.1 常规方法对于连续变量

定义：是因变量，是关键变量，其影响会部分通过传递给，是中介变量，是控制变量，是误差项。

常规方法对于连续变量中介效应检验分以下几步走：

一般模型回归：

简化模型回归：

通过比较总效应与直接效应的差异 (即间接效应) 来对中介效应进验证:

2.2 常规方法对于非连续变量

对二元响应模型而言，由于因变量不可观测，所以我们无法估计模型的系数，也就无法直接通过来进行验证。如果我们定义一个二分变量，当小于某个阈值时为 0，否则为 1。这样虽然可以估计回归系数，但需要对方程中的误差项的方差与分布有要求。

如果我们设定其为二元 Logit 模型，那么基础系数的估计结果为和，其中和分别是尺度参数，是对应模型残差标准差的函数，同时，因为往模型中加入控制变量可以减少中不可解释的部分。

这样一来，类似，我们也可以计算，差值由影响的差值 ( 和 ) 和尺度参数的差值 ( 和 ) 决定。但是这会混淆中介效应的影响与尺度变化 (rescale)。

2.3 KHB 方法对于上述问题的解答

2.3.1 KHB 法检验步骤

KHB 方法对于连续变量中介效应检验分以下几步走：

完整模型中系数与标准误差的估计：

简化模型中系数与标准误差的估计：其核心思想是从中提取中不包含的信息。这将通过对回归来提取，即：

定义，代替代入方程，得：

同 2.2 中提及进行、的构造并相减，得：

这个式子中有几点需要说明：

和的区别在于：和相关，而是被分解出来和不相关的部分，所以方程 (1) 并不比方程 (3) 模型可以更好的预测，因此两个方程的残差标准差是一样的，即；
；
这个差值如上述表示了间接效应。除了通过差值之外，也可以通过比例或者是百分比的形式，如：

根据以上三点可以计算出式 (5)。

回归尺度问题：线性回归中回归系数的显著性用检验，统计量为，当样本容量足够大以至于自由度很大时 (一般是 30)，检验可以看成是检验，统计量为。在 Logistic 回归中，回归系数的显著性检验用 Wald 的，检验统计量的平方根为统计量，当自由度足够大的时候也可以写成，所以在转换后，和的尺度是一样的。

2.3.2 KHB 法显著性检验

在显著性检验中分以下两种情况。

一个关键变量和一个中介变量：此时，我们需要检验假设，同时我们可以知道。

若想使中的式子不等于 0，那么就必须满足：

中介变量需要对结果有直接效应的影响，即；
与相关，即。

然后基于上述观察，推导出基于 delta 方法 (Sobel 1982) 的间接效应的检验统计量：

其中是，是和的方差协方差矩阵。

多个关键变量和多个中介变量：这是一种更加常规的情况，包含了上面提及的简单情况。我们设定代表个中介变量的向量，为所有关键变量的向量。我们通常想知道在方程中有其他关键向量的时候，对于某一个关键变量的中介效应。

我们假设第个关键变量在给定其他关键变量下对的 Logit 或者 Probit 影响，这样一来，对的中介效应影响是在相同尺度上，为，检验统计量为：

其中，，。

3. KHB 方法代码及实操

3.1 KHB 命令介绍

* 命令安装
ssc install khb, replace

* 命令语法
khb model-type depvar key-vars || z-vars [if] [in] [weight] [ , options ]

其中，

model-type：模型类型，如 reg、logit、probit 等；
depvar：因变量；
key-vars：自变量，可以有因子变量；
z-vars：中介变量，可以有因子变量；

options 包括：

concomitant(varlist) 指定控制变量，允许因子变量；
disentangle 向程序请求一个表，该表显示每个控制变量提供的完整模型 (总效应) 和简化模型 (直接效应) 之间的差异；
summary 请求所有自变量的分解情况，默认情况下 khb 报告完整模型和简化模型的效果、它们的差异以及它们的标准误。

3.2 KHB 法数据实操

由于未能找到 U. Kohler, K. B. Karlson, and A. Holm (2011) 中所用的实操数据，因此用了另一套数据来进行本部分的数据实操。以下数据回归实操是为了通过实操让读者更好地了解 KHB 法的用处，并未考虑是否有学术文献支撑以及学术研究价值。该数据为 Long and Freese (2006) 提供的范例数据 nomocc2.dta。

. lxhuse ordwarm2.dta, clear
. * 数据处理，将非连续变量转化为数字
. gen W=string(warm) 
. destring W, gen(W1)
. gen white1=string(white)
. destring white1, gen(white2)

3.2.1 基本用法 (Basic use)

猜测年龄会对态度有所影响，且这种影响可能会通过受教育程度 (以受教育年限衡量) 影响人们的态度。中介变量通过 || 与自变量隔开，concomitant() 中加入控制变量，在这里控制了性别及研究年份。

. khb mlogit W1 age || ed, concomitant(male yr89) 

Decomposition using the KHB-Method
Model-Type:  mlogit              Number of obs = 2293
Variables of Interest: age       Pseudo R2     = 0.06
Z-variable(s): ed
Concomitant: male yr89
Results for outcome 1 and base outcome 3
-----------------------------------------------------
          W1 | Coeff     SE     z  P>|z| [95% CI]
-------------+---------------------------------------
age          |
     Reduced | 0.031  0.004  7.55  0.000  0.023 0.040
        Full | 0.025  0.004  5.80  0.000  0.017 0.034
        Diff | 0.006  0.001  4.54  0.000  0.003 0.009
-----------------------------------------------------

和分别为简化模型和完整模型估计效果，分别代表总效应和直接效应，两者的差值代表间接效应。可以发现年龄会使态度向好发展的概率增加 0.031%，在控制教育年限后，年龄的影响降低至 0.025，剩下 0.006 为间接影响。

KHB 方法确保在相同尺度上测量所呈现出来的系数，但是有时 Logit 系数的大小很难解释。Karlson, Holm, and Breen (2010) 提出了由式 (6) 和式 (7) 定义的比率和百分比来克服这些问题，而且这两个指标都可以通过一条 Stata 命令实现。

. khb mlogit W1 age || ed,concomitant(male yr89) summary notable 

Decomposition using the KHB-Method
Model-Type:  mlogit            Number of obs  = 2293
Variables of Interest: age    Pseudo R2       = 0.06
Z-variable(s): ed
Concomitant: male yr89
Results for outcome 1 and base outcome 3
Summary of confounding
        Variable | Conf_ratio    Conf_Pct   Resc_Fact  
    -------------+-------------------------------------
             age |  1.2382813       19.24   .98449812  
    ---------------------------------------------------

通过结果可以看出，总效应比直接效应大了 1.2 倍，总效应的 19% 是因为教育年限。

3.2.2 比较平均偏效应

实际应用中，有无的模型之间的平均部分效应的简单比较可能会失真，因此平均偏效应不适合用于效应的分解。但是用 KHB 法可以解决该问题。

. khb mlogit W1 age || ed,concomitant(male yr89) ape summary

Decomposition using the APE-Method
Model-Type:  mlogit             Number of obs  =  2293
Variables of Interest: age      Pseudo R2      =  0.06
Z-variable(s): ed
Concomitant: male yr89
Results for outcome 1 and base outcome 3
-----------------------------------------------------
          W1 | Coeff     SE     z  P>|z|     [95% CI]
-------------+---------------------------------------
age          |
     Reduced | 0.002  0.000  6.23  0.000  0.002 0.003
        Full | 0.002  0.000  4.48  0.000  0.001 0.003
        Diff | 0.001      .     .      .      .     .
-----------------------------------------------------
 Note: Standard errors of difference not known for APE method

Summary of confounding
        Variable | Conf_ratio    Conf_Pct   Dist_Sens  
    -------------+-------------------------------------
             age |  1.3007402       23.12    .9571126  
    ---------------------------------------------------

平均而言，由于年龄发生标准差变化，态度向好发展的概率增加了 0.2%，在控制教育年限后，这一概率基本不变，也就是说，教育年限的提升并不会导致人们态度向好或向差方向发展。

3.2.3 分离中介变量的贡献

如果有一个以上的中介变量，disentangle 选项能帮助回答哪一个中介变量影响更大的问题。该选项会通过制表显示每个中介变量的贡献。

. khb mlogit W1 age || ed male yr89, summary disentangle notable

Decomposition using the KHB-Method
Model-Type:  mlogit          Number of obs     =    2293
Variables of Interest: age   Pseudo R2         =    0.06
Z-variable(s): ed male yr89
Results for outcome 1 and base outcome 3
Summary of confounding
        Variable | Conf_ratio    Conf_Pct   Resc_Fact  
    -------------+-------------------------------------
             age |  1.2064567       17.11   1.0421457  
    ---------------------------------------------------
Components of Difference
      Z-Variable |      Coef    Std_Err     P_Diff  P_Reduced  
    -------------+---------------------------------------------
    age          |                                             
              ed |  .0060526   .0013359     115.30      19.73  
            male | -.0005025   .0002982      -9.57      -1.64  
            yr89 | -.0003009   .0006816      -5.73      -0.98  
    -----------------------------------------------------------

分解表的前两列显示了每种中介变量的效应差异及其标准误。第一列值的总和为 0.005，这是间接效应的总和，第三列标识各种中介变量对间接效应的贡献。最后一列显示总效应的多少是由于各自中介变量的混杂引起的，总计 17.1，即总体混杂百分比。

3.2.4 有多个关键变量的情况

我们将要分解的变量定义为关键变量。一个命令里可以存在一个关键变量，亦可存在多个。在这种情况下，我们希望能通过一个命令分解每个关键变量。下面，我们将对性别和职业声望进行分解，以年龄和研究年份为控制变量。

. khb mlogit W1 male prst || ed, concomitant(age yr89) summary

Decomposition using the KHB-Method
Model-Type:  mlogit                 Number of obs = 2293
Variables of Interest: male prst    Pseudo R2     = 0.06
Z-variable(s): ed
Concomitant: age yr89
Results for outcome 1 and base outcome 3
------------------------------------------------------
          W1 | Coeff     SE     z  P>|z|     [95% CI]
-------------+----------------------------------------
male         |
     Reduced | 0.366  0.141  2.60  0.009  0.090 0.642
        Full | 0.365  0.141  2.59  0.010  0.088 0.641
        Diff | 0.001  0.011  0.11  0.910 -0.020 0.022
-------------+----------------------------------------
prst         |
     Reduced |-0.014  0.005 -2.75  0.006 -0.024 -0.004
        Full |-0.001  0.006 -0.21  0.831 -0.013  0.011
        Diff |-0.013  0.011 -1.13  0.259 -0.034  0.009
------------------------------------------------------
Summary of confounding
        Variable | Conf_ratio    Conf_Pct   Resc_Fact  
    -------------+-------------------------------------
            male |  1.0032987        0.33   .94421228  
            prst |  10.616178       90.58   .96294939  
    ---------------------------------------------------

通过上述结果可以发现，职业声望的影响受教育年限的影响比性别影响受教育影响程度大。

3.2.5 其他用途

KHB 的其他用途至少还包括：

分类变量 (Categorical variables)
有序结果 (Ordered outcome)
多项结果 (Multinomial outcome)

由于前几条为 KHB 法相较于原有方法更为显著的优点，且 nomocc2.dta 数据并不符合进行上述三点实操的条件，因此在此并没有详细阐述。

4. KHB 方法总结

KHB 方法可以适用于多种情况，如上述提到的一个自变量和一个中介变量、多个自变量和多个中介变量。另外，中介效应的应用主要是在国内论文的心理学领域而非经济学领域。在国外顶刊论文中非常少，即使文章有使用也会进行调整。因此，虽然对中介效应的不断探索有助于我们不断在计量方面能有更加深入的认知，但是在经济学论文中使用中介效应仍需谨慎。

5. 参考文献及资料

Kohler, U., Karlson, K.B., Holm, A. (2011): Comparing coefficients of nested nonlinear probability models. The Stata Journal 11: 420-438. -PDF-
温忠麟, 叶宝娟. 中介效应分析: 方法和模型发展[J]. 心理科学进展, 2014, 22(05):731-745. -PDF-
方杰, 温忠麟, 张敏强. 类别变量的中介效应分析[J]. 心理科学, 2017, 40(02):471-477. -PDF-
刘红云, 骆方, 张玉, 张丹慧. 因变量为等级变量的中介效应分析[J]. 心理学报, 2013, 45(12):1431-1442. -PDF-
主流: KHB法测度中介效应, 无论线性还是非线性模型, KHB都能分解出直接和间接效应！-Link-

6. 相关推文

Note：产生如下推文列表的 Stata 命令为：
lianxh 中介效应, m
安装最新版 lianxh 命令：
ssc install lianxh, replace

专题：回归分析

中介效应分析：三段式中介效应模型真的适用于经济学研究吗？

专题：交乘项-调节-中介

中介效应：有序因果中介分析的半参数估计B-实操
中介效应：有序因果中介分析的半参数估计A-理论
Stata：中介效应分析新命令-sgmediation2
medsem-中介效应：基于结构方程模型SEM的中介效应分析-T331
med4way：中介效应和交互效应分析
Stata：调节中介效应检验.md
Stata+R：一文读懂中介效应

课程推荐：深度因果推断（2023年8月2-5日）
主讲老师：江艇
课程地点：西安·西北工业大学
🍓 课程主页：https://www.lianxh.cn/news/835167275c3af.html

New！ Stata 搜索神器：lianxh 和 songbl GIF 动图介绍
搜：推文、数据分享、期刊论文、重现代码 ……
👉 安装：
. ssc install lianxh
. ssc install songbl
👉 使用：
. lianxh DID 倍分法
. songbl all

🍏 关于我们

连享会 ( www.lianxh.cn，推文列表) 由中山大学连玉君老师团队创办，定期分享实证分析经验。
直通车： 👉【百度一下：连享会】即可直达连享会主页。亦可进一步添加「知乎」,「b 站」,「面板数据」,「公开课」等关键词细化搜索。

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

京东Plus的隐藏特权，很多会员都没领取，白交了会员费...

呼吁四川大学澄清：1998年1月，川大有多少个“姜涛与爱人程月玲”？

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

96岁的朱总理

Stata：非线性模型的中介效应检验-khb

1. 中介效应的研究

1.1 什么是中介效应

1.2 中介效应的一般检验方式 (常见的线性模型)

1.3 中介效应的特殊检验方式 (非线性模型)

2. KHB 方法原理

2.1 常规方法对于连续变量

2.2 常规方法对于非连续变量

2.3 KHB 方法对于上述问题的解答

2.3.1 KHB 法检验步骤

2.3.2 KHB 法显著性检验

3. KHB 方法代码及实操

3.1 KHB 命令介绍

3.2 KHB 法数据实操

3.2.1 基本用法 (Basic use)

3.2.2 比较平均偏效应

3.2.3 分离中介变量的贡献

3.2.4 有多个关键变量的情况

3.2.5 其他用途

4. KHB 方法总结

5. 参考文献及资料

6. 相关推文

🍏 关于我们

您可能也对以下帖子感兴趣

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

京东Plus的隐藏特权，很多会员都没领取，白交了会员费...

呼吁四川大学澄清：1998年1月，川大有多少个“姜涛与爱人程月玲”？

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

96岁的朱总理

生成图片，分享到微信朋友圈

Stata：非线性模型的中介效应检验-khb

1. 中介效应的研究

1.1 什么是中介效应

1.2 中介效应的一般检验方式 (常见的线性模型)

1.3 中介效应的特殊检验方式 (非线性模型)

2. KHB 方法原理

2.1 常规方法对于连续变量

2.2 常规方法对于非连续变量

2.3 KHB 方法对于上述问题的解答

2.3.1 KHB 法检验步骤

2.3.2 KHB 法显著性检验

3. KHB 方法代码及实操

3.1 KHB 命令介绍

3.2 KHB 法数据实操

3.2.1 基本用法 (Basic use)

3.2.2 比较平均偏效应

3.2.3 分离中介变量的贡献

3.2.4 有多个关键变量的情况

3.2.5 其他用途

4. KHB 方法总结

5. 参考文献及资料

6. 相关推文

🍏 关于我们

您可能也对以下帖子感兴趣