查看原文
其他

关于交互项的那些事(一):什么是交互项?

数据Seminar 2021-06-03

The following article is from 计量经济学及Stata应用 Author 陈强

计量经济学的初学者经常困惑于交互项的含义,以及在实证研究中如何取舍交互项。事实上,如果善于使用交互项,或许可以为你的论文增色不少。本文就来聊聊关于交互项的那些事。

 



什么是交互项?


 

考虑简单的二元线性回归模型:

不难看出,如果忽略扰动项,则此模型的回归系数即为相应解释变量对 的边际效应(marginal effect),比如:

由此可知,线性模型的方便之处在于,解释变量的边际效应一直是常数,而且就等于其回归系数。因此,线性模型非常容易解释。

现在考虑稍微复杂的模型:

其中,的乘积 即为“交互项”(interaction term),也称为“交叉项”、“互动项”。




如何解释交互项?


应该如何解释交互项前面的回归系数 呢?我们继续通过边际效应来考察(依然忽略扰动项):

从上式可知,加入交互项后,解释变量的边际效应依赖于解释变量,不再是常数,而是的线性函数。

如果,则的边际效应随着的增大而上升,这有时在市场营销中称为“协同效应”(synergy effect)。

反之,如果,则随着的增大,对的边际效应反而下降。

如果对上式继续求混合偏导数,可得:

因此,交互项之前的回归系数,也称为“交互效应”(interaction effect),或“调节效应”(moderating effect),即的作用受到的调节。

当然,由于混合偏导数可以交换变量次序,故也可以通过考察对的边际效应来解释交互项的经济含义: 




为何使用交互项?


通过以上介绍,不难看出使用交互项的一些常见场景:

(1)如果解释变量的边际效应不是常数,此时可考虑引入交互项,使得某解释变量的边际效应依赖于另一解释变量。当然,也可以考虑加入平方项(仍可通过求偏导数来解释其经济含义)。

(2)如果真实模型(true model)为包含交互项的非线性模型,则简单的线性模型将遗漏此交互项,从而导致“遗漏变量偏差”(omitted variable bias):

其中,扰动项 必然与解释变量相关,导致内生性。因此,在回归方程中加入交互项,可能有助于缓解遗漏变量偏差。

(3)通常线性模型所说的“故事”(story)过于简单(比如,有作用),可能文献中早已做过。而如果在模型中加入交互项 ,则会使得你的故事变得更为深入而微妙,比如,不仅对有作用,而且此作用还依赖于;然后进一步讨论,此依赖性为正还是负,以及其产生机制,从而为你的论文添色。

关于交互项的进一步讨论,比如引入交互效应的副作用(多重共线性等),使用交互项的注意事项,非线性模型中的交互项,以及如何在Stata中画“交互效应图”(interaction plot)等重要话题,将在下期推文中继续介绍。




参考文献
陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年。
陈强,《计量经济学及Stata应用》,高等教育出版社,2015年。(配套教学视频,可在网易云课堂学习)






►往期推荐

回复【Python】👉简单有用易上手

回复【学术前沿】👉机器学习丨大数据

回复【数据资源】👉公开数据

回复【可视化】👉你心心念念的数据呈现

回复【老姚专栏】👉老姚趣谈值得一看


►一周热文

数据呈现 | 八图献礼祖国70华诞,我爱我的祖国

特别推荐丨老姚专栏:教科书没有讲的矩估计性质

数据呈现 | R绘制树图,透视长三角一体化层次关系

学术前沿 | DMSP-OLS夜间城市灯光数据文献综述

工具&方法 | “名牌包”:面板、时间序列模型常用R语言包






数据Seminar

这里是大数据、分析技术与学术研究的三叉路口


作者:陈强出处:计量经济学及Stata应用推荐:杨奇明编辑:青酱







    欢迎扫描👇二维码添加关注    



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存