查看原文
其他

工具&方法丨关于交互项的那些事(四):非线性模型中的交互效应

数据Seminar 2021-06-04

The following article is from 计量经济学及Stata应用 Author 陈强

如果交互效应出现在非线性模型中,比如二值选择模型(Probit或Logit),应该如何解释呢?与线性模型中的交互效应有何不同?
事实上,二者很不相同!艾春荣老师最早注意到了这个“奇怪”的现象(Ai and Norton, 2003)。
以 Probit 为例,考虑以下模型:
此时,交互效应(interaction effect)的符号是否由交互项系数  所决定呢?不一定!
根据定义,交互效应为如下混合偏导数。使用链锁法则,不难得到:
基于上式的复杂性,交互效应的符号与显著性与  的符号与显著性并没有必然联系。显然,此交互效应并非常数,而是解释变量  与  的函数。进一步,交互效应的符号也可能随着  与  的取值不同而变化。
事实上,即使 ,交互效应也不一定为0!此时,交互效应的表达式为
因此,简单地对  的显著性进行 t  检验,对于判断是否存在交互效应无济于事。对于这样的非线性模型,如何对交互效应进行统计推断呢?
Ai and Norton (2003)提供的方法是,给定所有协变量 ,则可计算任意两个解释变量(比如  与  )之间的交互效应,例如
进一步,使用Delta Method,可计算在  处交互效应的标准误,进而得到相应的 t  统计量,以检验在 处的交互效应是否显著。
在具体操作中,对于样本数据 ,可得到在此 n 个观测值处的交互效应估计值及其 t  统计量。Ai and Norton (2003) 以 Logit 模型为例,通过是否购买 HMO 健康保险的具体案例,估计每个观测值的交互效应,并画图来直观表示。
上图的横轴为每位个体购买保险的预测概率(Predicted Probability),而图中的每个点则表示在不同观测值处的交互效应。显然,交互效应有正有负,依赖于具体的观测值。
进一步,考察不同观测值处的交互效应之相应 t  统计量。
上图的横轴依然为每位个体购买保险的预测概率,而图中的每个点则表示在不同观测值处的交互效应之相应 t  统计量。显然,这些 t  统计量有些显著(某些 t  统计量超过10,高度显著),而有些则不显著(某些 t  统计量在 0 附近取值)。
如何画出上述非线性模型的交互效应图?作者还提供了相应的Stata命令 inteff,可通过 “findit inteff” 来下载安装。

_________________________________________

参考文献

陈强,《计量经济学及Stata应用》,高等教育出版社,2015年(配套教学视频,可在网易云课堂学习,详见

https://study.163.com/course/introduction/1006076251.htm

陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年(配套高级计量六天现场班,北京,2019年10月1-6日,详见

https://bbs.pinggu.org/thread-3156565-1-1.html

陈强,《机器学习及R应用》,高等教育出版社,2020年(即将出版)









►往期推荐

回复【Python】👉简单有用易上手

回复【学术前沿】👉机器学习丨大数据

回复【数据资源】👉公开数据

回复【可视化】👉你心心念念的数据呈现

回复【老姚专栏】👉老姚趣谈值得一看


►一周热文

数据呈现 | Python中交互turtle包,让图形多点艺术

特别推荐丨老姚专栏:辛普森悖论、异质性与DID模型

工具&方法丨 关于交互项的那些事(三):遗漏变量偏差 vs 多重共线性

工具&方法 | R语言机器学习包大全(共45个包)

数据呈现 | R绘图:三维动图,分省透视三大产业经济格局









数据Seminar

这里是大数据、分析技术与学术研究的三叉路口


作者:陈强出处:计量经济学及Stata应用推荐:杨奇明编辑:青酱







    欢迎扫描👇二维码添加关注    


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存