互助问答第68期:分组检验和边际效应问题、ivprobit交乘项设计
点击蓝字关注我们
今日问题1
(1)基于Probit模型进行分组回归,并检验两组回归变量network对Y的影响是否有显著差异,利用的是Stata的suest命令。结果显示变量network系数有显著性差异,其中乡村组的系数是2.12,城市组的系数是0.34。请问能否直接得出结论:乡村组的network对Y的影响更大?
回归结果如下图所显示:两组回归里network的系数均十分显著,且在group=乡村时的network系数较大为2.12,suest检验也表明两组回归系数有显著差异。
(2)Probit模型回归分析时,系数均显著,但是转换成边际效应后就不显著了,这种情况是什么原因?例如下图是对变量networkaa求边际影响后的结果,可以看出是不显著的。但是如果仅仅是看Probit模型系数而不是边际影响的话,这一变量的系数是显著的。
今日解答
(1)在分组回归中,其实每个变量都有各自的系数,比如在OLS回归中可以根据系数影响大小(若系数表示的是边际效应)。那为什么又需要进行假设检验?这里可以这样想,这个结果仅仅是根据一组样本做出来的,是否会因为随机误差而引起的这个差异呢?所以不能仅根据这一组样本数据就得出结果,需要进行更为严谨的检验,即这里的假设检验。对于你提的问题,如果你检验出来两组是存在显著差异的,我觉得是可以得到那样的结论。很多时候,也会把原假设写成大于或小于的形式。
另外,建议你还是放一个全样本的回归,加入城市虚拟变量,以及城市虚拟变量与network的交互作用来进行检验,这样更能识别效果。
(2)Probit模型的系数显著性与边际效应的显著性不是等价的。不知道你算边际效应的时候是怎么算的,是不是at mean,这些都会影响结果。你把边际效应的公式以及方差写下来,就知道不一定具有相同的显著性。你在at mean, at median,25百分位数,75百分位数的各种位置上,变动一单位的效果其实不同,两者不是等价的,只能说明在均值(各种分位点),是否具有边际显著性。
关于回归系数和边际效应的问题,可以参考这个帖子:
https://www.statalist.org/forums/forum/general-stata-discussion/general/1329201-marginal-effects-significance-vs-original-model-effects-significance
今日问题2
在运用ivprobit模型解决内生性时,变量中存在解释变量与变量A的交互项,请问运用两步法进行工具变量的命令中此交互项是否需要改成工具变量与变量A的交互,还是无需重新定义?劳您指教,谢谢!
即:did= 解释变量*A
ivprobit 被解释变量 控制变量 交互项 (解释变量 =工具变量),first twostep
此交互项是did= 解释变量*A?还是did=工具变量*A?
今日解答2
首先,ivprobit是非线性模型,非线性模型加交互项不是随便加的。其次,如果解释变量是内生变量,那么也应该对“解释变量*A”寻找工具变量。因为corr(解释变量,e)不等于0,那corr(解释变量*A,e)也应该不等于0。
学术指导:张晓峒老师
本期解答人:曹晖老师 林煜恩老师 游万海老师
编辑:统计小妹
统筹:易仰楠 李丹丹
技术:知我者 赵雅轩 郭凯
往期回顾
互助问答第66期: 回归对数形式以及事件研究法的t值计算问题
长按二维码识别关注我们
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“论文导向计量实证社区”。任何侵权行为将面临追责!)