查看原文
其他

学术情人节:断点回归的妙用【转】

三农学术 2022-12-31

这位Gray老兄运用断点回归原理,表达了“You”的出现对他的幸福的显著提升作用。这个有创意的“学术情人节”,吸引了不少“有意思”的评论。



这年头,做个回归不加个IV都不好意思,哪怕你不用IV模型,也得找个说明下为什么不用IV,或者把IV结果附上。最常见的IV就是“降雨”了,但是理论上要求“降雨”是外生的,并且不直接影响“幸福”、只能通过“You”的出现,通过“You”的作用来影响“幸福”。很多人的IV都无法在理论上满足这一要求。这里提到的Bill Wither 1971并不是一篇论文,而是美国歌手Bill Wither 1971年的成名作 “Ain't No Sunshine(逝去的阳光)”。




Ole注意到了图形中两条直线斜率的变化,因此提醒原作者是否低估了“You”的作用。


Salvador评论说可以用指数关系、而不单是线性关系来解释,甚至说只喜欢"半参数模型“。我们平常用的多是参数模型,先假定了Y的分布、Y和各种X的关系,再来求参数,这些假定在很多时候是不合理的。而非参数模型则放宽了这些假定,Stata 15中的npregress命令就是专门用于非参数模型的。半参数模型则是结合了参数模型和非参数模型,假定部分的X与Y的关系是已知,另外部分的X与Y的关系未知。


下面这两位也提到了模型设定的问题,Y和X不一定是直接的线性关系。一般来说,年龄小的时候比较幸福;人到中年各种压力,头发都掉,不幸福;而老了以后,幸福感又上来了。

Subhadra 提到还是一个Y和X的关系问题,他可能会觉得时间对幸福的作用并不全是一个正向的;倘若是一个正向的话,那可真是福音,只要活得久,幸福天长久。


Jericho提到了一个初学者常见的失误:只关注统计显著性而非实际意义的显著性。很多模型中的系数都是三个***,但是一看系数的值,实际影响非常小。所文章的结果部分不能只讨论显著性,更要讨论实际的影响。


Luke说所谓的RDD不就是一种事件研究法,潜意思是事件研究法有很多种(比如说生存分析),不一定是RDD最适合。感兴趣的可以查看一下Stata 中的help eventstudy


Luke比较皮,刚说完Event study,又直接”借用“Gray的创意。一些文章中也可以见到这种写法,例如”参见XX的论文“。但是这文风、词句也太类似了,有”抄袭“的嫌疑。


Selin说在门阈处的不确定性太高,这情人节表白被接受是好事,但是被拒绝的也是不少的,甚至有再次表白再次被拒的,因此建议用Fuzzy RDD,而不是Sharp RDD.



Jonathan说的是每一个投稿人的痛,2月14号投稿,5月1号给初步消息。这还算是时间快的了。国内的期刊很多更是直接明确,如果X个月内没有消息,就相当于被拒。别人投稿了,最起码也要给别人一个正式回复吧。


下面这个应该是个日本人,把Gray的模型进行了改造,加入了”生孩子“,还有一些其他的人生坎等待填充。


David 问的这个问题是很多做实证的人的痛,你的理论贡献在哪?多数能把实证搞对就不错了,谈何理论贡献,要求有点高。当然一般来说,实证也是在理论指导下进行,总能扯上点理论。


Martin提到了样本量,就一个样本做啥的模型啊,但是想把情人节的样本量扩大到1000,难度太高。


做完模型,别忘了做各种检验,否则要被评审人批。两个模型系数的比较,做个Chow test吧。每次看到Chow Test,就有一种骄傲啊,邹至庄先生是华人的骄傲。


数据的异质性?再来个检验


最可怕的评论是这个Peter,情人复仇,就问你怕不怕?

总结评论的要点:

  1. 样本量数量够不够,有没有代表性?

  2. 模型设定是否合理?有没有其他的替代模型?IV?非参数、半参数模型?

  3. 检验:异质性、Chow检验

  4. 系数:统计显著性、实际意义、大小和方向的解释

  5. 理论贡献?


——END

以上英文和图片全部转自Twitter,中文为编辑所加。


其他阅读:

  1. Cattaneo等人Regression Discontinuity Designs小新书两册

  2. (于晓华)如何正确运用计量经济模型进行实证分析-——实证分析中的数据、模型与参数


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存