查看原文
其他

TOP实证大牛希望在读书时就学到的计量方法!!!

计量经济圈 计量经济圈 2023-01-25

凡是搞计量经济的,都关注这个号了
稿件:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
耶鲁大学管理学院Paul Pinkham助理教授问:各位,你在研究生毕业后学到的计量经济学方法中,有什么是你希望在学校读书时就学到的吗?
关于Paul,参见:耶鲁开设“应用实证方法”P.hd课程, 强逻辑, 好文献, 重实操, 真前沿, 送slides和笔记!
然后收到了很多实证和计量经济学家的答案,不乏Bruce Hansen这样的顶级大咖的建议。这些建议,对于中青年学者的学习和研究工作意义重大,因此将其分享出来。
具体如下

sas ylu:1.使用R,2.跳过 NHST(零假设显著性检验),3.教预测性模型,4.更多数据说明,5.阅读主题, 避免想当然的回归,6.贝叶斯方法是必须的,7.不要完全接受渐近理论。
datahabits:几乎所有的计量经济指标都是关于距离指标的……
Martin Sato:总是质疑假设,检查稳健性,并尝试不同的方法。不要依赖一种技术或方法。

Ivan Gonzalez:小心对撞变量!(如果你找不到它们,你就没有画出合适的 DAG)

参考:1.审稿人, 中介变量能放到回归中去吗?那混淆变量, 不相关变量和对撞变量呢?2.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系,3.confounder与collider啥区别? 混淆 vs 对撞

1776:经济现实情况绝对不是线性回归。
Vainius:数据和估计的健全性检查。
Ryan Kessler:仔细思考识别假设背后的经济背景。
Ariel Ortiz-Bobea:我的建议:第一次使用估计值时先进行模拟。代码是否在按照你的想法执行?我发现过类似的重大编码错误。
Dimitriy V. Masterov:单边假设检验。
Nahaz:任何回归模型,无论表面上多么复杂,都是关于简单平均值的另翻表述。在使用该模型处理任何紧要的事情之前,要尽可能用最简单、最清晰的语言了解这个表述。
Nathaniel E. Baker:如何拼写“econometrics”会是一个好的开始。

Casey Wichman:我希望我必须做(更多)replication练习,比如,运行论文的replication文件。清楚知道文章里写的内容与实现它的代码之间的对应关系,对于我会非常有用。

参看:1.提供数据和代码供复制结果的的国际和国内期刊信息!2.我们应该在多大程度上相信工具变量估计, 基于63份顶刊复制结果的操作建议,3.AER文的数据和代码可下载供复制结果! 双重差分法和异质性处理效应分析范文,4.从网页上直接复制代码的因果推断书籍出现了, 学会主流方法成效极快,5.再分享17篇文章的复制代码和数据, 可以免费下载一一复制原文实证结果,6.分享9篇文章的Stata复制代码, 可以直接下载进行一一复制实证结果,7.一些关于代码编写和复制的最佳操作方法,8.100篇提供代码, code和程序的合集, 可复制出论文, 学习各种定量方法,9.练练手, 分享一份完整复制出文章的实证结果的数据和代码,10.合作者把代码弄丢了! 只能撤稿! 发表在最TOP金融期刊上, 但用代码复制不出结果! 11.数据和代码可下载供复制结果!空间(地理)断点设计RDD发(小)JPE的文章!12.空间计量各种模型代码笔记分享, 可以直接复制使用真的太好了!13.粗化精确匹配CEM文献推荐, 程序步骤可复制,14.国际最新文献综述方法: 引文语境分析法, 透明, 严谨, 可复制和可量化!

David Schönholzer:估计前进行模拟。

参看:1.从数据中抽取随机样本进行模拟分析,2.概率分布生成和蒙特卡洛模拟的实战示例,3.贝叶斯估计和蒙特卡罗模拟什么鬼?

Gabriel:反正所有的标准误都是错的,没必要浪费时间去计算。

Bruce Hansen(1.重磅! 汉森教授又修订了风靡世界的“计量经济学”教材, 为博士生们增加了DID, RDD, 机器学习等全新内容!2.重磅! 汉森教授首次为学者强烈推荐的对应不同层级的世界级计量经济学教材!3.截面, 时间和面板的门槛回归模型, threshold,4.重磅: 计量经济学教科书可能都需要重新修订了!ECM说二乘估计量是BUE!):所有的一切,一切!

apoorva.lal:影响函数(influence function,1.顶刊中的再中心化影响函数(RIFs): RIF回归和RIF分解全解析, 附code, 数据和示例,2.再中心化影响函数RIF回归和分解的Stata操作程序),或者如何学会计算所关心的事物的样本均值(而不是把赌注押在线性回归上)。
Ryan Briggs:很多关于编程的内容,比如编写(甚至是基本的)统计检验。模拟数据并对其进行分析,以确保一切看起来都应该如此。我的训练感觉就像是从黑板上的数学中跳跃了1/2 步,为什么呢?因为我们有电脑!懒了!

Noah Williams:记得,OLS 才是最重要的。

参见:1.用中国截面数据和OLS在JPE发文, 这个外国教授凭啥这么牛!2.使用OLS回归发AER的Articles专辑!3.男神毛咕噜最新Top5大作, 另外, 有序因变量依然使用OLS回归! 4.几百年一遇的工具变量让基于OLS的截面数据回归结果发到Top了, 设计巧妙让人叹服!5.如何在AER上用OLS发经济史研究, 这篇道出了验证IV合理性的标准范式! 必读,6.从耶鲁到香港, 从金融到历史后, 陈志武教授第一篇TOP刊文章是OLS+IV组合!

Dan Goldstein:做标准曲线分析(specification curve analysis), https://nature.com/articles/s41562-020-0912-z
Shahid Mehmood:如果你折磨数据的时间足够长,它最终会招供的!
DrG:过于复杂的计量经济学依赖于不太可能出现在我的数据集中的渐进性特征,因此真的不应该使用这些复杂的计量经济学方法。此外,花哨的计量经济学很少会改变OLS或Probit方法的答案或方向,听我的,OLS 或 Probit 就足够了。

Breno Salomon:我在论文中学到的东西:少担心协变量。我们都知道拥有更多数据是件好事,但有用的数据是需要时间来收集和准备的。首先要专注于建立快速的统计检验来论证你的研究假设,任何时候,你都要知道研究设计肯定是先于模型设计的。

参看:1.控制变量! 控制变量! 控制变量! 2.图灵奖得主Judea Pearl关于控制变量选择问题的文章被社会科学方法顶刊接收!3.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的,4.为什么需要逐步地而不是一次性加入控制变量?5.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?6.合理使用控制变量的策略与建议, 从研究设计, 数据收集与分析和结果报告三方面下手!7.加入其他控制变量后, 估计系数的符号相反了?8.控制变量选择问题: 如何鉴别好或不好的控制变量?附上14篇相关文章!9.什么是不好的控制变量, 什么又是好的控制变量? 10.如何选择正确的因变量(控制变量),让你的计量模型不再肮脏

Matteo Iacoviello:在运行回归之前绘制出数据图。

参看:1.用Stata绘制25种从简到难的数据图, 提供完整代码和绘图结果!2.国外教授整理了高效使用Stata的48个小技巧, 制作动图的代码爱了!3.顶尖50个R软件中的可视化操作, 并附有完整的R代码供实证研究者使用!

Tom Zylkin:在与虚拟变量交互之前要对连续变量去中心化。
参看:面板数据中去中心化的交互项回归什么情况

DrG:过度依赖“自”变量,甚至过度依赖回归。将总样本划分成子样本通常会讲述出文章的主要故事。即使是 OLS 也过度偏重离群值——它使用距离平方,所以离群值会使直线(系数)偏倚太多。

参看:1.交互项有什么用?为啥要做异质性分析?2.异质性分析用来检验中间传导机制, 分组回归或交互项就可以完成机制分析,3.Top刊: 孩子是女孩, 夫妻更容易离婚吗? 可学习异质性分析, 渠道检验和思维导图,4.异质性分析是什么?如何做?有哪些方式去做呢?5.AER上因果关系确立, 敏感性检验, 异质性分析和跨数据使用经典文章,6.交互项与分组回归的区别是什么? 异质性分析,7.有限混合模型FMM,异质性分组分析的新筹码,8.因果推断异质性什么鬼? 边际处理效应让你与众不同,9.异质性处理效应分析HTE是个啥, 谢宇院士与这篇文章的“八卦”,10.分位数处理效应模型, 异质性分析的基础

Shane Tutwiler:稳健性检验不如正确建模重要。考虑到效应的异质性,边际平均处理效应实际上是无用的。断点回归设计RDD并不可靠。如果你询问相关领域专家,会发现大多数工具变量IV都有通向结果的后门路径。

参看:1.稳健性检验如何做? 有哪些稳健性检验常用思路?2.如何量化因果推断的稳健性?3.实证应用经济学中的稳健性检验是什么? 怎么做?哪些策略呢?4.弱工具变量的稳健性检验, 附上code和相关说明!5.RDD经典文献, RDD模型有效性稳健性检验,6.一篇使用Bacon分解作为交错DID稳健性检验的TOP文章, 数据和代码分享!

Erik:利用 ChatGPT后……你会对输出感到惊讶。
James Bland:作为一个教授计量经济学的人,我真希望学过劳动经济学相关课程。本来可以更深入地了解 DID、RDD 和面板数据等方法。
Bernardo F. Nunes:Bonferroni和类似的多重比较校正。
Christoph Hanck:一致渐近效度比逐点渐近效度更好。
Alberto Naranjo:不是要当经济学家。
Senior Adjunct Prof in Finance:永远不要过度依赖Stata和eviews。Econ以外的人没有人使用他俩。
Abubaker Mayanja:在一些国家很少有人关注计量,毕竟并不是每个人都热衷于计量经济学的实证证明。
Frederik Plum Hauschultz:使用管道做独热编码(One-Hot Encoding)等。

Rustin Partow:如何把其他方法转变成为gmm。

参看:1.Acemoglu找了一个均值性质的IV, 并用GMM, HHK把文章发到了JPE,2.处理面板数据的内生性偏差: 广义矩估计方法GMM,3.GMM和工具变量在面板数据中的运用, 一篇文章学会操作流程!4.最近50篇使用系统GMM开展实证研究的papers合辑!5.内生性, 工具变量与 GMM估计, 程序code附,6.动态面板模型的王冠—系统GMM什么鬼?7.IV和GMM相关估计步骤,内生性、异方差性等检验方法

Eduardo Marín Nicolalde:在完成探索性数据分析并获得分组描述性统计之前,先忘掉模型吧。如果要使用一般线性模型,请先尝试简单的主成分分析,它将使你对正在发生的事情的理解度增加1000倍。

参看:1.常用: 主成分分析和因子分析的原理, 操作, 代码和案例讲解!2.全局主成分分析GPCA是什么?为什么比传统PCA更好, 具体如何使用呢?3.面板数据聚类, 因子分析和主成分分析咋做? 4.主成分分析/因子分析/判别分析,见过的最通俗易懂的解释,5.输出变量的描述性统计的方案

Michael Kofoed:当因果推断风潮运动开始时,我就介入了。

参看:1.关于各种因果识别方法的120份经典实证文献汇总”,2.哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code,3.因果推断的统计方法总结, 177份文献4.政策评估的计量方法综述, 包括最新因果推断方法5.在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献,6.看完顶级期刊文章后, 整理了内生性处理小册子,7.工具变量精辟解释, 保证你一辈子都忘不了8.DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征9.关于双重差分法DID的32篇精选Articles专辑!10.关于(模糊)断点回归设计的100篇精选Articles专辑!11.匹配方法(matching)操作指南, 值得收藏的16篇文章等,12.MIT广为流传的政策"处理效应"读本13.DID的研究动态和政策评估中应用的文献综述14.最新政策效应评估的四种方法15.政策效应评估的基本问题等。

1.用"因果关系图"来进行因果推断的新技能2.因果推断专题:因果图3.因果推断专题:有向无环图DAG4.confounder与collider啥区别? 混淆 vs 对撞5.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系6.中介效应检验流程, 示意图公布, 不再畏惧中介分析7.图灵奖得主Pearl的因果推断新科学,Book of Why?8.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!9.前沿: 卫星数据在实证研究中的应用, 用其开展因果推断的好处!10.7大因果推断大法精选实证论文, 可用于中国本土博士课堂教学!11.随机分配是什么, 为什么重要, 对因果关系影响几何?12.应用计量经济学现状: 因果推断与政策评估最全综述13.疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用14.Python做因果推断的方法示例, 解读与code15.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS16.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献等等。

1.哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code!2.图灵奖得主Pearl的因果推断新科学, Why? 3.计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用,4.你应该阅读哪本因果推断书籍: 一份进阶流程图和简短书评列表

Mark Manger:对于发表文章而言,按照你所在领域的标准去做比按照别人教的去做更重要……但随着时间的推移,这种情况会变得更好。
Ethan Spangler:如何在数据结构方面执行大部分方法,从而达到从理论到实践的普遍飞跃。
Yongjie JI:DID吗?

参看:1.120篇DID双重差分方法的文章合集, 包括代码,程序及解读, 建议收藏!2.诚实双重差分法DID, 面板事件研究法和Bacon分解的经典应用文!3.前沿: 多期或渐进或交叠DID, 如何进行平行趋势检验呢?4.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习,5.DID前沿: 5种方法估计事件研究的因果效应, 并使用绘制系数和置信区间, 详细代码和数据,6.事件研究法开展政策评估和因果识别, 分享8篇提供数据和代码的文章,7.推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码!8.机器学习已经与政策评估方法, 例如事件研究法结合起来识别政策因果效应了!9.前沿, 模糊双重差分法FDID方法介绍和示例, 附code和数据!10.双重差分法和事件研究法的区别主要在哪里?11.前沿, 合成双重差分法SDID方法介绍和示例, 附code和数据!12.具有空间溢出效应的双重差分法估计最全综述, 理论和操作尽有!13.最新Sun和Abraham(2021)和TWFE估计多期或交错DID并绘图展示结果!详细解读code!

Raul Sampognaro:局部识别。永远不要权衡你的回归。
Andreas:对概念的理解足以将相对基本的模型应用于现实世界的问题,这比能够回答关于BLUE代表什么以及如何手动解决OLS的详细问题要重要得多。

Mateusz Najsztub:统计推断前的数据清洗。

参看:1.数据清洗, 管理和操作Stata命令汇编, 附上常用计量方法操作code!2.数据清洗管理的知识点全在里面, 征服数管不是梦

Ulf Erlandsson:正交回归(Orthogonal regressions)。也许有人教过,但直到遇到特定问题我才明白。
Vincent Boucher:何时使用样本权重,带内生抽样的权重。
Andreas Homberger:告诉我激励措施,我告诉你结果。

Maciek Drwal:如果/当我离开学术界时,如何让自己了解最新的文献/新方法。我仍然没有弄清楚如何在 30 年后当方法进一步进步时,不成为像婴儿潮一代那样只知道横截面回归的落伍人士。

参考:1.重复截面数据是什么?他的合理性和局限性又在哪里!2.斯大林是人们不信任的起源? 截面数据无IV解决内生性, 机制十足,3.截面/队列DID大有前途, 让微观调查数据得以与DID方法结合起来,4.横截面和面板数据可用来干什么? 如何在他们里面秀技术? 5.QJE新任主编AER上"非洲奴隶贸易与不信任的起源", 一篇堪称经典的截面数据实证论文,6.不强调内生性, 用极简截面数据和交互项, 就将经济学故事讲到领域Top刊!7.Acemoglu大神, 又在TOP5期刊刷文了!把20-60个观测值的截面数据做绝了!8.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理,9.截面数据DID讲述, 截面做双重差分政策评估的范式,10.截面, 时间和面板的门槛回归模型, threshold,11.传销活动对经济发展影响, AER上截面数据分析经典文

Betül :alpha 和 beta 的确切含义。
马克:波动性太大从而不能用作估值因素。
Chris :如果我早点学习“阅读统计学,而不是‘计量经济学’”,我会过得更好。
daryl:输入ectrix可以节省字符 😁。
Arthur Heim :多重推断!
Kodjovi J A:在市场模型中建立均值回归参数。在波动率建模中使用PCA分析。改变市场模型的分布,使其更接近于经验观察。
Monica Stephens:R。
Matt Mendoza:
—标准误只是你知道的错误;
—接近零是一个完全有效的参数估计值;
——不要使用与经典论文相同的函数形式和样本限制,除非你所分析的问题与其相同;
—交叉表有时更好。
Math destroy:学习概率论。
Henrik Møller:魔鬼经济学:我们在这门课上有多糟糕。
Samuel Cohn:是的。这个世界总是不可识别的。
John Grund:所有的非参数方法以及pert分布的构造和应用。
Muhammad Khurram Shabbir:虚拟陷阱。
参看:1.虚拟变量回归模型是什么? 政策评估的前件,2.调节效应的陷阱
你有什么建议呢?

下这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

3.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存