聚类标准误精辟解释, 保证你一辈子都忘不了!
群友在社群里分享了一则用生活示例解释聚类标准误的故事(什么时候以及如何使用聚类标准误?在什么层级上进行聚类呢?):
他说:
在天晴的时候,街道旁和街道上的人数是随机分布的,即并没有明显的规律性;
不过,一旦突然下雨,那么带了伞的人会继续在街道上穿梭,而没有带伞的人就会聚集到街道旁躲雨;
此时,街道上或街道旁的人群在其小组内部存在相关性或相似性:前者是都带了伞的有伞人,后者是都没有带伞的躲雨人;
有趣的是,这两组人群中的个体就是否带伞出门的决策是相互独立的,即A带伞的抉择不影响B不带伞的抉择。
这就能解释聚类标准误(clustered standard errors)的真实含义:允许各自组内个体的干扰项之间存在相关性,但不同组别间的个体的干扰项之间彼此不相关,这相当于放宽了原来的随机误差项独立同分布的i.i.d(Independent and identically distributed)假定。
读罢,觉得这是极为简单明了的解释,便将其分享给更多学者讨论。
2.工具变量精辟解释
y是你,x是你的男朋友,误差(/残差)是他劈腿的小三,内生性就是x变成渣男了,和小三有关系,因此需要找个新的与原来的相似,但是和小三没有关系的“男朋友”(有引号)!需满足相关性和外生性。
3.断点回归的精辟解释
借助于通俗易懂的事物讲解一下什么是RDD或者模糊RDD。
对,看下面这幅我家前院图即可。
在院子中间有一条界限,在界限的左边,铺满了绿油油的嫩草,而在界限的右边,却是光秃秃的杂草。那我到底对界限的左边或右边做了什么,使其附近的两边呈现出完全不同的景象?此时,我们的断点回归设计(RDD)就派上用场了,用它可以评估我对前院的干预措施是否有效以及干预强度。
当然,如果细究一下,考虑到界限的右边有少量绿色的嫩草,而界限的左边也有少量干枯的杂草,此时,我们的模糊断点回归设计(Fuzzy RDD)似乎更合适。换句话说,在界限的左边,成为绿色的草的可能性更大,而在界限的右边,成为干枯的杂草的可能性更大,此时在界限两边存在概率上的跳跃。
又比如,在中国与朝鲜的边界处躺着一条鸭绿江,可是在这条江的西边与东边却呈现出完全不同的景象,西边的夜晚在灯火辉煌中显现出一片繁荣,而东边的夜晚却在黑灯瞎火中显现出一片萧条。此时,我们会有疑问,到底是什么因素导致鸭绿江两边呈现出明显不同的景象呢?这可能会是一个地理界线基础上的RDD适用场景。
5.P-hacking的精辟解释
Sam: 不用说,我告诉我的孩子们预先注册他们的设计。 Vineet: 贝叶斯推断:很好地了解你的父母,你知道确切地去问谁来得到你想要的,以及家庭银行账号。 Ken: 我的朋友告诉她四岁的女儿,不行,她不能带着小猫一起去家庭旅行。几分钟后,她拖着一只手提箱从卧室里走出来,宣布说:“猫不在手提箱里。 Mine: 在我们家里你甚至不需要多个父母。一遍又一遍地问同一个家长,直到他们同意就可以。 Raymond: 原假设是,请求父母获得允许和根本不请求是没有区别的。 Quackack: 这就是为什么一夫多妻制会毁了很多家庭。一旦有太多的变量,孩子们就可以通过p-hack得到任何东西。我们的冰淇淋会被吃光的。如此,如果你有无数个父母,那么你就永远不会面对答案的错误。 Saya: 老实说,我只需要我的父亲在那里,脸上带着喜悦泪水的我就能找到我想要的答案。 Kristen: 我的父母在我们还没有大到可以问这个问题的时候就谈到了这件事。我们先问妈妈再问爸爸,爸爸就会说:你妈妈说了什么? 又挫败了我这扬起眉毛的脸。 Dakota: 在法律上我们称这种为挑选法院(forum shopping),并产生电路分裂。 William: D-blocking——你妈妈说了什么?5秒钟后,一个小人物转弯抹角地解释之后,我要去问她:你确定她说的是什么吗? Manuel: 如果一夫多妻制更普遍的话,这将成为一个典型的例子。 Keshav: 以前,我是一名p-hacking专家。 June: 由于这种繁殖危机,父母可能需要坚持独立复制。 Marci: 滴、滴、滴,我们称之为水刑。 Amir: 这就是为什么他们称之为“多重比较谬误”(有人说过这个双关语吗?) Joe: 疲倦:折磨数据,兴奋:唠叨数据。 Will: 这是纠正“婚姻比较”的好习惯。 Douglas: 我以为那是网络钓鱼。 Pink: Grubbs test: 忽略你孩子咬人的那一次。 Rod: 我可能得把这个加到我的简历里。 Scotty: 如果我没记错的话,先做祖父母们的基础工作通常效果会更好。 Tom:这就是为什么引起无限响应递归是我们的默认响应。在孩子组织一次面对面的家庭会议之前,对请求许可的回应应该是询问另一位家长。 Lavinia: 这里经常发生。有时甚至会有老奶奶参与(这通常意味着肯定的肯定)。 Yannick: 如果需要的话,父母们会对研究产生偏见。不要让你的孩子接受零假设。 Saman: Mum-hack: 在P1说“不”之后再问P2,这是一种惩罚。 Anthony: 第二种观点在我们家花费了1英镑的代价。 Israel: 我知道p-DoS,当一个孩子多次请求许可,防火墙就会崩溃,得到他们想要的任何结果。 Pajamazon: 在一夫多妻制家庭中尤其具有挑战性。 Daniel: 在这种情况下寻求处理时,必须进行BonBonferroni矫正。 Caitlyn: 长大的问题被推迟到父母双方都出席的晚饭时间。我猜我的父母对这种p-hacking早在它很酷之前就知道了。 Sandra: 我爸爸总是会说:“问问你妈妈吧。” Kaiser:哦,不,p-hacking在年轻人中根深蒂固,而且可能是遗传而来的。 Horowitz: 我的3岁孩子使用蛮力p-hacking。在这个问题上,他反复地、越来越尖锐地问同一个家长。 Eghlidi: p < 0.025? Joyce: 当你知道孩子要去问爸爸妈妈的时候,试着大声喊“隐形导弹来袭”作为你的密码。
1.用"因果关系图"来进行因果推断的新技能,2.因果推断专题:因果图,3.因果推断专题:有向无环图DAG,4.confounder与collider啥区别? 混淆 vs 对撞,5.三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系,6.中介效应检验流程, 示意图公布, 不再畏惧中介分析,7.图灵奖得主Pearl的因果推断新科学,Book of Why?8.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!9.前沿: 卫星数据在实证研究中的应用, 用其开展因果推断的好处!10.7大因果推断大法精选实证论文, 可用于中国本土博士课堂教学!11.随机分配是什么, 为什么重要, 对因果关系影响几何?12.应用计量经济学现状: 因果推断与政策评估最全综述,13.疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用,14.Python做因果推断的方法示例, 解读与code,15.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS,16.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献等等。
4年,计量经济圈近1500篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle
数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光 | 官员方言 | 微观数据 | 内部数据计量系列:匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列:能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。