省级面板数据很不妥, 省级空间计量更荒谬
凡是搞计量经济的,都关注这个号了
邮箱:econometrics666@sina.cn
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
来源: 著名统计学专家吴喜之教授的书籍
用31个省、直辖市、自治区数据能够做什么?
在宏观经济统计领域中,很多人都用中国统计局公布的31个省、直辖市、自治区的数据来做回归等统计分析,但是究竟有多人想过下面的问题?
1. 31个省、直辖市、自治区数据仅仅是一些汇总数据,根本不是样本。因此完全不满足任何适用于样本的统计推断方法。
2. 如果一定要说31个省、直辖市、自治区数据是样本,那么总体是什么?如果还有疑问,好好温习一下初等概率统计知识就会明白了。
3. 此外,31个省、直辖市、自治区数据互相根本不独立。
4. 由于不是任何总体的样本,更谈不上分布及正态性。
5. 对于31个省、直辖市、自治区数据,使用任何超出描述性统计方法的做法都值得怀疑。
6. 有人还用31个省、直辖市、自治区数据做空间自回归,这是非常不妥的。除了它不是样本之外,做空间统计的单位太大,比如内蒙古既和沿海省份相连,又和最落后的省份相连,任何空间距离的描述都很片面,而且边境省份也没有和周边国家/地区相关,似乎中国完全处于空间中自我封闭的状态。
如果是这样的话,那所有发在《经济研究》上类似的文章在著名统计学家吴教授眼里是很有问题的,因此经济研究的审稿人需要提高计量和统计水平才能够让统计学家对结果放心。
图片来自“空间计量研究小组”
推荐阅读:
2.1998-2016年中国地级市年均PM2.5数据release
4.2005-2015中国分省分行业CO2数据circulation
5.实证研究中用到的135篇文章, 社科学者常用toolkit
可以到计量经济圈社群进一步访问交流各种学术问题,这年头,我们不能强调一个人的英雄主义,需要多多汲取他人的经验教训来让自己少走弯路。
计量经济圈是中国计量第一大社区,我们致力于推动中国计量理论和实证技能的提升,圈子以海内外高校研究生和教师为主。计量经济圈绝对六多精神:社科资料最多、社科数据最多、科研牛人最多、海外名校最多、热情互助最多、前沿趋势最多。如果你热爱计量并希望长见识,那欢迎你加入到咱们这个大家庭(戳这里),要不然你只能去其他那些Open access圈子了。注意:进去之后一定要看小鹅社群“群公告”,不然接收不了群息,也不知道怎么进入咱们独一无二的微信群和QQ群。在规则框架下社群交流讨论无时间限制。