R语言与计量经济学:零基础学习视角
本文主要就截面、面板数据处理与R语言结合交流学习经验,适合零基础的初学者,高手请飘过。
一、选择R语言的初衷
(1)R软件开源,并且CRAN平台每天发布新包,适合前沿学术研究;
(2)机器学习和神经网络等研究方法正与计量经济学融合,R语言提供了大量的软件包;
(3)节约大量的软件支出费用;
(4)避免版权风险。
二、学习过程和效果
零基础,身体力行实践相关R语言教程;实践过程备受打击,几近放弃,致力毕业的信念支撑自己度过无数的孤独与落寞的日子,一年后终于可以利用R语言进行学术研究。
三、学习R的经验
沉心总结,学习R大致可分三个阶段:
(一)初级阶段
1.R软件和配套软件准备
(1)下载和安装R软件
R软件有Windows/OS X/Linux三个版本,都可以从CRAN平台上下载R软件:
图1 R软件下载页面
(http://nbcgib.uesc.br/mirrors/cran/)
(2)配合R软件使用的两个常见应用环境Tinn-R和Rstudio的下载与安装
①下载和安装Tinn-R软件
图2 Tinn-R下载页面
(https://sourceforge.net/projects/tinn-r/)
②下载和安装Rstudio软件
图3 Rstudio下载页面
(https://www.rstudio.com/products/rstudio/download/)
(3)软件组合使用
个人偏好使用R+Rstudio组合,一个重要的原因就是Rstudio平台可以融合Python,并能运用谢益辉编写的包,进行RR(Reproducible Research)和专业排版。
2.初级阶段的教程
尽量选择短小、命令比较齐全的教程,轻松快速入门。个人经验,选择如下教程。
(1)Matt Baggott(2013)的《R reference card v2》
适合英文基础好的读者,卡片简短,包括所有可以用到的常用命令,可以随身携带方便,学习方便。
(2)Sizhe Liu (2013)的中文版《R reference card》
适合中文入门读者,卡片简短,包括所有可以用到的常用命令,可以随身携带方便,学习方便。
(3)Manual: 《An Introduction to R》、《R Data Import/Export》
最新R软件入门读物,通读并实践,极快入门,提升对学习R语言的信心和兴趣,适合随身携带ipad平板的读者阅读,也可打印出来精读,建议使用英文原版阅读,个人比较偏好。
(4)方匡南, 朱建平, 姜叶飞(2015)的《R数据分析:方法与案例详解》
此书适合基础演练,中文版,上手快,如能结合方匡南网上视频学习,效果突飞猛进。推荐此教材应用到《数理金融》课程实践,学生反馈比较好。
此阶段,以中英文版的R reference card 为范本,实践所有的命令,目标就是要上手快,建立学习R语言的兴趣和信心。
Sizhe Liu (2013)的中文版《R reference card》、Matt Baggott(2013)的《R reference card v2》、《An Introduction to R》、《R Data Import/Export》直接从: http://nbcgib.uesc.br/mirrors/cran/下载;方匡南, 朱建平, 姜叶飞(2015)的《R数据分析:方法与案例详解》这书人大经济论坛有电子版,也可从实体店购买纸质书学习。
(二)中级阶段
中级阶段就是要全面反复实践R语言在中级计量经济学中的应用。理论教材:Jeffrey M. Wooldridge的《Introductory Econometrics: A Modern Approach,6e》是同行认可的较好的经典教材,此书理论分析清晰、数据齐全(人大经济论坛可以下载电子版和相应数据);R软件实践: Florian Heiss(2016)的《Using R for Introductory Econometrics》,此教材完美结合了R与中级计量经济学。此书的电子版可以从(http://bbs.pinggu.org/forum.php?mod=viewthread&tid=4582451&ctid=2418.)下载,数据和代码可以从(http://www.urfie.net/downloads.html)下载。
图4 Using R for Introductory Econometrics
(三)高级阶段
1.参数估计进阶
(1)选用Croissant and Millo(2018)的《Pane Data Econometrics with R》
此书理论分析精当,命令介绍全面,是我学习见过最好的教材了(恕我眼界不高哦),一流的学者,一流的著作。
(2)选用黄长全(2017)的《贝叶斯统计及其R实现》推进参数估计水平
此书是在我校教材科发现的,学习过程愉悦。此书厚度适中,理论分析简洁,命令使用轻松。
2.非参数与半参数入门
(2)选用柳向东(2015)的《非参数统计:基于R语言案例分析》
此书理论比较详尽,R命令使用比较齐全,适合实操。
(3)David Ruppert etc(2003)的《Semiparametric Regression》。
此书英文,比较厚,理论讲解清晰,R命令使用清楚,适合实操。
3.非线性入门
(1)选用Ritz and Streibig(2008)的《Nonlinear Regression with R》
此书厚度适中,比较适合学习,理论与实践结合好。
可从http://gen.lib.rus.ec/下载英文电子书,中文教材也有电子书。建议尊重知识产权,购买正版纸质书。
四、扩展方向
掌握了初中高级计量经济学和R语言,就可以根据自己的兴趣选择专题学习,如要学习空间计量经济学:
基础操作的学习:
(1)Luc Anselin (2005)的Spatial Regression Analysis in R-A Workbook,最早的入门著作,侧重模拟,值得深入学习;
(2)Reinhold Kosfeld(2016)的Spatial Econometrics with R-Spatial Data Analysis of the 5-Region Script Example,空间计量分析全操作,非常全面;
(3)Arbia(2014)的《A Primer for Spatial Econometrics: With Applications in R》:部分理论,部分R操作,入门级别;
操作与理论分析结合:
(1)Kelejian et al.(2017)的《Spatial Econometrics》:理论分析非常精彩;
(2)McMillen (2012)的《Quantile Regression for Spatial Data》,分位数空间计量的经典著作。
下期预告:ANUSPLIN插值专题系列-线性插值及研究区站点提取
推文期数:2018119
责任编辑:陈辉民,崔文超,曹丽,王万里
推文审核:张天舒,梁龙武 ,骆丹云
总审核:学术无界顾问团
下期预告:ANUSPLIN插值专题系列-线性插值及研究区站点提取
往期回顾: