互助问答第57期:门槛回归和取对数问题
点击蓝字关注我们
今日问题
1. 门槛回归的基础命令格式?如果没有门槛效应,该如何处理?
2.数据处理问题:
对数据取对数或缩尾处理,是对全部原始数据做处理?还是对部分数据做处理?
在对数据做取对数处理时,应注意什么问题?相对数可以做取对数处理吗
数据中既有绝对数,又有相对数,是否会影响数据处理的效果?
3.指标选取问题:
指标的选取必须有文献支撑还是可以选择自己认为合理的指标即可?
年限的问题:环境类指标《中国环境统计年鉴》上的数据只更新到2015年,目前没有公布2016年和2017年的数据,是否可以预测两年的数据?还是只能用到2015年的数据?这样是否存在数据不具有实效性这种大问题?
今日解答
一、程序的问题
(1)验证程序正确与否,具体可以查看xthreg命令的帮助文件,基本语法如下:xthreg depvar [indepvars] [if] [in], rx(varlist)qx(varname)
depvar:因变量。
indepvars:自变量。
rx:机制相依变量,即这个变量对因变量的作用与qx内填的变量有关。
qx:门槛变量。
(2)实证分析的目的就是为了验证理论假说,如果检验结果就是没有门槛效应,而且解释变量没有遗漏的话,那就应该尊重结果,可以再从理论去分析是否是门槛变量选择不合理。
二、取对数问题
若变量单元是元/人民币等,即表示金额的变量,通常取对数,比如工资,薪水,公司销售额或公司市场价值等;对于人口数,员工数等往往数值较大,也会对其取对数;年龄,经验,教育年限等通常不取,用水平形式;比率、百分数等可取可不取,为了方便解释,建议用水平形式。具体可以参考Woodridge的Introductory Econometrics :A Modern Approach(英文第四版,P191)。变量取对数后,模型参数的解释可以参考下表:
(来源:Introductory Econometrics :A Modern Approach,P46)
请不要以如下理由取对数:1、消除异方差;2、使变量服从正态分布;3、如果变量存在负数,很多文献会给增加一个正数,再取对数,这种方法也不建议。
三、指标选取问题
(1)指标选取最好可以参考已有的文献,特别是较好的期刊,这样不容易受到审稿人的质疑;
(2)数据可得性是选择样本的一个充足理由,比如数据只到2015年,那只选择到2015年即可。个人不建议为了追求较新年份数据进行预测,主要原因是预测方法本身很多,预测精度也不一样,这个步骤非常容易受到审稿人的攻击。
学术指导:张晓峒老师
本期解答人:游万海老师
编辑:李宁宁
统筹:易仰楠 李丹丹
技术:知我者 赵雅轩 郭凯
往期回顾
长按二维码识别关注我们
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“论文导向计量实证社区”。任何侵权行为将面临追责!)