互助问答第19期:probit模型、tobit模型
问题:前辈们好!我想请教一下
(1)probit模型的完整命令是probit y x1 x2 i.year i.citycode i.industry, r nolog 这样吗?tobit模型的完整命令是tobit y x1 x2 i.year i.citycode i.industry, r nolog 这样吗?
(2)probit模型、tobit模型在没有控制年份、行业、地区的时候做的结果是显著的,在控制了之后是不显著的,原因何在呢?然后就是,如果我选择没有控制年份、行业、地区的结果(用这个命令probit y x1 x2, r nolog)呈现,可以吗?
(3)在一些大论文里面,有些数据进行了处理,例如删除主营业务收入小于等于0,从业人数小于10等等,做了这些处理之后,并没有删除有些变量的缺漏值,按照这种做法最后做回归呈现出来的观测值可能不一样,但是为什么大家发的论文里面观测值都是一样的呢?
答案:
(1)不大明白你所描述的问题想要表达的意思。每一个命令都有它固定的语法结构,其中有一些部分是必不可少的,对于任意一个命令,例如,probit在Stata里面help probit,会显示该命令对应的语法结构:probit depvar[indepvars][if][in][weight] [,options] 。如果要在运行中不报错,其中probit depvar indepvars就是必不可少的,其余则是可有可无的。
(2)在加入某些控制变量之后原有解释变量系数估计的显著性水平发生变化有太多可能的原因。如果仅仅是从统计关系上考虑,系数大小或显著性发生变化意味着原解释变量和新加入的变量之间在统计上存在显著关系。应不应该加入年份、行业、地区固定效应取决于理论和计量模型因果推断的要求。如果有明确的理论告诉我们应该控制年份、行业、地区固定效应,或者如果我们有理由认为遗漏这些变量会导致内生性偏误,那么就应该控制。
(3)这个问题需要把具体提到的论文的数据处理过程做详细说明后才能判断。仅从现有的问题描述来看,可能是处理极值问题。有些论文做了极值处理,有些没有。如果一个面板数据极值较多,则应该用winsor命令处理一下。
学术指导:张晓峒老师
本期解答人:张川川老师
编辑:粥粥 小精灵 一个聪慧的人
统筹:芋头 易仰楠
技术:知我者
往期回顾
关于我们
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(版权声明:本文作者拥有完整版权,所有原创文章最早发表于“论文导向计量实证群”,欢迎转发分享,全文转载请注明出处,引用及合作请留言,任何侵权行为将面临追责)