【命令1】:导入数据
一般做实证分析使用的是excel中的数据,其后缀名为.xls,需要将其修改为.csv
insheet using name.csv, clear
【命令2】:删除重复变量
sort var1 var2
duplicatesdrop var1 var2, force
【命令3】:合并数据
use data1, clear
merge m:m var1 var2 using data2
drop if _merge==2
drop if _merge==1
drop _merge
【命令4】:描述性统计分析
tabstat var1var2, stat(n min mean median p25 p75 max sd), if groupvar==0 or 1
输出到word中:
logout, save(name) word replace: tabstat var, stat(n min mean p50 max sd) col(stat)f(%9.2g)
【命令5】:结果输出
安装
ssc install estout, replace
单个回归
reg y x
esttab using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)
多个回归一起
reg y x1
est store m1
reg y x2
est store m2
esttab m1 m2 using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)
【命令6】 生成虚拟变量
tab year, gen(year)
tab industry, gen(industry)
【命令7】 数据缩尾处理
findit winsor2
之后安装
winsor2 varname, replace cut(1 99)
【命令8】异方差检验
怀特检验
ssc install whitetst
reg y x1 x2
estat imtest, white
处理:“OLS+稳健标准差”
reg y x1 x2 x3, robust
【命令9】 DW检验
gen id=_n
tsset id
estat dwatson
【命令10】 计算两个日期之间的间隔天数
gen td=date(trading_date,'YMD')
gen ed=date(eventdate,'YMD')
form td ed %td
gen d=ed-td
【命令11 】 生成滞后、差分数据
tsset code year
gen newvarname=l.varname
gen newvarname=d.varname
【命令12】多重共线检验之方差膨胀因子
reg y x1 x2 x3
vif
【命令13】多重共线修正之逐步回归
stepwise, pe(0.1): reg y x
【命令14】检验是否遗漏高次项
reg y x
estat ovtest
或者estat ovtest, rhs
【命令15】 样本检验
两样本均值T检验
ttest var, by(groupvar)
两样本中位数Z检验
ranksum var, by(groupvar)