Stata:缺失值填充-fillmissing-数值和文字的前后填充!
👇 连享会 · 推文导航 | www.lianxh.cn
🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量:回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题:SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具:工具软件 | Markdown | Python-R-Stata 🎧 课程:公开课-直播 | 计量专题 | 关于连享会
连享会视频课 · 因果推断实用计量方法
作者:初虹 (山东财经大学)
邮箱:ch2099058972@163.com
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
目录
1. Stata 中的缺失值
2. fillmissing 命令介绍
2.1 fillmissing 命令安装
2.2 fillmissing 命令语法
3. fillmissing 命令示例
4. 相关推文
1. Stata 中的缺失值
Stata 中的缺失值 (missing value) 是一个大于任何自然数的数,并以 .
呈现。其基础知识大致分为三部分:标记、查找/删除和补充。本文主要介绍 Stata 中功能较为全面的用以补充缺失值的第三方命令:fillmissing
。关于其他内容,可以移步下面的简要指引:
缺失值的标记:help mvdecode
缺失值的查找与删除
help missing
:Stata:让缺失值一览无余help misstable
:Stata:缺失值与多重补漏-misstable-D204help dropmiss
egen new = rmiss(a b c d)
描述性统计中的样本量与回归结果的样本量应保持一致,可以先回归,再 fsum varlist if e(sample)
补充缺失值
help mi
help carryforward
help tsfill
:Stata:缺失值的填充和补漏help ipolate
:Stata:缺失值的填充和补漏help twofold
:Stata:面板数据缺失值与多重补漏分析-twofoldhelp fillmissing
2. fillmissing 命令介绍
2.1 fillmissing 命令安装
ssc install fillmissing, replace
安装完成之后,可以 which fillmissing
查看 fillmissing
的安装位置和版本号等信息,具体使用方法可通过 help fillmissing
查看。
2.2 fillmissing 命令语法
[bysort varlist]: fillmissing varname [if] [in], [with(with_options)]
with(any)
:最好用来填充常量变量 (constant variable),因为会任意从非缺失值中填充缺失值。如果未指定 with_options,则作为默认值;with(previous)
:使用前面的值填充当前的缺失值。如果前面的值也缺失,则当前值保持缺失状态。另外,该选项并不对数据进行排序操作,因此无论当前数据的排序如何,填充都将使用当前的排序状态来标识当前缺失值和前面的观测值;with(next)
:与with(previous)
类似,使用后面的值填充当前的缺失值。如果后面的值也缺失,则当前值保持缺失状态。另外,该选项并不对数据进行排序操作,因此无论当前数据的排序如何,填充都将使用当前的排序状态来标识当前缺失值和后面的观测值;with(first)
:使用当前排序状态下的第一个值替换所有的缺失值。或者搭配bysort
,将使用每个组的第一个值;with(last)
:使用当前排序状态下的最后一个值替换所有的缺失值。或者搭配bysort
,将使用每个组的最后一个值;with(mean)
:使用非缺失值的平均值替换缺失值。变量类型只能为数值型 (numeric variable);with(median)
:使用非缺失值的中位数替换缺失值。变量类型只能为数值型 (numeric variable);with(min)
:使用非缺失值的最小值替换缺失值。变量类型只能为数值型 (numeric variable);with(max)
:使用非缺失值的最大值替换缺失值。变量类型只能为数值型 (numeric variable)。
3. fillmissing 命令示例
首先生成模拟数据。其中,数据分为两组,以 id 标识。变量 k 为数值型变量 (numeric variable)。
. clear all
. input id k
id k
1. 1 3
2. 1 5
3. 1 .
4. 1 .
5. 1 7
6. 2 .
7. 2 .
8. 2 4
9. 2 8
10. 2 .
11. end
下面的命令分别对应着 with_option
的几个选项,随后图片给出了每行命令的运行结果。
. bys id: fillmissing k, with(any)
. bys id: fillmissing k, with(previous)
. bys id: fillmissing k, with(next)
. bys id: fillmissing k, with(first)
. bys id: fillmissing k, with(last)
. bys id: fillmissing k, with(mean)
. bys id: fillmissing k, with(median)
. bys id: fillmissing k, with(min)
. bys id: fillmissing k, with(max)
通过图片可以很容易理解每个 with_option
选项的含义,此不再赘述。
4. 相关推文
Note:产生如下推文列表的 Stata 命令为:
lianxh 缺失值, m
安装最新版lianxh
命令:
ssc install lianxh, replace
专题:数据处理 Stata数据处理:缺失值与多重补漏分析(一) Stata数据处理:缺失值与多重补漏分析(二) Stata数据处理:缺失值与多重补漏分析(三) Stata:缺失值与多重补漏-misstable-D204 缺失值能否用零代替?-L117 Stata:让缺失值一览无余 Stata缺失值专题:多重补漏分析 Stata:缺失值的填充和补漏 专题:面板数据 Stata:面板数据缺失值与多重补漏分析-twofold
课程推荐:因果推断实用计量方法
主讲老师:邱嘉平教授
🍓 课程主页:https://gitee.com/lianxh/YGqjp
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。