查看原文
其他

Stata:缺失值填充-fillmissing-数值和文字的前后填充!

连享会 连享会 2023-10-24

👇 连享会 · 推文导航 | www.lianxh.cn

连享会视频课 · 因果推断实用计量方法

作者:初虹 (山东财经大学)
邮箱:ch2099058972@163.com

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:


目录

  • 1. Stata 中的缺失值

  • 2. fillmissing 命令介绍

    • 2.1 fillmissing 命令安装

    • 2.2 fillmissing 命令语法

  • 3. fillmissing 命令示例

  • 4. 相关推文



1. Stata 中的缺失值

Stata 中的缺失值 (missing value) 是一个大于任何自然数的数,并以 . 呈现。其基础知识大致分为三部分:标记、查找/删除和补充。本文主要介绍 Stata 中功能较为全面的用以补充缺失值的第三方命令:fillmissing。关于其他内容,可以移步下面的简要指引:

缺失值的标记:help mvdecode

缺失值的查找与删除

  • help missingStata:让缺失值一‍览无余
  • help misstableStata:缺失值与多重补漏-misstable-D204
  • help dropmiss
  • egen new = rmiss(a b c d)
  • 描述性统计中的样本量与回归结果的样本量应保持一致,可以先回归,再 fsum varlist if e(sample)

补充缺失值

2. fillmissing 命令介绍

2.1 fillmissing 命令安装

ssc install fillmissing, replace

安装完成之后,可以 which fillmissing 查看 fillmissing 的安装位置和版本号等信息,具体使用方法可通过 help fillmissing 查看。

2.2 fillmissing 命令语法

[bysort varlist]: fillmissing varname [if] [in], [with(with_options)]
  • with(any):最好用来填充常量变量 (constant variable),因为会任意从非缺失值中填充缺失值。如果未指定 with_options,则作为默认值;
  • with(previous):使用前面的值填充当前的缺失值。如果前面的值也缺失,则当前值保持缺失状态。另外,该选项并不对数据进行排序操作,因此无论当前数据的排序如何,填充都将使用当前的排序状态来标识当前缺失值和前面的观测值;
  • with(next):与 with(previous) 类似,使用后面的值填充当前的缺失值。如果后面的值也缺失,则当前值保持缺失状态。另外,该选项并不对数据进行排序操作,因此无论当前数据的排序如何,填充都将使用当前的排序状态来标识当前缺失值和后面的观测值;
  • with(first):使用当前排序状态下的第一个值替换所有的缺失值。或者搭配 bysort,将使用每个组的第一个值;
  • with(last):使用当前排序状态下的最后一个值替换所有的缺失值。或者搭配 bysort,将使用每个组的最后一个值;
  • with(mean):使用非缺失值的平均值替换缺失值。变量类型只能为数值型 (numeric variable);
  • with(median):使用非缺失值的中位数替换缺失值。变量类型只能为数值型 (numeric variable);
  • with(min):使用非缺失值的最小值替换缺失值。变量类型只能为数值型 (numeric variable);
  • with(max):使用非缺失值的最大值替换缺失值。变量类型只能为数值型 (numeric variable)。

3. fillmissing 命令示例

首先生成模拟数据。其中,数据分为两组,以 id 标识。变量 k 为数值型变量 (numeric variable)。

. clear all
. input id k
id k
1. 1 3
2. 1 5
3. 1 .
4. 1 .
5. 1 7
6. 2 .
7. 2 .
8. 2 4
9. 2 8
10. 2 .
11. end

下面的命令分别对应着 with_option 的几个选项,随后图片给出了每行命令的运行结果。

. bys id: fillmissing k, with(any)
. bys id: fillmissing k, with(previous)
. bys id: fillmissing k, with(next)
. bys id: fillmissing k, with(first)
. bys id: fillmissing k, with(last)
. bys id: fillmissing k, with(mean)
. bys id: fillmissing k, with(median)
. bys id: fillmissing k, with(min)
. bys id: fillmissing k, with(max)

通过图片可以很容易理解每个 with_option 选项的含义,此不再赘述。

4. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 缺失值, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

  • 专题:数据处理
    • Stata数据处理:缺失值与多重补漏分析(一)
    • Stata数据处理:缺失值与多重补漏分析(二)
    • Stata数据处理:缺失值与多重补漏分析(三)
    • Stata:缺失值与多重补漏-misstable-D204
    • 缺失值能否用零代替?-L117
    • Stata:让缺失值一览无余
    • Stata缺失值专题:多重补漏分析
    • Stata:缺失值的填充和补漏
  • 专题:面板数据
    • Stata:面板数据缺失值与多重补漏分析-twofold

课程推荐:因果推断实用计量方法
主讲老师:邱嘉平教授
🍓 课程主页https://gitee.com/lianxh/YGqjp

New! Stata 搜索神器:lianxhsongbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉  使用:
. lianxh DID 倍分法
. songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存