查看原文
其他

连享会直播:Stata 数据清洗之实战操作

连享会 君泉计量 2023-10-24

1. 课程引导

数据清洗是论文写作过程中一个非常重要的步骤。不夸张地讲,完成一篇论文可能 70% 的时间都花在数据清洗上。

或许有人会说利用 Excel 也可以进行数据处理,如:取对数、求平均值等,但是对于一些复杂的操作,利用 Excel进行处理往往很困难,而且可重复性非常差。

大家或许都有这样的经历,论文初稿写作时利用 Excel 处理好数据 (^~^ 当时也觉得过程很清楚)。当论文返修时,审稿专家让更新数据或增加变量时,回头再看之前的数据处理过程经常一头雾水,工作量往往不亚于论文初稿写作时的数据处理。

例如:图 1 所示数据为多个国家多年数据,同时包含了多个指标。如何快速将其整理为图 2 所示面板数据形式

(图1)

(图2)

以往通常的做法是将每个指标另存为一个单独的 Excel 文件或者下载时就将每个指标单独下载,进而对每个数据文件进行处理,最后合并到一个文件中。然而,当需要使用的变量较多时,往往显得非常繁琐。

如果有这样的一个工具,当变换原始数据时,其他步骤只需要点击一个按钮就可以进行简单的重复,那么就可以做到事半功倍,这就是我们此次课程的目的。

Stata 为我们提供了这样一种工具,其在数据处理、模型估计与结果导出等方面功能非常丰富。

本次课程利用 Stata 对论文写作中常见的数据处理操作进行讲解,并主要以案例形式进行讲解,包括:

(1) 以世界银行数据库 WDI 为例,讲解如何快速将其整理为标准的面板数据格式;

(2) 利用多种方法进行单位根检验,并快速的输出结果;

(3) 编写结果输出函数,整理为带星号的形式。

上述案例将涉及到数据的横向合并和纵向追加、缺失值的处理、暂元、循环、postfile 使用及一些文字变量的处理。

本次课程遵循"以小见大"原则,通过实例讲解,能够覆盖绝大部分的常规数据处理方法。本讲例子主要展示跨国研究的数据处理方法,所涉及方法同样也适用于省份和城市层面的研究。此外,也可用于国泰安数据库和万德数据库等主要数据库的数据处理。


2. 课程概览

  • 听课方式: 网络直播。报名后安装客户端(软件下载地址:https://cdn.360drm.com/files/DHF_Student_v4.36.exe) 观看,支持手机、iPad、电脑等。

  • 直播嘉宾:游万海 老师 (福州大学)

  • 所用软件:Stata

  • 费用:88元

  • 时间:2020年7月21日,19:00-21:00

  • 课程咨询: 李老师-18636102467(微信同号)

  • 课程报名:

    方式一扫码支付

    温馨提示: 扫码支付后,请将「付款记录」截屏发给李老师-18636102467(微信同号)

    方式二扫码报名



3. 课程提要

  • 不同格式数据文件的列举、重命名与合并
  • Excel 文件中多个 sheet 文件操作
  • 变量列举与批量重命名
  • 局部宏与全局宏 (local and global)
  • 常用的宏扩展函数
  • Stata 中循环语句 (forvalues, foreach)
  • 横向合并与纵向追加、关键词的统一
  • 案例讲解

4. 课程特色

  • 短小精悍:通过案例讲解掌握常用的数据清洗方法。
  • 讲义程序:分享电子版课件(数据和程序),课程
    中的数据清洗方法可以应用于自己的论文中。
  • 课后答疑:课程结束后,授课老师将提供问题解答。

5. 嘉宾简介

游万海,管理学博士,福州大学经济与管理学院教师,主要研究领域为空间计量模型、分位数回归模型及应用,以在  World Development, Energy Economics, Economics Letters, Journal of Cleaner Product, 统计研究等期刊发表 30 余篇论文。担任 Energy Economics, Economic Modelling 等期刊匿名审稿人。游老师讲授的「文本分析与爬虫专题」 受到了学员的一致好评。


5. 相关资料

预习资料: 连享会公开课 - Stata33 讲

33讲课程链接:https://lianxh.duanshu.com/#/brief/course/b22b17ee02c24015ae759478697df2a0:

进阶内容: Stata暑期班 对暂元、循环语句、数据合并等会有进一步的讲解


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存