重磅!Stata 16 正式发布:新增16+项主要功能特征详细介绍
The following article is from 数量经济学 Author 数量经济学
导读:据悉,2019年6月26日,stata官网正式推出Stata 16。详情可以点击进入stata.com/new-in-stata了解。stata16是一个重大版本更新,好像stata每个版本更新都是这样。stata16更新内容从lasso到Python,从内存中的多个数据集到贝叶斯分析中的多个链。重点如下。
stata16功能特征目录
Lasso
Import from SAS and SPSS
Do-file Editor autocomple
Mac interface
Stata for Mac: Dark Mode and tabbed windows
Python integration
Reproducible reporting
Multiple datasets in memory
Choice models
xtheckman
Stata in Korean
Point sizes for graphics
Meta-analysis
Heteroskedastic ordered probit
Panel-data ERMs
Panel-data mixed logit
Bayes—multiple chains, more
Nonparametric series regression
Sample-size analysis for CIs
Nonlinear DSGE models
Multiple-group IRT
NLMEMs with lags: PK models
Numerical integration
Linear programming
Set matsize obviated
1
Importing of SAS and SPSS dataset从SAS与SPSS中导入数据
从各个软件之间相互可以导入数据,互相兼容已经成为计量经济学软件的一个趋势,小编发现spss24.0版本已经可以实现从spss中导入stata以及sas格式的数据,并且从spss中导入stata格式的数据,各方面的数据结构类型都还可以,不会出现问题。
任何研究项目的首要任务之一都是读取数据。
stata16导入spss本要求如下:
允许我们将SPSS文件(版本16或更高)和压缩的IBM spss文件(版本21或更高)导入Stata。即:New command import spss imports IBM SPSS version 16 or higher .sav and .zsav files.
导入类型:可以导入整个数据集,也可以只导入其中的一个子集,日期、值标签和缺失的值
菜单操作步骤:点击文件> Import > SPSS data (*.sav)打开对话框,将其导入Stata。我们选择GSS2018.sav数据集
语法命令如下:
import spss CONARMY CONBIZ CONCONG CONCOURT using GSS2018, case(lower)
其中import spss成为主命令,CONARMY CONBIZ CONCONG CONCOURT表示变量 using省略掉了路径, GSS2018为导入的数据名称。
stata16导入SAS版本要求:导入sas允许我们从版本7或更高版本导入sas数据到Stata。
导入类型:我们可以导入整个数据集,也可以只导入其中的一个子集。使用导入sas,我们还可以导入值标签。日期、值标签和丢失的值都被正确地从SAS格式转换为Stata格式。
菜单操作步骤:File > Import > SAS data (*.sas7bdat).
命令为:
import sas ACCESS BROADBND COMPOTHX DIALUP HISPEED LAPTOP using psam_h09.sas7bdat", case(lower)
接下来可以进行描述统计分析,命令为:describe
2
Do-file Editor: Autocompletion and more.
stata的Do-file编辑器为Stata提供了语法高亮显示。它仍然如此。在Stata 16中,它还为Python和Markdown提供语法高亮显示。stata16的Do-file编辑器有自动完成功能。编辑器自动完成文档中已经存在的单词、自动完成Stata命令、自动完成引号、圆括号、大括号和方括号。 最后但并非最不重要的是,现在可以使用空格和制表符进行缩进。Stata的Do-file编辑器创建和编辑文本文件。下面是一个自动完成和语法高亮显示的例子:
由于stata的dofile已经能够实现选中某一行部分,然后就全部执行,所以这块更新已经在matlab2013等版本之上了,matlab2013需要选中全部语法命令才可以执行。
3
苹果系统界面更新Dark Mode and tabbed windows for Mac颜色背景变化以及tab键切换窗口
mac版本中目前可以在界面中呈现如下背景颜色:使背景窗口和控件变暗的配色方案,这样大家就可以专心处理手头的工作文件了。
Stata有很多窗口,包括:
结果中出现Stata输出窗口
Do-file Editor用于编辑文本文件
浏览或编辑数据
数据编辑器
图形出现并编辑它们的地方
查看器中出现的帮助文件和列表文件
当很多窗户都开着的时候,你可以把它们推开。或者,您现在可以将这些窗口放在一起。按Tab键一次只显示一个。单击选项卡,更改窗口。把它们放在一起,或者只是其中的一部分。您可以在一个窗口中看到所有选项卡的概览。当屏幕空间有限(比如笔记本电脑)时,选项卡窗口是一个不错的选择。下面是一个选项卡窗口的例子:
4
Python integration
在Stata 16中,可以执行Python代码啦。
Stata的新python命令提供了一组子命令,允许您轻松地从Stata调用python并在Stata中输出python结果。您可以交互式地调用Python,或者在do-files中调用Python,以便利用Python的广泛语言特性。
还可以通过Stata直接执行Python脚本文件(.py)。
Stata从python2.7开始支持python2和python3。您可以从Stata中选择绑定到哪一个。让我们看看它是如何工作的 第一次在Stata中调用python时,Stata将搜索系统上的python安装,并选择最高版本。一旦Stata找到具有最高版本的候选程序,它将保存该信息以便将来使用。然后,您可以在Stata中开始您的Python之旅。
例如在python中安装Matplotlib、sklearn和NumPy包。从Stata调用Matplotlib的讨论,请参阅使用Matplotlib from Stata。
具体可以出来如下图:
5
Reproducible reporting
Create Word, HTML, PDF, and Excel files with Stata results and graphs. 生成Word以及 HTML, PDF, and Excel 等文档
Stata可以生成Word、Excel、PDF和HTML等格式的文档,用于创建报告的命令有两种:动态文档的命令:这些命令创建包含来自Stata命令的完整输出的文本文件、HTML文件和Word文档。您可以使用Markdown文本格式语言自定义报表的外观。put开头的命令,包括 putdocx、putpdf和putexcel,这些命令创建Word文档、pdf和Excel文件,将Stata命令的结果插入到文档中的格式化文本和表中。
dyndoc和markdown命令现在除了之前创建的HTML文档之外,还创建Word文档。现在,您可以轻松地将完整的Stata输出和带有标记格式文本的图形合并到一起,以创建定制的Word文档。
Do-file编辑器现在为Markdown语言元素提供语法高亮显示。
putdocx命令现在允许您包含标题、页脚和页码。它还使编写大块文本变得更容易。
html2docx命令将HTML文档(包括CSS)转换为Word文档。
docx2pdf命令将Word文档转换为pdf。
6
Data frames: multiple datasets in memory
Stata 16 可以同时调用多个数据集,原始情况下,内存中的数据集存储在帧中,并对帧进行命名。当Stata启动时,它会创建一个名为default的框架,但它没有什么特殊之处,这个名称也没有什么特殊或秘密的含义。
你可以通过重命名、创建新的名称或框架,删除它们来进行数据集的切换等。
案例介绍1:
frame create interruption . 新建
frame change interruption .
use another_dataset .然后你可以切换到另外一个数据集
***
***
***
这部分表示你可以进行相关操作
frame change default . 切换
frame drop interruption删除
案例2:直接使用frame进行数据copy,来进行数据相关分析。例如进行回归分析,需要改变原始数据中的性别,需要将男性被记录为女性,女性被记录为男性,根据更改后的数据获得y,而且始终不改变数据。
相关命令为:
regress income i.sex##(i.ed c.age##c.age) i.occ.
frame copy default new.
frame new { replace sex = !sex // reverse the sexes
predict pincome }.
generate alt_income = _frget(new, pincome, _n).
frame drop new
7
Choice Models
为什么需要使用选择模型?
生活中我们一直面临着做出选择。例如: 个人选择他们最喜欢的早餐麦片, 公司选择是使用电视、在线广告还是平面广告?
旅行者可以选择坐汽车、飞机还是火车?
使用选择模型,您可以分析这些选择与影响它们的变量之间的关系。
Stata 16为解决上述二值选择模型或者多值选择模型等离散选择模型引入了一套新的、统一的特性。
新命令易于使用,并且它们提供了最强大的工具来解释选择模型结果。
要开始进行任何选择模型分析,首先要对数据进行cmset,这个命令与tsset以及面板数据的xtset后面的set是保持一致的。例如:cmset id ravelmode
接下来可以使用 cmsummarize, cmchoiceset, cmtab, and cmsample来对数据进行explore, summarize等描述统计或者探索性分析。
cmclogit----- conditional logit (McFadden's choice) model
cmmixlogit -----mixed logit model
cmxtmixlogit----- panel-data mixed logit model
cmmprobit----- multinomial probit model
cmroprobit----- rank-ordered probit model
cmrologit -----rank-ordered logit model
其中cmxtmixlogit is another new feature of Stata 16. It fits mixed logit models for panel data。
案例介绍:
cmset id mode
cmtab, choice(chosen)
cmsummarize income, choice(chosen)
cmclogit chosen time, casevars(income partysize)
8
Extended regression models for panel-data/multilevel models
Stata推出的ERM(Extended Regression Models)模块现在支持面板数据。
通常,我们对连续结果进行线性回归和区间回归,对二元结果进行probit,对有序结果进行有序probit。
而ERM(Extended Regression Models)模块可处理endogenous and exogenous sample selection(内生性和样本选择模型), endogenous covariates (unobserved confounders), and nonrandom treatment assignment(处理效应)。
具体处理模型如下:
Endogenous and exogenous sample selection
Trials with informative dropout
Outcomes missing not at random (MNAR)
Nonignorable nonresponse
Selection on unobservables
Heckman selection
Endogenous covariates (unobserved confounders)
Bias due to unmeasured confounding
Simultaneous causality in linear models
Measurement error
Causal inference
Nonrandom treatment assignment
Causal inference
Average causal effects (ACEs)
Average treatment effects (ATEs)
Panel data
Longitudinal data
Two-level multilevel data
案例介绍:
9
xtheckman
xtheckman使得 样本选择模型(sample model)可以在面板数据中进行操作。
原版本heckman语法格式为:
Basic syntax
heckman depvar [indepvars], select(varlist_s) [twostep]
or
heckman depvar [indepvars], select(depvar_s = varlist_s) [twostep]
新命令语法格式如下:
xtheckman income c.age##c.age i.training#(c.exp##c.exp), select(working = age exp i.region i.training)
结果为:
10
Stata in Korean
如果您的计算机语言设置为韩语, Stata将自动使用其韩语设置。要使用Windows或Unix手动更改语言,请选择Edit > Preferences >用户界面语言…使用Mac,选择Stata 16 > Preferences >用户界面语言…还可以使用set locale_ui命令更改语言。
11
Point sizes for graphics
在stata16中,现在可以用打印机点、英寸和厘米指定图形元素的大小。只需为大小添加一个单位后缀:pt表示打印机点,in表示英寸,cm表示厘米,rs表示相对大小。
命令语法格式为:
scatter mpg weight, title("Gas mileage by weight", size(16pt))
scatter mpg weight, title("Gas mileage by weight", size(.5cm))
scatter mpg weight, msize(8pt)
scatter mpg weight, msize(0.1in)
12
Meta-analysis
以前版本中Stata就可以进行meta分析。Stata现在提供了新的命令集meta来执行meta分析。新套件很广泛,但它的优点之一是简单。
主要步骤分为:
1. Prepare your data for meta-analysis
2. Obtain meta-analysis summary
3. Explore heterogeneity
4. Investigate small-study effects and publication bias
13
New in Bayesian analysis
stata 16为Bayesian命令集提供了广泛的补充,其中包括Multiple chains 、Gelman–Rubin convergence diagnostics 、Bayesian predictions 、Posterior summaries of simulated values、 MCMC replicates 、Posterior predictive p-values等
14
Heteroskedastic ordered probit models
例如新命令为:hetoprobit health age bmi i.exercise, het(age)
15
Lasso
由于机器学习、统计数据、计量经济学的发展需要,Stata的新套索工具可以让你从海量的数据中提取真实的特征。
主要功能如下:
Predict outcomes
Characterize groups and patterns in your data
Search over highly nonlinear potential relationships
Perform inference on covariates of interest Handle endogenous covariates or unobserved confounders
16
stata15来了,sttaa16也来了,你还不会stata吗?
为了帮助大家全面系统的掌握stata,我们在一贯坚持高水平授课办会的基础上,特别打造“小班教学、理论与软件并重、精品课程解析”的课程培训亮点,现推出2019暑假学术提升计划!
第十一届Stata暑假研讨班北京专场,时间:2019年7月20日-7月23日(四天)
地点:北京陶然花园酒店会议室
仅剩25席位,欲报从速!
第十二届Stata暑假研讨班广州专场,时间:2019年8月3日-8月6日(四天)
地点:广州珠海特区大酒店
这份学习计划里面包含了stata初高级内容,包括数据管理、面板数据、倾向匹配得分、合成控制法、门限回归、空间计量等众多专题内容……
全部自带电脑,手把手教学,带你快速进阶计量经济学达人!
截至目前,计量经济学服务中心已经在西安、北京、上海、深圳等地成功举办了11场stata初高级班,全国300余所高校的青年教师、硕士研究生、博士研究生、高年级本科生参加过我们组织的计量经济学系列研讨会。
1
学习优势
计量经济学服务中心团队成员精耕细作,紧跟stata前沿,各种操作以及学习内容均不断升级!重软件操作、重实战是课程一直以来的优势与好评。控制人数的小班教学以确保每一位学员真正学到操作技能。
重要的事情说三遍,我们课程全部带电脑,并提供完整do文档以及数据、讲义、资料书等,手把手教学和操作学习!
学员福利:一次报名,终身服务,全年不限次数线下免费学(包括但不限于中心举办的其他研讨班和学术会议、论坛等),学完之后并有老师答疑解惑。
ps:国内计量经济学理论方法学习很多均建立在Eviews软件上(stata书籍对理论方法等介绍的少),本次课程在横截面、时间序列、面板、门限等众多章节均穿插着简要介绍Eviews软件应用,帮助大家站在学习者的角度和路线全面构建起计量经济学框架和模型思路。
2
课程大纲
授课时间:
北京:2019年7月20日-7月23日(四天)
广州:2019年8月3日-8月6日(四天)
本次课程一共十五讲,包括数据管理、面板数据、倾向匹配得分、合成控制法、门限回归、空间计量等众多专题内容……课程目录如下:
Class 1. A Quick Tour of Stata
stata简介Why Stata?/what is stata
软件界面The Stata Interface/What Stata looks like
参考书籍推荐Textbooks
log工作日志和do文档What to do first?Set a working directory/Keeping track of things(Do-files and log-files )
命令以及帮助the command & Getting Help(包括help的使用以及ssc install 、findit等外部命令获取和使用)
Class 2. DATABASE MANIPULATION数据管理
导入导出 Import and Export
面板数据、时间数据、官方数据Time series data &Panel data & Example Datasets
变量以及数据Variable and data types/Indicator or data variables
数据管理Data management
排序Order, aorder, and move
变量标签Variable Labels and Notes
数据转换Converting strings to numerics and vice versa(encode decode destring tostring 等)
数据横向合并和纵向合并Append and merge
数据生成Generating new variables
描述分析Describing the data (summarize)
descibe inspect
Getting a codebook
基础命令Basic commands(table tabulate)
tabstat命令
CSMAR及中经网数据库复杂的使用技巧
Class 3&4. 相关分析Correlation analysis & 回归分析Estimation
Class 5. 时间序列
平稳性检验
协整检验
格兰杰检验
Class 6&7. 静态面板与动态面板数据
面板数据描述性分析
面板数据平稳性检验
静态面板数据回归分析:随机效应模型和固定效应模型、Hausman检验
动态面板模型
Class 8. 门限回归
包括横截面与面板模型的门限回归,主讲xthreg和xtthres等命令,并与Eviews软件对比,让大家对门限回归有一个全面的了解。
门限回归理论介绍
门限回归操作流程图
门限回归操作以及结果解释等
论文讲解以及课程总结
Class 9. 内生性问题专题I:倾向匹配得分
倾向匹配得分简介、为何使用 PSM ?、传统的配对方法、配对过程中的两个核心问题、匹配方法、优缺点、
倾向匹配得分建模流程图
PSM操作命令及其具体应用
论文讲解
课程总结
Class 10. 内生性问题专题II:合成控制法
Class 11. 内生性问题专题III:断点回归分析
Class 12. 结果输出Extracting results
Post summary statistics(summarize、tabstat)
Post correlation coefficients (pwcorr、correlate、logout )
Coefficients/equations
Basic syntax and usage
estout、esttab、estadd and other useful Stata commands
Standard errors, p-values, and summary statistics
Use with Word/Rtf/Excel/LaTeX
Other Advanced Examples(esttab、outreg2、logout等)
Class 13 . stata新工具——do文档编程与输入法结合
Class 14. 论文写作专题(从源头数据处理到分析)
Class 15. 横截面空间计量模型与面板空间模型(包括空间自相关检验、空间效应检验、SAR、SEM模型以及空间面板随机与固定效应检验等)
空间计量发展概述
空间回归模型动因
空间效应
空间权重矩阵
空间相关性度量
空间计量模型简介、流程图、识别检验、判别准则等
横截面空间计量模型及stata应用
面板空间计量模型及stata应用(面板固定效应与随机效应等检验)
3
课程详情
会议时间及地点:
北京:2019年7月20日-7月23日(四天)
地点:北京陶然花园酒店会议室
广州:2019年8月3日-8月6日(四天)
地点:广州珠海特区大酒店
会议费用:普通价:4000元,学生价:3600元(凭学生证优惠价),差旅及住宿费用自理。
会议安排:上午9:00-12:00;下午2:00-5:00;答疑5:00-5:30
授课形式:老师讲授指导、学员操作练习、现场答疑解惑。
会议人数:中心非常重视与学员互动以及软件操作,为保证学习效果,限额50人。
课程资料:提供PPT、课程讲义以及完整的do文档等。
(名额有限,先下手为强)
4
优惠信息
缴费成功后都享受如下优惠
1.同一单位3人以上报名,9折优惠;
2.同一单位5人以上报名,8折优惠(前2项优惠不能叠加)
3、根据报名缴费顺序安排现场座位。
4、往期报名参加过2018年大数据与计量经济学发展论坛的人员单报也可以享受9折优惠。
5
学习目标
1、掌握计量经济学及Stata操作,能够运用Stata完成复杂的数据处理工作,并熟练运用Stata完成写作;
2、了解常用模型的思路、原理和建模方法,从源头数据库等数据下载、搜集、整理、管理,到stata数据操作,培养数据分析能力;
3、通过中心精心准备的do文档讲义来完成学习,并实现do文档中现成命令的可复制性(只需要修改部分do文档命令的变量,就可以一键实现数据分析和数据管理的结果,具有复制性)(中心紧跟前沿,do文档实时更新,能够处理各种复杂数据分析)
6
学习对象
经济及社科类青年教师、博士生、硕士生、高年级本科生。(1 Stata爱好学习者。2 经济管理以及人文社科领域人员、各类市场调查公司、咨询公司、互联网公司和科研机构需要进行数据处理的人士。)
7
报名咨询方式
报名流程
1、电话咨询,给予反馈,确认报名信息,报名成功与否以是否付款为准(定金也算),不接受口头报名。
2、交费(微信、支付宝或者对公转账等),报名前请确认信息。
3、开课前一周发送培训教室路线图以及软件准备,电子版预习资料。
4、现场领取发票及邀请函。
相关单位:
主办方:计量经济学服务中心
协办方:陕西经纶教育科技有限公司
西安造梦信息技术有限公司
有需要现场刷公务卡的,可以提前预交定金300元,现场刷卡再全额退还或者补齐会务费。
8
注意事项
1、请学员自带笔记本电脑,并自行安装stata软件。
2、本通知发布后即可报名。
3、如您报名后有事不能参加,请及时告知!2019年5月30日17:00之后不再接受退费,但可以转其他时间段下次免费学习。
4、本次会议可提供增值税普通发票,如需开具(请联系微信:Xindream1992),并根据自己单位财务部门要求填写抬头和类目信息(一旦开具不能重开),发票类目为:会议服务费、信息服务费、培训费、会议费、咨询费等,报名时可以直接任选其一,其他类目无法开具。
5、会议邀请函通知及报名咨询等直接联系王老师。
在线咨询:
王老师
电话:18710973211
微信:Xindream1992
扫码添加微信