summtab: 列表呈现基本统计量
作者:何庆红(北京大学中国卫生经济研究中心)
连享会:(知乎 | 简书 | 码云 | CSDN)
特别说明
文中包含的链接在微信中无法生效。请点击本文底部左下角的【阅读原文】
,转入本文【知乎版】
。
今天我们介绍一个外部命令 summtab
,用于连续变量和类别变量的基本描述性统计分析,一方面可用 putdocx
命令将结果输出到Word文档中,另一方面还可以使用 putexcel
将结果输出到 Excel 文档中。
它的优点是可以在 Word 或 Excel 里生成格式优美、发布质量良好的表格。
summtab
只能在 Stata 15 以上版本中运行。
1.下载安装
ssc install summtab, replace
2. 语法格式
summtab [if] [in], cont_vars(varlist) cat_vars(varlist) [by(varname) {other options}]
必选项
by(varname)
定义统计描述的分组变量,若不限定变量,则默认整体统计量cat_vars(varlist)
表示类别变量cont_vars(varlist)
表示连续变量统计量的设定
mean
显示连续变量的均值和标准误median
显示连续变量的中位数和分位数,如25th
、75th
等range
显示连续变量的最小值和最大值pnonmiss
在单独一行中显示连续变量的非缺失样本总数和%比例rowperc
表示为分类变量提供行百分比,而不是(默认的)列百分比incmiss
显示分类变量缺失值P-Value 的设定
pval
表示 P 值cont_ptype(integer)
表示连续变量的P值cat_ptype(integer)
表示分类变量的P值显示格式的设定
mnfmt(integer)
表示均值和标准误的小数点位数,默认是两位,最大是八位medfmt(integer)
表示中位数和分位数的小数点位数,默认是一位,最大是八位rangefmt(integer)
表示最大值和最小值的小数点位数,默认是一位,最大是八位pnonmissfmt(integer)
表示非缺失值比例的小数点位数,默认是一位,最大是八位catfmt(integer)
表示分类变量比例的小数点位数,默认是一位,最大是八位pfmt(integer)
表示P值的小数点位数,默认是三位,最大是八位结果输出
directory(string)
表示输出结果存储的位置,默认是当前路径title(string)
表示表格标题word
表示结果输出到word格式,wordname(string)
表示word名称,默认是table1excel
表示结果输出到excel格式,excelname(string)
表示excel名称,默认是table1replace
表示输出结果在excel格式或word格式之间替换
3. 应用举例
下面以输出到 Excel 为例,展示效果:
webuse lbw3.dta
summtab, cont_vars(price mpg weight length) ///
cat_vars(foreign rep78) ///
excel excelname(summary_table1) ///
title(My Table 1) ///
mean median replace
其中,连续变量是 price mpg weight length,统计量包括 mean
(均值和标准误)、median
(中位数);类别变量是 rep78;统计量描述是针对所有样本。
summtab, by(foreign) ///
cont_vars(price mpg weight length) ///
cat_vars(rep78) mean median total ///
title(My Table 2) excel ///
excelname(summary_table2) replace
其中,连续变量是 price mpg weight length,统计量包括mean
(均值和标准误)、median
(中位数);类别变量是 rep78;根据 foreign 变量,将样本分为两类(domestic
和 foreign
)进行描述统计
summtab, by(foreign) ///
cont_vars(price mpg weight length) ///
cat_vars(rep78) mean median range ///
total medfmt(1) mnfmt(2) ///
excel excelname(summary_table3) title(My Table 3) replace
其中,连续变量是 price mpg weight length,统计量包括mean
(均值和标准误)、median
(中位数)、range
(最大最小值),median
(中位数)保留一位小数点medfmt(1)
,mean
(均值和标准误)保留两位小数点 mnfmt(2)
;类别变量是rep78
;根据 foreign 变量,将样本分为两类(domestic
和 foreign
)进行描述统计
4. 其他相关命令
table
命令:主要是用来做列表统计,尤其对于类别变量的统计,优点是可用于汇报三维等以上维度表格,具体可参看[Stata:今天你 “table” 了吗?]summarize
命令:主要用于一维列表的相关统计量的计算fsum
命令:主要用于一维列表的相关统计量的计算,优点是命令简洁,支持用户设置的变量标签输出,目前运用较多baselinetab
命令:主要用于一维列表和二维列表的相关统计量的计算,优点是表格内容可以转换成数据、文本、网页等格式
5. 结果输出和呈现相关推文
Stata新命令:Export tabulation results to Excel
6. 参考资料
https://www.statalist.org/forums/forum/general-stata-discussion/general/1402412
Nicholas J. Cox, 2003, Speaking Stata: Problems with Tables, Part I, Stata Journal, 3(3): 309–324. [pdf]
Nicholas J. Cox, 2003, Speaking Stata: Problems with Tables, Part II, Stata Journal, 3(4): 420–439. [pdf]
Ben Jann, 2005, Making Regression Tables from Stored Estimates, Stata Journal, 5(3): 288–308. [pdf]
Ben Jann, 2007, Making Regression Tables Simplified, Stata Journal, 7(2): 227–244. [pdf]
Michael Lokshin, Zurab Sajaia, 2008, Creating Print-ready Tables in Stata, Stata Journal, 8(3): 374–389. [pdf]
John Luke Gallup, 2012, A New System for Formatting Estimation Tables, Stata Journal, 12(1): 3–28. [pdf]
Lauren J. Scott, Chris A. Rogers, 2015, Creating Summary Tables Using the Sumtable Command, Stata Journal, 15(3): 775–783. [pdf]
Susan Donath, 2018, Baselinetable: A Command for Creating one- and Two-way Tables of Summary Statistics, Stata Journal, 18(2): 327–344. [pdf]
Susan Donath, 2018, Baselinetable: A Command for Creating one- and Two-way Tables of Summary Statistics, Stata Journal, 18(2): 327–344. [pdf]
关于我们
【Stata 连享会(公众号:StataChina)】由中山大学连玉君老师团队创办,旨在定期与大家分享 Stata 应用的各种经验和技巧。
公众号推文同步发布于 CSDN-Stata连享会 、简书-Stata连享会 和 知乎-连玉君Stata专栏。可以在上述网站中搜索关键词
Stata
或Stata连享会
后关注我们。点击推文底部【阅读原文】可以查看推文中的链接并下载相关资料。
Stata连享会 精彩推文1 || 精彩推文2
联系我们
欢迎赐稿: 欢迎将您的文章或笔记投稿至
Stata连享会(公众号: StataChina)
,我们会保留您的署名;录用稿件达五篇
以上,即可免费获得 Stata 现场培训 (初级或高级选其一) 资格。意见和资料: 欢迎您的宝贵意见,您也可以来信索取推文中提及的程序和数据。
招募英才: 欢迎加入我们的团队,一起学习 Stata。合作编辑或撰写稿件五篇以上,即可免费获得 Stata 现场培训 (初级或高级选其一) 资格。
联系邮件: StataChina@163.com
往期精彩推文