查看原文
其他

Stata18之dtas——The new in data management

爬虫俱乐部 Stata and Python数据分析 2023-10-24

本文作者:李婷婷,河南大学经济学院

本文编辑:郭泽源

技术总编:方一卓

Stata and Python 数据分析

爬虫俱乐部Stata基础课程Stata进阶课程Python课程可在小鹅通平台查看,欢迎大家多多支持订阅!如需了解详情,可以通过课程链接(https://appbqiqpzi66527.h5.xiaoeknow.com/homepage/10)或课程二维码进行访问哦~

引言

        Stata18推出了一种新的数据文件格式——dtas。三个相应的新命令用来保存、调用和描述dtas文件。新命令frames save可以将多个框架的数据保存至一个指定的dtas文件,新命令frames use则用来调用dtas数据,新命令frames describe用来获得框架的描述性信息。


一、frames save : 保存.dtas文件


(1)使用语法:

frames save filename, frames(framelist) [options]
options:
frames(framelist): 指定需要保存的框架名称,框架名称之间使用空格分开。如果保存当前所有框架,则使用frame(_all)。
replace: 替换已存在的filename.dtas文件。
linked: 同时保存framelist中所连接的其它框架。如果框架A通过frlink连接到框架B,框架B又同样连接到框架C,那使用linked选项保存框架A就会同时保存框架B和C。
relaxed: 需要与linked选项一起使用,使Stata忽略掉因linked框架不存在而导致的报错。
complevel(#): 指定压缩级别,#可以是0-9中的整数,默认为1。complevel(0)表示不压缩。
nolabel: 忽略值标签。
orphans: 保存所有值标签。
emptyok: 指定允许保存空白框架。

(2)操作示例:

        首先,我们分别创建两个名为census和housing的框架存放1980 Census data by state和1980 Census housing data数据。

clear allframe create censusframe change censussysuse censusframe create housingframe change housingwebuse hsng

      使用frames save命令进行操作:frames save myframeset表示将多框架的数据保存至myframeset.dtas文件。指定frames(census housing)表示将census和housing框架保存为myframeset.dtas文件,指定frames(housing)表示只将housing框架保存至myframeset.dtas。

frames save myframeset, frames(census housing) replaceframes save myframeset, frames(housing) replace

      如果当前框架通过frlink连接到了其它框架,使用linked选项可以同时保存所连接的其它框架。

frlink 1:1 state, frame(census) frames save myframeset, frames(housing) linked replace

      frames save命令提供了返回值,比如r(complevel)、r(compsize)、r(fn)、r(frames)、r(first)等等。

*r(complevel):压缩级别,默认为1dis r(complevel) *r(fn):保存的.dtas文件的路径dis r(fn)*r(frames):保存的框架列表dis r(frames)





二、frame use : 调用.dtas文件


(1)使用语法:

frames use filename [, options]
options:

frames(framelist): 指定想要调用的框架。

clear: 清除内存中的框架数据。

replace: 替换内存中存在的同名称框架。

(2)操作示例:

        使用frames use命令调用myframeset.dtas文件。可以通过选项frames()指定想要调用的框架,如果不指定选项frames(),即调用所有框架。

frames use myframeset, clearframes use myframeset, frames(housing) clearframes use myframeset, frames(census housing) clear

frames use命令的返回值有r(fn)和r(frames),分别返回dtas文件的路径和调用的框架列表。




三、frame describe : 描述框架



(1)使用语法:

frames describe [varlist] [, memory_options]frames describe [varlist] using filename [, file_options]

memory_options:

frames(framelist):指定想要描述的框架。

simple:只展示变量名。

short:只展示基本信息(观测值个数、变量数量和排序方式)。

fullnames:不缩写变量名。

numbers:展示变量编号。


file_options:

frames(framelist):指定想要描述的框架。

simple: 只展示变量名。

short: 只展示基本信息(观测值个数、变量数量和排序方式)。

(2)操作示例:

        直接使用frames describe命令会分别得到内存中所有框架的描述信息。

clear framessysuse censusframe rename default censusframe create housingframe change housingwebuse hsngframes describe

      通过frame()和varlist选项可以指定框架名称和变量名称。如下给出housing框架中以pop开头的变量名的变量信息。

frames describe pop*, frame(housing)

        short选项指定只展示框架的基本信息,包括观测值个数、变量数量和排序方式。

frames describe, frames(housing) short

        simple选项指定只给出变量名信息。

frames describe, frames(housing) simple

frames describe命令的返回值包括r(frames)、r(first)、r(N)、r(k)等等,r(N)返回每个框架中观测值的个数,r(k)返回每个框架中的变量个数。

dis r(N)dis r(k)

以上是frames save、frames use和frames describe三个Stata18新命令的简单介绍,关于更多的详细内容,大家可以通过help命令或者https://www.stata.com/help.cgi?whatsnew17to18#NewSVY进行了解!

重磅福利!为了更好地服务各位同学的研究,爬虫俱乐部将在小鹅通平台上持续提供金融研究所需要的各类指标,包括上市公司十大股东、股价崩盘、投资效率、融资约束、企业避税、分析师跟踪、净资产收益率、资产回报率、国际四大审计、托宾Q值、第一大股东持股比例、账面市值比、沪深A股上市公司研究常用控制变量等一系列深加工数据,基于各交易所信息披露的数据利用Stata在实现数据实时更新的同时还将不断上线更多的数据指标。我们以最前沿的数据处理技术、最好的服务质量、最大的诚意望能助力大家的研究工作!相关数据链接,请大家访问:(https://appbqiqpzi66527.h5.xiaoeknow.com/homepage/10)或扫描二维码:

最后,我们为大家揭秘雪球网(https://xueqiu.com/)最新所展示的沪深证券和港股关注人数增长Top10。



对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!







往期推文推荐
定制属于自己的“贾维斯”——Python调用Chat
学会format,数据格式任你拿捏
【Python实战】游客最青睐的城市,你的家乡上榜了吗?

What’ new ? 速通Stata 18

【爬虫实战】Python爬取美食菜谱
揭秘网络中心人物,你会是其中之一吗?考研之后,文科生需以“do”躬“do”!焕新升级!轻松获取港股、权证的历史交易数据爬虫俱乐部的精彩答疑---cntraveltime【爬虫俱乐部新命令速递】在Stata中与ChatGPT对话

用`fs`命令批量获取文件夹和不同文件夹下的excel文件

自然语言处理之实例应用

JSON帮手,FeHelper

最新、最热门的命令这里都有!

Python实现微信自动回复告诉python,我想“狂飙”了——线程池与异步协程为爬虫提速高级函数——map()和reduce()

Stata绘制条形图的进阶用法

快来看看武汉的房价是不是又双叒叕涨了!Python 常见内置函数(二)
     关于我们 

   微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

   武汉字符串数据科技有限公司一直为广大用户提供数据采集和分析的服务工作,如果您有这方面的需求,请发邮件到statatraining@163.com,或者直接联系我们的数据中台总工程司海涛先生,电话:18203668525,wechat: super4ht。海涛先生曾长期在香港大学从事研究工作,现为知名985大学的博士生,爬虫俱乐部网络爬虫技术和正则表达式的课程负责人。



此外,欢迎大家踊跃投稿,介绍一些关于Stata和Python的数据处理和分析技巧。

投稿邮箱:statatraining@163.com投稿要求:1)必须原创,禁止抄袭;2)必须准确,详细,有例子,有截图;注意事项:1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。2)邮件请注明投稿,邮件名称为“投稿+推文名称”。3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存