查看原文
其他

用RStudio导入数据

2017-09-21 师爷 R语言中文社区

作者:师爷,R语言中文社区作者,

知乎专栏:

https://zhuanlan.zhihu.com/rstudio


简介

向R中导入数据是数据分析的必经之路,通常是非常令人烦躁的。为了简化过程,RStudio提供了一个简化模式,不用写代码,哈。可以导入一下格式的数据: csv, xls, xlsx, sav, dta, por, sas 和 stata 文件。


导入数据

数据导入功能可以通过两种方式,1.environment pane 2.file菜单

导入的数据类型大概可以分为3类:

1. 分割文件,主要以CSV文件为主

2. 微软的Excel文件

3. 统计数据

在 "Environment" 框中,点击"Import Dataset"下拉菜单:

或者通过“File”菜单 中"Import Dataset" 下拉菜单。


导入CSV文件

CSV导入支持一下情况:

  • 导入系统文件或者URL

  • 修改某列的数据类型

  • 跳过某列或只选某一列导入

  • 数据集重命名

  • 跳过第n列导入(排除某列不导入)

  • 用首行作为列名

  • 微调列名的空间

  • 改变列的分隔符

  • 编码方式选择

  • 选择 : 引号, 溢出, 注释 或 NA 提示符

例如:https://data.montgomerycountymd.gov/api/views/6rqk-pdub/rows.csv?accessType=DOWNLOAD 作为URL,但后选择导入"import",效果如下:


导入Excel 文件

导入Excel文件支持以下功能:

  • 导入系统文件或URL

  • 改变某列的数据类型

  • 跳过某列导入

  • 重命名数据集

  • 选择Excel具体的sheet导入

  • 跳过第n行导入(排除某列导入)

  • 选择NA标识符

例如: http://www.fns.usda.gov/sites/default/files/pd/slsummar.xls 选择"import"。

发现前几行数据异常,希望将异常数据删除:

1. 选择跳过6行导入

2. "First Row as Names" 勾选 

good,满足要求,得到如下结果:

看上去还不错哦,但是有些列本身属于数字型数据,但是显示的是字符型数据,我们可以通过选择 "numeric" 列的下拉菜单来进行更正。

最后一步,点击 "import" ,同时预览代码 "Code Preview",这样数据就导入 RStudio, the final 结果是这样的:


导入SPSS, SAS 和 Stata 文件

导入SPSS, SAS 和 Stata 支持以下功能:

  • 导入本地系统数据和URL

  • 重命名数据集

  • 选择数据类型

综上:鉴于初学者对数据导入的具体参数不熟悉,可以通过此方式来导入各种类型的数据,同时也能通过调整导入参数来形象具体的理解各个参数的意义,然后呈现了具体的代码,反哺代码能力。



微信回复关键字即可学习

回复 R              R语言快速入门免费视频 
回复 统计          统计方法及其在R中的实现
回复 用户画像   民生银行客户画像搭建与应用 
回复 大数据      大数据系列免费视频教程
回复 可视化      利用R语言做数据可视化
回复 数据挖掘   数据挖掘算法原理解释与应用
回复 机器学习   R&Python机器学习入门 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存