用RStudio导入数据
作者:师爷,R语言中文社区作者,
知乎专栏:
https://zhuanlan.zhihu.com/rstudio
简介
向R中导入数据是数据分析的必经之路,通常是非常令人烦躁的。为了简化过程,RStudio提供了一个简化模式,不用写代码,哈。可以导入一下格式的数据: csv, xls, xlsx, sav, dta, por, sas 和 stata 文件。
导入数据
数据导入功能可以通过两种方式,1.environment pane 2.file菜单
导入的数据类型大概可以分为3类:
1. 分割文件,主要以CSV文件为主
2. 微软的Excel文件
3. 统计数据
在 "Environment" 框中,点击"Import Dataset"下拉菜单:导入CSV文件
CSV导入支持一下情况:
导入系统文件或者URL
修改某列的数据类型
跳过某列或只选某一列导入
数据集重命名
跳过第n列导入(排除某列不导入)
用首行作为列名
微调列名的空间
改变列的分隔符
编码方式选择
选择 : 引号, 溢出, 注释 或 NA 提示符
例如:https://data.montgomerycountymd.gov/api/views/6rqk-pdub/rows.csv?accessType=DOWNLOAD 作为URL,但后选择导入"import",效果如下:
导入Excel 文件
导入Excel文件支持以下功能:
导入系统文件或URL
改变某列的数据类型
跳过某列导入
重命名数据集
选择Excel具体的sheet导入
跳过第n行导入(排除某列导入)
选择NA标识符
例如: http://www.fns.usda.gov/sites/default/files/pd/slsummar.xls 选择"import"。
1. 选择跳过6行导入
2. "First Row as Names" 勾选
good,满足要求,得到如下结果:
最后一步,点击 "import" ,同时预览代码 "Code Preview",这样数据就导入 RStudio, the final 结果是这样的:
导入SPSS, SAS 和 Stata 文件
导入SPSS, SAS 和 Stata 支持以下功能:
导入本地系统数据和URL
重命名数据集
选择数据类型
综上:鉴于初学者对数据导入的具体参数不熟悉,可以通过此方式来导入各种类型的数据,同时也能通过调整导入参数来形象具体的理解各个参数的意义,然后呈现了具体的代码,反哺代码能力。
微信回复关键字即可学习
回复 R R语言快速入门免费视频
回复 统计 统计方法及其在R中的实现
回复 用户画像 民生银行客户画像搭建与应用
回复 大数据 大数据系列免费视频教程
回复 可视化 利用R语言做数据可视化
回复 数据挖掘 数据挖掘算法原理解释与应用
回复 机器学习 R&Python机器学习入门