查看原文
其他

R语言笔记之——常用数据导入方式简介

2016-09-12 小魔方 数据小魔方

因为之前旁听过几节R语言的课程,再加上自己练习数据可视化的需要(特别是可视化包——“ggplot2”),学了些R语言的皮毛。


总觉得基础没打牢,好高骛远、急于求成,总想学高大上的模块,却又总是力不从心。


现在的状态是,参考别人的代码,修修补补,勉强能画一些图,做一些计算,可是自己写起来却总是磕磕碰碰,漏洞百出。


深感基础语法之重要性,这里分享一些学习过程中总结的笔记,希望初学者可以牢记于心,避免同样的问题。


R语言支持的数据类型很多,但是初学者能接触到却寥寥无几,这里仅仅介绍.TXT、.CSV、直接复制三种方式。(不要问为啥没有xlsx,excel文件属于富文本数据文件格式,导入太麻烦,需要很多转换和专用包的支持,劳神费力)


TXT文件导入:


文件路径在桌面,名为myfile.txt


文件需为很规则的一维表,最好第一行有名称。所有操作均在Rstudio中完成。




语法:


data<-read.csv("C:\\Users\\Administrator\\Desktop\\myfile.csv")  #CSV数据读入


data是自定义名称,“<-”是命名符,等价于“=”,括号内是文件存放路径,如果文件内数据第一行无标题,需要在括号内路径后指定顶行非标题,("******",header = F),默认参数为header=T,即顶行为变量名称。(注意下R认可的路径与PC上文件路径使用的斜杠格式及方向)


导入后,数据文件存放在右上侧environment项目下的data列表中,可以直接点击查看,也可以通过head(data)预览数据前6行记录。





CSV文件导入:


data<-read.table("C:\\Users\\Administrator\\Desktop\\myfile.txt",header=T)#TXT读入:



导入txt文件格式最好直接在路径后指明首行是否为标题,否则容易把第一行直接导入为数据。


剪切板直接复制:


这种方法比较粗暴,当然也较容易出现问题,先在excel或者其他数据文件中复制数据区域,在Rstudio中输入:


data <- read.table("clipboard", header = T, sep = '\t')#直接复制


然后回车或者“Ctrl+L”运行即可导入。



比较推荐前两种,比较保险,不容易出现错误,可以直接将以上语法做笔记保存,需要时直接复制,替换路径和名称直接运行。


以下是小魔方总结的关于R语言包的下载,加载以及更新以及R语言软件更新的方法技巧,供大家参考:


关于包的安装、加载及更新、卸载:


update.packages()#查看可更新包

install.packages("ggplot2")#安装下载工具包

library(ggplot2)#加载下载工具包

detach("ggplot2")#分离包(从内存空间中移除)

remove.packages("ggplot2")#删除(相当于卸载)


关于R语言软件的更新:


install.packages("installr")#下载安装工具包

library(installr) #加载安装工具包

check.for.updates.R()#检测是否有最新版的R软件

installr()#下载并安装新版R软件

copy.packages.between.libraries()#复制旧版R中的包到新版R中


魔方学院QQ群:


QQ群:

微信群:




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存