R语言笔记之——常用数据导入方式简介
因为之前旁听过几节R语言的课程,再加上自己练习数据可视化的需要(特别是可视化包——“ggplot2”),学了些R语言的皮毛。
总觉得基础没打牢,好高骛远、急于求成,总想学高大上的模块,却又总是力不从心。
现在的状态是,参考别人的代码,修修补补,勉强能画一些图,做一些计算,可是自己写起来却总是磕磕碰碰,漏洞百出。
深感基础语法之重要性,这里分享一些学习过程中总结的笔记,希望初学者可以牢记于心,避免同样的问题。
R语言支持的数据类型很多,但是初学者能接触到却寥寥无几,这里仅仅介绍.TXT、.CSV、直接复制三种方式。(不要问为啥没有xlsx,excel文件属于富文本数据文件格式,导入太麻烦,需要很多转换和专用包的支持,劳神费力)
TXT文件导入:
文件路径在桌面,名为myfile.txt
文件需为很规则的一维表,最好第一行有名称。所有操作均在Rstudio中完成。
语法:
data<-read.csv("C:\\Users\\Administrator\\Desktop\\myfile.csv") #CSV数据读入
data是自定义名称,“<-”是命名符,等价于“=”,括号内是文件存放路径,如果文件内数据第一行无标题,需要在括号内路径后指定顶行非标题,("******",header = F),默认参数为header=T,即顶行为变量名称。(注意下R认可的路径与PC上文件路径使用的斜杠格式及方向)
导入后,数据文件存放在右上侧environment项目下的data列表中,可以直接点击查看,也可以通过head(data)预览数据前6行记录。
CSV文件导入:
data<-read.table("C:\\Users\\Administrator\\Desktop\\myfile.txt",header=T)#TXT读入:
导入txt文件格式最好直接在路径后指明首行是否为标题,否则容易把第一行直接导入为数据。
剪切板直接复制:
这种方法比较粗暴,当然也较容易出现问题,先在excel或者其他数据文件中复制数据区域,在Rstudio中输入:
data <- read.table("clipboard", header = T, sep = '\t')#直接复制
然后回车或者“Ctrl+L”运行即可导入。
比较推荐前两种,比较保险,不容易出现错误,可以直接将以上语法做笔记保存,需要时直接复制,替换路径和名称直接运行。
以下是小魔方总结的关于R语言包的下载,加载以及更新以及R语言软件更新的方法技巧,供大家参考:
关于包的安装、加载及更新、卸载:
update.packages()#查看可更新包
install.packages("ggplot2")#安装下载工具包
library(ggplot2)#加载下载工具包
detach("ggplot2")#分离包(从内存空间中移除)
remove.packages("ggplot2")#删除(相当于卸载)
关于R语言软件的更新:
install.packages("installr")#下载安装工具包
library(installr) #加载安装工具包
check.for.updates.R()#检测是否有最新版的R软件
installr()#下载并安装新版R软件
copy.packages.between.libraries()#复制旧版R中的包到新版R中
魔方学院QQ群:
QQ群:
微信群: