迅速入门二十一世纪必备技能包-R语言!
相对于其他工具,R语言有其独特的优势:
一、对于初次接触一种工具的同学们,往往因为难以入门而导致最终的放弃。然而,R语言入门容易,面向人群无门槛,无论你是专业人员还是业余小白,通过几行简单的命令,便可以建立模型,或是绘制精美图像。
二、支持广泛,作为开源软件,其后备团队庞大。用于分析建模的独立程序包众多,并且帮助文档齐全。
三、功能强大,作为一门编程语言,应用它可以做到编程可以实现的一切模块,并且它所具备的不同领域的安装包几乎可以满足你一切统计工作的需求。
“学”阶段,需明确学什么?学多长时间?
学什么,其重点目标在于学习基础,成功入门,打开这扇门,你才可以自由的去选择实用的板块。本编文章,重点目标也是带读者入门,为接下来的学习做一个软件应用的基础。
学习时间,唯快不破。学习之所以枯燥无味,没有某音或是某者荣耀吸引人。那是因为学习的反馈时间长,这个时间甚至可以长到你都看不到反馈。所以,越快越好,重点花费时间快速入门即可。这个问题就很严重了,谁不愿意很快的学习完呢?可现实不允许啊!这就需要找到有经验的人带着你快速入门,哪有什么岁月静好啊,总有人已经负重前行了。同学们问,这样的人去哪里找?咳咳,左上角来一波关注哈。
“用”阶段,需结合实际的问题,项目。进行交互产出。
欲习此篇,必先安装。安装R语言的步骤十分简单。官网操作一波即可。首先进入R语言官网:https://www.r-project.org/。选择Download R -> China -> Download R for System(你的操作系统) -> install R for the first time ->选择版本。进入下载时间,下载完成后进行安装,没有任何需要注意的地方,一路安装即可。
安装之后,打开看看,喏,就是下面这样的界面,十分简洁。
VectorExample <- c(1, 2, 'apple')
print(VectorExample)
> print(VectorExample)
[1] "1" "2" "apple"
DataFrameExample <- data.frame(ColName = c(1, 2, 'apple'))
print(DataFrameExample)
> print(DataFrameExample)
ColName
1 1
2 2
3 apple
熟悉了游戏中可以操作的对象,下一步就要进入新手导引,进行基本操作。我们来看这些数据结构的基本操作。
首先在编写程序之前,先确定工作目录,如果当前工作目录不是我们希望的位置,我们需要指定一下工作目录,这样我们就明确接下来的操作在哪里运行,心里很稳妥(随着学习的加深,我们逐渐摆脱这种方式,使用相对目录来替代绝对目录)。所以学习第一个操作,更改工作目录:
getwd() #获取当前工作目录
setwd("path/to/code") #设置工作目录 例如setwd("D:/A_TechnologyScience/R/code")
第二个操作,赋值:"<-"和"="均是可以的。根据个人习惯吧,当然了,为了显示专业,有范君一般用"<-"。
在实际操作中,主体数据一般都不是我们定义出来,而是从其他数据储存文件读进来,那么第三个操作,读取CSV和TXT数据,本文数据详见https://github.com/ncepumas/A_TechnologyScience/tree/master/R:
ExampleReadCsv <- read.csv("../data/Example.csv")
ExampleReadTxt <- read.table("../data/Example.txt",header = TRUE)
print(ExampleReadCsv)
print(ExampleReadTxt)
> print(ExampleReadCsv)
学历 男生 女生
1 小学生 10 15
2 中学生 20 27
3 大学生 25 35
4 研究生 37 21
5 博士生 16 20
> print(ExampleReadTxt)
学历 男生 女生
1 小学生 10 15
2 中学生 20 27
3 大学生 25 35
4 研究生 37 21
5 博士生 16 20
是不是超级简单,读就可以了。当然这里你需要注意,在你的工作目录中需要有这两个文件,没有可不能读的。对于其他类型文件的读取,例如Excel,数据库中的数据,我们后续扩展。
在我们设定的工作目录读取了我们的示例数据,那么,必须进行一波分析,既是介绍的最后一个操作,总结:summary()。
summary(ExampleReadCsv)
>summary(ExampleReadCsv)
学历 男生 女生
博士生:1 Min. :10.0 Min. :15.0
大学生:1 1st Qu.:16.0 1st Qu.:20.0
小学生:1 Median :20.0 Median :21.0
研究生:1 Mean :21.6 Mean :23.6
中学生:1 3rd Qu.:25.0 3rd Qu.:27.0
Max. :37.0 Max. :35.0 这样,我们学习了四个操作,改变工作目录,在其目录读取数据并将读取内容赋值给变量,最后还给出这些数据的统计特征。啊,谁还敢说你不会数据分析?谁要敢说,你就不要在意哈。
help(summary)
?summary
帮助信息主要由描述,用法,参数,细节,返回值,示例构成。
当然,可能你看了这份帮助,对于某些函数的用法还是一知半解,这时候无需慌张,R语言的广泛应用型,使其有大量的帮助信息,打开你的网站,直接将函数或者错误信息输入,往往可以得到答案。如果仍不得头绪,那么可以登录关于R语言的Github网站:https://github.com/topics/r,寻找具体包的详细教程,当然,这需要你有一些英语的基础。
第五步:卸载游戏:回归学习