查看原文
其他

R包终极解决方案

2017-08-06 生信技能树 弗雷赛斯

写在前面:

R语言在生物信息学中的重要性已经不言而喻,学习R语言必然会安装各种各样的包,很多人在这一步就遇到了困难,

刚开始学习R语言的时候我们经常会遇到各种包安装错误,比如 package ‘airway’ is not available(for R version 3.1.0)等等,

这篇文章我们就来系统性地整理一些新手可能遇到的问题以及解决方案。

当然,你不一定现在就会遇到,但是如果你遇到了,请记住,可以在这里得到答案!


文章目录如下

  • 查看已经安装了和可以安装哪些R包

  • 如何安装旧版本的包

  • 如何切换镜像以及为什么要切换

  • 4种常见的R包安装方式

说明:

该文首发于我的个人博客以及生信技能树论坛,请点击文末的阅读原文前往查看详细资料。


总体思路

R语言里面的包其实是很简单的,因为它自带了一个安装函数 install.packages()基本上可以解决大部分问题。

但是如果出问题你需要从如下角度进行分析思考:

  • 你的R语言安装在什么机器什么?(linux(ubuntu?centos?),window,mac)

  • 你的R是什么版本:(3.1 ? 3.2 ? http://www.bio-info-trainee.com/1307.html )

  • 你的安装器是什么版本?(主要针对于bioconductor包的安装)

  • 你的联网方式是什么?https ?http ?

  • 你选择的R包镜像是什么?

R包安在哪里,可以安装哪些R包

首先在R里面输入 .libPaths()即可查看当前的R把包安装到了机器的哪个地方,这样可以直接进入目录去查看有哪些包,每个包都会有一个文件夹。

其次你可以用 installed.packages()查看你已经安装了哪些包。

最后你可以用 available.packages()可以查看自己的机器可以安装哪些包!

  1. >.libPaths()

  2. [1] "C:/Users/jmzeng/Documents/R/win-library/3.1"

  3. [2] "C:/Program Files/R/R-3.1.0/library"

  4. colnames(installed.packages())

  5. [1] "Package"               "LibPath"               "Version"              

  6. [4] "Priority"              "Depends"               "Imports"              

  7. [7] "LinkingTo"             "Suggests"              "Enhances"            

  8. [10] "License"               "License_is_FOSS"       "License_restricts_use"

  9. [13] "OS_type"               "MD5sum"                "NeedsCompilation"    

  10. [16] "Built"    

  11. ap <- available.packages()

  12. > dim(ap)

打开ap变量可以看出,我们想安装的 airway 包根本不在,当然,这肯定是不存在的。 因为 airway 是bioconductor的包,并非R默认。

需要调整 contriburl参数,如下:

  1. > dim(available.packages(contriburl = "https://cran.rstudio.com/bin/windows/contrib/3.2/"))

  2. [1] 8110   17

  3. > dim(ap)

  4. [1] 8155   17

  5. > dim(available.packages(contriburl = "http://bioconductor.org/packages/3.1/bioc/bin/windows/contrib/3.2/"))

  6. [1] 1000   17

  7. > dim(available.packages(contriburl = "http://mirrors.ustc.edu.cn/bioc//packages/3.1/bioc/bin/windows/contrib/3.2/"))

  8. [1] 1000   17

用这个参数,可以看不同仓库,甚至不同版本的R包共有哪些资源!


如何安装旧版本的包

既然你点进来看,肯定是有需求。 一般来说,R语言自带的 install.packages函数来安装一个包时,都是默认安装最新版的。 但是有些R包的开发者他会引用其它的一些R包,但是它用的是旧版本的功能,自己来不及更新或者疏忽了。 而我们又不得不用他的包,这时候就不得不卸载最新版包,转而安装旧版本包。

首先你要用 remove.packages这个命令把现在的包卸载掉!

然后去包的官网上面找到它的旧版本的下载链接:

我这里拿ggplot2举例: 

http://cran.r-project.org/src/contrib/Archive/ggplot2/

  1. #packageurl <- "http://cran.r-project.org/src/contrib/Archive/ggplot2/ggplot2_1.0.1.tar.gz"

  2. install.packages(packageurl, repos=NULL, type="source")

  3. #我这里安装它的1.0.1版本,而不是最新版!

  4. #还有很多其它方法,我就不一一举例了,这个是我认为最方便,最直观的!

  5. # install yesterday's version of checkpoint, by date

  6. install.dates('checkpoint', Sys.Date() - 1)

  7. # install earlier versions of checkpoint and devtools

  8. install.versions(c('checkpoint', 'devtools'), c('0.3.3', '1.6.1'))

很明显,我是在StackOverflow*上面搜索得到的解决方案,O(∩_∩)O哈哈~ 你可以参考:http://stackoverflow.com/questions/17082341/installing-older-version-of-r-package

广而告之:

这里强力推荐和公众号另一位编辑:思考问题的熊 两人共同完成的如何使用google系列文章,值得大家学习应用。

如何通过Google来使用ggplot2可视化

用谷歌搜索来使用ggplot2做可视化(下)


如何切换镜像

这个技巧很重要,一般来说,R语言自带的 install.packages函数来安装一个包时,都是用的默认的镜像!

如果你是用的Rstudio这个IDE,默认镜像就是:https://cran.rstudio.com/

如果你直接用的R语言,那么就是:http://cran.us.r-project.org

但是一般你安装的时候会提醒你选择,而我们需要更改成自己最方便的

  1. install.packages(pkgs, lib, repos = getOption("repos"),

  2.    contriburl = contrib.url(repos, type),

  3.    method, available = NULL, destdir = NULL,

  4.    dependencies = NA, type = getOption("pkgType"),

  5.    configure.args = getOption("configure.args"),

  6.    configure.vars = getOption("configure.vars"),

  7.    clean = FALSE, Ncpus = getOption("Ncpus", 1L),

  8.    verbose = getOption("verbose"),

  9.    libs_only = FALSE, INSTALL_opts, quiet = FALSE,

  10.    keep_outputs = FALSE, ...)

如果是在国内, install.packages ("ABC",repos="http://mirror.bjtu.edu.cn/ "), 换成北大的镜像你会体验飞一般的感觉!

如果想永久设置,就用options修改即可。

如果你是Rstudio的IDE,只需要鼠标点击直接进入全局设置,一劳永逸的选择好镜像!

你可以check一下每个镜像的包是不是一致的:

  1. dim(available.packages(contriburl = "http://cran.rstudio.com/bin/windows/contrib/3.2/"))

更改镜像主页及包的版本即可查看所有镜像各提供哪些包!

当然,我们的bioconductor其实也是有镜像的,只是大部分人都不知道,也不会去用而已!

  1. source("http://bioconductor.org/biocLite.R")

  2. options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/")

  3. biocLite("RGalaxy")

  4. ##这样就用中科大的镜像来下载包啦

  5. ##bioconductor还有很多其它镜像:https://www.bioconductor.org/about/mirrors/

  6. ##https://stat.ethz.ch/R-manual/R-devel/library/utils/html/chooseBioCmirror.html


4种常见的R包安装方式

R自带函数直接安装

这个是最简单的,而且不需要考虑各种包之间的依赖关系。

对普通的R包,直接 install.packages()即可,一般下载不了都是包的名字打错了,或者是R的版本不够。如果下载了安装不了,一般是依赖包没弄好,或者你的电脑缺少一些库文件,如果实在是找不到或者下载慢,一般就用 repos=来切换一些镜像。

  1. > install.packages("ape")  ## 直接输入包名字即可

  2. Installing package into ‘C:/Users/jmzeng/Documents/R/win-library/3.1’

  3. (as ‘lib’ is unspecified)  ##一般不指定lib,除非你明确知道你的lib是在哪里

  4. trying URL 'http://mirror.bjtu.edu.cn/cran/bin/windows/contrib/3.1/ape_3.4.zip'

  5. Content type 'application/zip' length 1418322 bytes (1.4 Mb)

  6. opened URL   ##根据你选择的镜像,程序会自动拼接好下载链接url

  7. downloaded 1.4 Mb

  8. package ‘ape’ successfully unpacked and MD5 sums checked  

  9. ##表明你已经安装好包啦

  10. The downloaded binary packages are in  

  11. ##程序自动下载的原始文件一般放在临时目录,会自动删除

  12.    C:\Users\jmzeng\AppData\Local\Temp\Rtmpy0OivY\downloaded_packages

对于bioconductor的包,我们一般是

  1. source("http://bioconductor.org/biocLite.R") ##安装BiocInstaller

  2. #options(BioC_mirror=”http://mirrors.ustc.edu.cn/bioc/“) 如果需要切换镜像

  3. biocLite("ggbio")

  4. #或者直接

  5. BiocInstaller::biocLite('ggbio')

  6. ## 前提是你已经安装好了BiocInstaller

  7. #某些时候你还需要卸载

  8. remove.packages("BiocInstaller")

  9. #然后安装新的

进入主页找到包下载地址

可以选择用R自带的下载器来下载,也可以把下面的url拷贝到浏览器用浏览器来下载

  1. packageurl <- "http://cran.r-project.org/src/contrib/Archive/ggplot2/ggplot2_0.9.1.tar.gz"

  2. packageurl <- "http://cran.r-project.org/src/contrib/Archive/gridExtra/gridExtra_0.9.1.tar.gz"

  3. install.packages(packageurl, repos=NULL, type="source")

  4. #packageurl <- "http://www.bioconductor.org/packages/2.11/bioc/src/contrib/ggbio_1.6.6.tar.gz"

  5. #packageurl <- "http://cran.r-project.org/src/contrib/Archive/ggplot2/ggplot2_1.0.1.tar.gz"

  6. install.packages(packageurl, repos=NULL, type="source")

这样安装的就不需要选择镜像了,也跨越了安装器的版本!

下载到本地后再安装

  1. download.file("http://bioconductor.org/packages/release/bioc/src/contrib/BiocInstaller_1.20.1.tar.gz","BiocInstaller_1.20.1.tar.gz")

  2. ##也可以选择用浏览器下载这个包

  3. install.packages("BiocInstaller_1.20.1.tar.gz", repos = NULL)

如果你用的RStudio这样的IDE,那么直接用鼠标就可以操作了。或者用 choose.files()来手动选择把下载的源码 BiocInstaller_1.20.1.tar.gz放到哪里。但这种形式大部分安装都无法成功,因为R包之间的依赖性很强!

命令行版本安装

如果是linux版本,命令行从网上自动下载包如下:

  1. sudo su - -c \

  2. "R -e \"install.packages('shiny', repos='https://cran.rstudio.com/')\""

如果是linux,命令行安装本地包,在shell的终端

  1. sudo R CMD INSTALL package.tar.gz

window或者mac平台一般不推荐命令行格式,可视化那么舒心,何必自讨苦吃呢?

生信菜鸟专栏是生信技能树论坛的版主团队的专栏,团队成员生信技能背景丰富,文件格式,数据资源,软件使用,脚本技巧,统计绘图,组学实战均有对应人才。而本专栏将从基础到深入,为零基础的各位剖析生信技能。

科研路,不孤单!^ ^

FS科研软件库,集合60+医学科研必备神器,现在统统打包分享点这里

              致敬Scihub|Freescience、生信人要一起做些很Cool的事儿

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存