单细胞转录组基础分析一:分析环境搭建
The following article is from 生信会客厅 Author Kinesin
硬件配置
10X Genomics单细胞数据分析对电脑硬件配置要求比较高。上游分析软件Cell Ranger最低配置要求8核CPU+64G内存,推荐配置为16核CPU+128G内存,这显然不是个人电脑可以胜任的。下游分析使用R语言Seurat包时,10000个细胞的表达矩阵,8G内存的电脑就不能应付了。因此没有服务器的同学不用考虑上游分析,仅做下游分析最低也要16G内存的电脑。
R语言的安装
R语言安装程序官方下载链接:https://cran.r-project.org/ (如果你的网络不好,可以考虑清华镜像)
windows版本选择红色箭头所示链接
点击后进入以下界面,继续点击红色箭头所指链接
点击后进入以下界面,继续点击红色箭头所指链接
注意:不要安装最新的R语言4.0版本,很多包还不提供支持!!!(2020-08-24 更新一下,大家可以放心的安装4.0版本了哈,亲测,R包都ok的)
点击后进入以下界面,继续点击红色箭头所指3.6.3版本(可以安装最新版)
点击后进入以下界面,继续点击红色箭头所指3.6.3版本(可以安装最新版)
安装文件下载后就是常规的windows程序安装过程了。(鼠标不停的点击下一步哦)
Rtools的安装
Rtools的相当于R在windows中使用的一个补丁,我只在安装R包的时候遇到过rtools报错,其它时候没感觉到它的存在。
官方解释如下:
Rtools provides a toolchain for Windows platform that work well with R. It mainly includes GNU make, GNU gcc, and other utilities commonly used on UNIX-ish platform. R statistical language & environment is that it is open source and cross-platform.
Rtools下载地址:
https://cran.r-project.org/bin/windows/Rtools/history.html (也可以在清华镜像下载)
下载箭头所示版本安装即可,注意以下安装界面:
红框标注的两个选项一定都要选择,第一个选项默认是没打钩的。
Rstudio的安装
Rstudio的下载链接:https://rstudio.com/products/rstudio/download/
选择红色箭头所示链接
点击后进入以下界面,继续点击红色箭头所指链接
安装文件下载后就是常规的windows程序安装过程了
Rstudio界面下载安装分析所用的R包
使用代码安装R包
打开RStudio,同时按住键盘上Ctrl+Shift+H三个键,切换到工作目录,逐行运行以下命令:
install.packages("devtools", dependencies=T)
install.packages("BiocManager", dependencies=T)
install.packages("tidyverse", dependencies=T)
install.packages('Seurat', dependencies=T)
BiocManager::install(c("SingleR","monocle", "DESeq2"),ask = F,update = F)
BiocManager::install(c("clusterProfiler","DOSE","pheatmap"),ask = F,update = F)
BiocManager::install(c("org.Hs.eg.db","org.Mm.eg.db","org.Rn.eg.db"),ask = F,update = F)
devtools::install_github('RGLab/MAST', upgrade=F, build_vignettes = T)
library(Seurat)
运行library(Seurat) 后会提示(只有首次运行会提示)安装minconda和python,如下图所示:
输入y继续。安装过程中360安全卫士会提示病毒风险,选择信任即可。
至此,分析环境搭建完成!如果你安装R包比较困难,也可以考虑使用镜像哈!
# r语言最新镜像
options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="http://mirrors.cloud.tencent.com/CRAN/"))
options(download.file.method = 'libcurl')
options(url.method='libcurl')
BiocManager::install("miRNAtap.db",ask = F,update = F)
再次强调生物信息学数据分析学习过程的计算机基础知识,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
把R的知识点路线图搞定,如下:
了解常量和变量概念 加减乘除等运算(计算器) 多种数据类型(数值,字符,逻辑,因子) 多种数据结构(向量,矩阵,数组,数据框,列表) 文件读取和写出 简单统计可视化 无限量函数学习
获取帮助
本教程的目的在于把常用的单细胞分析流程串起来,适合有一定R语言基础的朋友参考。分析原理和代码我没有详细解释,官网有详细的教程和权威的解释,翻译好的中文教程也有多个版本,有兴趣的可以搜索一下。如果您学习本教程有一定困难,可以点击 “阅读原文” 找到作者联系方式,获取帮助。
如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程
生信爆款入门-第8期(线上直播4周,马拉松式陪伴,带你入门)你的生物信息入门课
数据挖掘学习班第6期(线上直播3周,马拉松式陪伴,带你入门) 医学生/医生首选技能提高课
生信技能树的2019年终总结 你的生物信息成长宝藏
看完记得顺手点个“在看”哦!
长按扫码可关注