查看原文
其他

单细胞转录组基础分析一:分析环境搭建

The following article is from 生信会客厅 Author Kinesin

单细胞测序技术是近年最大的生命科学突破之一,相关文章频繁发表于各大顶级期刊,然而单细胞数据的分析依然是大家普遍面临的障碍。
本专题将针对10X Genomics单细胞转录组数据演示各种主流分析,包括基于Seurat的基础分析、以及基于clusterProfiler、Monocle、SingleR等R包的延伸分析。不足之处请大家批评指正,欢迎添加Kinesin微信交流探讨!


硬件配置


10X Genomics单细胞数据分析对电脑硬件配置要求比较高。上游分析软件Cell Ranger最低配置要求8核CPU+64G内存,推荐配置为16核CPU+128G内存,这显然不是个人电脑可以胜任的。下游分析使用R语言Seurat包时,10000个细胞的表达矩阵,8G内存的电脑就不能应付了。因此没有服务器的同学不用考虑上游分析,仅做下游分析最低也要16G内存的电脑。


R语言的安装


R语言安装程序官方下载链接:https://cran.r-project.org/ (如果你的网络不好,可以考虑清华镜像)

windows版本选择红色箭头所示链接

点击后进入以下界面,继续点击红色箭头所指链接

点击后进入以下界面,继续点击红色箭头所指链接

注意:不要安装最新的R语言4.0版本,很多包还不提供支持!!!(2020-08-24 更新一下,大家可以放心的安装4.0版本了哈,亲测,R包都ok的)

点击后进入以下界面,继续点击红色箭头所指3.6.3版本(可以安装最新版)

点击后进入以下界面,继续点击红色箭头所指3.6.3版本(可以安装最新版)

安装文件下载后就是常规的windows程序安装过程了。(鼠标不停的点击下一步哦)


Rtools的安装


Rtools的相当于R在windows中使用的一个补丁,我只在安装R包的时候遇到过rtools报错,其它时候没感觉到它的存在。

官方解释如下:

Rtools provides a toolchain for Windows platform that work well with R. It mainly includes GNU make, GNU gcc, and other utilities commonly used on UNIX-ish platform. R statistical language & environment is that it is open source and cross-platform.


Rtools下载地址:

https://cran.r-project.org/bin/windows/Rtools/history.html (也可以在清华镜像下载)

下载箭头所示版本安装即可,注意以下安装界面:

红框标注的两个选项一定都要选择,第一个选项默认是没打钩的。



Rstudio的安装


Rstudio的下载链接:https://rstudio.com/products/rstudio/download/

选择红色箭头所示链接

点击后进入以下界面,继续点击红色箭头所指链接

安装文件下载后就是常规的windows程序安装过程了



Rstudio界面下载安装分析所用的R包


使用代码安装R包

打开RStudio,同时按住键盘上Ctrl+Shift+H三个键,切换到工作目录,逐行运行以下命令:

install.packages("devtools", dependencies=T)install.packages("BiocManager", dependencies=T)install.packages("tidyverse", dependencies=T)install.packages('Seurat', dependencies=T)BiocManager::install(c("SingleR","monocle", "DESeq2"),ask = F,update = F) BiocManager::install(c("clusterProfiler","DOSE","pheatmap"),ask = F,update = F)BiocManager::install(c("org.Hs.eg.db","org.Mm.eg.db","org.Rn.eg.db"),ask = F,update = F)devtools::install_github('RGLab/MAST', upgrade=F, build_vignettes = T)library(Seurat)

运行library(Seurat) 后会提示(只有首次运行会提示)安装minconda和python,如下图所示:

输入y继续。安装过程中360安全卫士会提示病毒风险,选择信任即可。

至此,分析环境搭建完成!如果你安装R包比较困难,也可以考虑使用镜像哈!

# r语言最新镜像options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor/")options("repos" = c(CRAN="http://mirrors.cloud.tencent.com/CRAN/")) options(download.file.method = 'libcurl')options(url.method='libcurl') BiocManager::install("miRNAtap.db",ask = F,update = F)

再次强调生物信息学数据分析学习过程的计算机基础知识,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理

把R的知识点路线图搞定,如下:

  • 了解常量和变量概念
  • 加减乘除等运算(计算器)
  • 多种数据类型(数值,字符,逻辑,因子)
  • 多种数据结构(向量,矩阵,数组,数据框,列表)
  • 文件读取和写出
  • 简单统计可视化
  • 无限量函数学习

获取帮助


本教程的目的在于把常用的单细胞分析流程串起来,适合有一定R语言基础的朋友参考。分析原理和代码我没有详细解释,官网有详细的教程和权威的解释,翻译好的中文教程也有多个版本,有兴趣的可以搜索一下。如果您学习本教程有一定困难,可以点击 “阅读原文” 找到作者联系方式,获取帮助。


往期回顾

欢迎加入生信技能树小圈子

期待单细胞工具的大浪淘沙,洗尽铅华

空间转录组听课收获

把tcga大计划的CNS级别文章标题画一个词云

单细胞基因组学前沿会议推荐(*冷泉港亚洲学术会议)

并不是所有的批次效应都可以被矫正

单细胞测序如何指导临床问题?看这篇paper就够了

单细胞实验也了解一下?让细胞计数更加准确的7个步骤

非常羡慕你,有人帮助

单细胞交响乐8-marker基因检测






如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程



看完记得顺手点个“在看”哦!


生物 | 单细胞 | 转录组丨资料每天都精彩

长按扫码可关注


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存