RNA-seq入门实战（零）：RNA-seq流程前的准备——Linux与R的环境创建

Original 生信技能树生信技能树 2022-08-10

收录于合集 #ngs实战 34个

连续两次求贤令：曾经我给你带来了十万用户，但现在祝你倒闭，以及生信技能树知识整理实习生招募，让我走大运结识了几位优秀小伙伴！大家开始根据我的ngs组学视频进行一系列公共数据集分析实战，其中几个小伙伴让我非常惊喜，不需要怎么沟通和指导，就默默的完成了一个实战！

他前面的分享是：

下面是他对我们b站转录组视频课程的详细笔记

前言：

进行RNA-seq入门实战首先需要有一定的linux与R基础，推荐跟着B站生信技能树-jimmy老师学习打牢基础：
【生信技能树】生信人应该这样学linux(更新至第14集)_哔哩哔哩_bilibili

【生信技能树】生信人应该这样学R语言_哔哩哔哩_bilibili

本节概览：

Linux下RNA-seq环境创建:
Ubuntu子系统下载安装、Mniconda3与上游分析软件下载
R下RNA-seq环境创建
R与Rstudio下载安装、Bioconductor与R包下载

1. Linux环境设置

1.1 Linux系统的创建——Ubuntu

运行Linux系统一般使用服务器或者个人电脑的虚拟机（Virtualbox、VMware）和子系统，下面简单介绍Windows子系统的安装配置，详细说明请参阅Windows子系统WSL的体验与配置——Ubuntu-22.04

Ubuntu子系统的下载安装
首先在win10中搜索“ 启用或关闭Windows功能 ”，进入该程序，勾选“适用于Linux的Windows子系统”；之后去微软商店搜索Ubuntu下载安装，一般安装默认版本或者最新的22.04LTS

用户权限设置
设置好用户名和密码进入Ubuntu后，需要设置一下用户权限
启用root需要设置密码：sudo passwd root
添加用户至root组：usermod -aG sudo username
切换root用户：su
退出root：exit
软件镜像源设置
一般选择国内的清华镜像，ubuntu | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror，Ubuntu 的软件源配置文件是 /etc/apt/sources.list。将系统自带的该文件做个备份，再编辑（* 注意要先切换为root用户*才能编辑该文件）

su cd /etc/apt/ cp sources.list sources.list.bak vim sources.list

Ubuntu版本 22.04 LTS的设置（注意要找到对应的Ubuntu版本设置）如下：

# 默认注释了源码镜像以提高 apt update 速度，如有需要可自行取消注释 deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-updates main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-updates main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-backports main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-backports main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-security main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-security main restricted universe multiverse # 预发布软件源，不建议启用 # deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-proposed main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-proposed main restricted universe multivers

更新一下所有软件

sudo apt update #更新可用软件包列表 sudo apt upgrade #更新已安装的包

1.2 Mniconda3下载安装

一般使用Mniconda3软件进行创建分析环境和管理软件，下面简单介绍Mniconda3的安装，其详细使用说明请参阅Miniconda3的安装、配置和使用

下载与安装
切换到安装位置（一般为主目录~），下载最新的miniconda3，bash启动安装，一直enter、yes就可以了。

wget https://mirrors.ustc.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh#wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda-latest-Linux-x86_64.sh

设置conda软件镜像源
依次输入以下命令设置软件镜像源，并展示镜像源地址，这里设置了中科大镜像：

conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/pro conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/r conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/main conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/bioconda conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge conda config --set show_channel_urls yes

创建分析环境
创建rna流程环境rna_p3，指定python版本为3，同时下载sra-tools 软件，之后每次要运行rna流程都要进入该环境

conda create -n rna_p3 python=3 sra-tools conda env list #查看环境conda activate rna_p3 #进入conda 环境 conda deactivate #退出当前conda环境

上游分析软件下载
本次RNA-seq流程涉及软件如下所示，使用conda install -y 软件名=版本号依次进行下载即可，可同时下载多个软件，但不建议同时下载太多，容易报错

质控清洗：fastqc multiqc trim-galore
比对计数：hisat2 subread samtools=1.6 salmon

2. R环境设置

注意，安装使用R首先需要你的电脑用户名不能含有中文，否则后期运行程序会很容易报错，如果用户名含有中文请进行更改（很难。。。）或新建一个用户；
Rstudio是R的编译器，能提升用户交互体验，安装Rstudio前一定要先安装R

2.1 R与Rstudio下载安装

先在清华镜像源下载 R，地址：The Comprehensive R Archive Network (tsinghua.edu.cn)，
依次进入：Download R for Windows——base——Previous releases；
一般选择下载R 4.1.3，使用最新版可能会有不适配的问题，使用默认选项一直确定安装即可
安装好 R后之后，再去Rstudio官网下载Rstudio，地址：Download the RStudio IDE - RStudio
Rstudio中设置清华镜像源
依次进入：Tools——Global Options——Pakages——Change；选择镜像源

2.2 Bioconductor与R包下载

新建一个Rscript，运行以下内容，下载Bioconductor和本次实战所需所有R包等，代码修改自jimmy老师

###Bioconductor 下载 install.packages("BiocManager")

###设置好清华镜像rm(list = ls()) options()$repos options()$BioC_mirror

#options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")  options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) options()$repos options()$BioC_mirror ###安装需要的包BiocManager::install(c("GSEABase","GSVA","msigdbr","clusterProfiler" ),ask = F,update = F) BiocManager::install(c("GEOquery","limma","impute" ),ask = F,update = F) BiocManager::install(c("org.Hs.eg.db","org.Mm.eg.db"),ask = F,update = F) BiocManager::install(c("DESeq2","edgeR" ),ask = F,update = F) BiocManager::install("enrichplot",ask = F,update = F) BiocManager::install("devtools",ask = F,update = F) BiocManager::install("WGCNA",ask = F,update = F) BiocManager::install("data.table",ask = F,update = F) BiocManager::install("tximport",ask = F,update = F) BiocManager::install("tidyverse",ask = F,update = F) BiocManager::install("DOSE",ask = F,update = F)

BiocManager::install("patchwork",ask = F,update = F) BiocManager::install("RBGL",ask = F,update = F) #Vennerable依赖包

BiocManager::install("pathview",ask = F,update = F) BiocManager::install(c("STRINGdb","ggraph","igraph"),ask = F,update = F) install.packages("Vennerable", repos="http://R-Forge.R-project.org") #安装Vennerable包 install.packages("statmod") #其他一些基础包安装 options()$repos install.packages(c("FactoMineR", "factoextra")) install.packages(c("ggplot2", "pheatmap","ggpubr","ggthemes", "ggstatsplot","ggsci","ggsignif")) install.packages("rvcheck") (.packages()) #查看当前加载运行包

#更新所有包 rvcheck::update_all(check_R = F, which = c("CRAN", "BioC", "github"))

永久设置bioconductor镜像

#bioconductor | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror file.edit('~/.Rprofile')

输入以下内容：

# 清华源的镜像 options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")

以上就是进行RNA-seq流程前的全部准备了，下一步就可以开始进行上游数据下载、格式转化和质控清洗等步骤啦

参考资料

GitHub - jmzeng1314/GEO （强烈推荐学习）

【生信技能树】生信人应该这样安装软件_哔哩哔哩_bilibili

【生信技能树】生信分析入门环境搭建_哔哩哔哩_bilibili

文末友情宣传

强烈建议你推荐给身边的博士后以及年轻生物学PI，多一点数据认知，让他们的科研上一个台阶：

数据挖掘（GEO,TCGA,单细胞）2022年5~6月场，快速了解一些生物信息学应用图表
生信入门课-2022年5~6月场，你的生物信息学第一课

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

国内突然宣布，将大规模调整经济布局！又一朝阳行业悄然崛起，新一轮机会出现了！

RNA-seq入门实战（零）：RNA-seq流程前的准备——Linux与R的环境创建

前言：

本节概览：

1. Linux环境设置

1.1 Linux系统的创建——Ubuntu

1.2 Mniconda3下载安装

2. R环境设置

2.1 R与Rstudio下载安装

2.2 Bioconductor与R包下载

您可能也对以下帖子感兴趣

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋 华人崩溃大哭 连空姐都吐了; 客机颠簸盘旋3小时

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

国内突然宣布，将大规模调整经济布局！又一朝阳行业悄然崛起，新一轮机会出现了！

生成图片，分享到微信朋友圈

RNA-seq入门实战（零）：RNA-seq流程前的准备——Linux与R的环境创建

前言：

本节概览：

1. Linux环境设置

1.1 Linux系统的创建——Ubuntu

1.2 Mniconda3下载安装

2. R环境设置

2.1 R与Rstudio下载安装

2.2 Bioconductor与R包下载

您可能也对以下帖子感兴趣

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时