小白生信学习记4:Linux系统下,RNAseq分析软件的安装
前面介绍了转录组的基本知识以及简单的linux命令,今天开始正式的上机练习,今天先介绍软件的安装。
一、 linux基本操作。
到主目录下,cd表示进入某个目录,~表示主目录
cd ~
查看当前所在位置的路径
pwd
查看目录
ls
ls -l
ls -al
新建一个目录名为software
mkdir software
进入这个software,并查看所在位置
cd software
pwd
新建一个名为abc.txt的文件
touch abc.txt
ls
修改abc.txt的名字为xyz.py
mv abc.txt xyz.py
ls
在linux下,后缀名是可以不用太在意的。你写进去的东西,不会因为后缀名修改而修改。
举个例子
touch example.txt
echo "this is a test" > example.txt
more example.txt
输出结果是:
this is a test
mv example.txt example
more example
输出结果还是:
this is a test
在这里,我们用echo这个命令把this is a test这句话放到了example.txt中,用>指令覆盖文件原内容,并重新输入内容。若文件不存在则创建文件。举例来说:
echo "this" > example
会发现,原先的内容this is a test被覆盖了为this了
如果不想覆盖,只是想在后面加一些内容怎么办?使用">>"追加
echo "this is a test" >> example
more
输出结果是
this
this is a test
这几个文件都是没用的。我们删除
rm *
*在这里是一个通配符。rm * 是把当前目录所有文件删除。但是rm删除非空文件夹的时候需要使用rm -r来进行
更详细的使用,可以通过命令rm --help查看具体使用。
可以看到加上-r意味着把整个文件夹里的子文件夹和文件全部删除。
二、软件安装
(1)FastQC
确认我们现在在~/software下
pwd
先来下载fastqc这个软件:
curl -O http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.5.zip
curl 的用法网上有很多的中文版本。你也可以输入curl --help或者curl --manual来在linux下查看帮助文档。
如果遇到下载问题,可以直接到网上先下载到本地电脑,再用我们在《小白生信学习记2》中介绍的软件,传到服务器上。
zip格式的文件可以用unzip来解压:
unzip fastqc_v0.11.5.zip
怎么知道如何安装与使用?
http://www.bioinformatics.bbsrc.ac.uk/projects/download.html#fastqc
大家可以进去看看相关信息。一般官网或者解压后的下载包里都会有相关指南。
由于FastQC是用java编写的。所以其使用需要服务器上安装了java
java -version
如果提示java版本即可以。
根据说明书,我们安装如下:
cd FastQC/
ls -l
chmod +x fastqc
上面这条 chmod +x 命令是使得fastqc变为可执行的命令
为了使得我们无论在哪个路径下都能使用这个软件,我们必须进行一些设置:
可以把这个命令所在的目录路径,加到~/.bashrc(Linux)或者~./profile(Mac)中:
# On the Mac:
echo export PATH=$PATH:~/software/FastQC >> ~/.profile
source ~/.profile
fastqc -h
# On Linux:
echo export PATH=$PATH:~/software/FastQC >> ~/.bashrc
source ~/.bashrc
fastqc -h
2. 建一个类似windows下的快捷方式的软连接(shortcut)
mkdir -p ~/bin
# 把fastqc的"shortcut" 放到 ~/bin
ln -s ~/software/FastQC/fastqc ~/bin/fastqc
# Mac:
echo 'export PATH=~/bin:$PATH' >> ~/.profile
source ~/.profile
fastqc -h
# Linux :
echo 'export PATH=~/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
fastqc -h
3.其他:比如用alias命令,等下会使用到
这样,在bin目录下的程序,我们在服务器账号里任何一个位置都可以直接使用了。
我们来试一下:
mkdir seq
把我提供的fastq文件放入此文件夹
fastqc SRR1553610_1.fastq
过一小段时间,会出现2个文件。SRR1553610_1_fastqc.html和SRR1553610_1_fastqc.zip。这两个文件可以导出到本地电脑去打开查看。
另外,fastqc是有windows版本的。
如果有多个fastq在该目录下,想一次性全部用fastqc查看一下测序质量,可以这么操作
fastqc *.fastq
(2)trimmomatic
# trimmomatic说明书地址
http://www.usadellab.org/cms/index.php?page=trimmomatic
curl -O http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.36.zip
unzip Trimmomatic-0.36.zip
cd Trimmomatic-0.36
官网给出的用法如下:
需要输入 java -jar trimmomatic-0.36.jar 一长串才能用起来,有点麻烦,我们可以写一个小脚本来使得这个使用变得简单些:
下面命令的$@ 表示的是把所有的参数都传递给程序
echo '#!/bin/bash' > ~/bin/trimmomatic
echo 'java -jar ~/software/Trimmomatic-0.36/trimmomatic-0.36.jar $@' >> ~/bin/trimmomatic
chmod +x ~/bin/trimmomatic
trimmomatic
此时发现会弹出来说明
或者我们也可以直接用vi来编辑trimmomatic这个文档(如果没有这个文件,则会自动新建这个名字的文件):
vi ~/bin/trimmomatic
此时会看到我们刚才输进去的
#!/bin/bash
java -jar ~/software/Trimmomatic-0.36/trimmomatic-0.36.jar $@
这两句文字。
按下键盘上的 i 键,即切换进如“插入”模式,此时可以改写里面的内容。
如果想退出,先按下 esc 键,假设如下3种情况:
1、做出了更改需要保存:输入 :wq 即可保存并退出。
2、没有更改: :q 即退出
3、更改了不想保存::q!
vi还有其他用法,这里不一一介绍了。
写好trimmomatic文件后,跟上面一样
chmod +x ~/bin/trimmomatic
trimmomatic
这里还可以用alias的方法来简化用法:
echo "alias trimmomatic='java -jar ~/software/Trimmomatic-0.36/trimmomatic-0.36.jar'" >> ~/.bashrc
source ~/.bashrc
即可。
当然,你也可以用vi来编辑~/.bashrc或者~/.profile文件。
好了,今天先写到这里。给大家留下HISAT2和HTSeq自己尝试一下跟着官方提供的说明书来安装一下吧。
今天的内容很多改写自这个课程:http://www.personal.psu.edu/iua1/courses/code-repository-2014.html
这个课程我觉得是完整和详细的(虽然有少量的细节错误),强烈推荐大家可以跟着操作和练习一下!
欢迎关注我们