查看原文
其他

小白生信学习记4:Linux系统下,RNAseq分析软件的安装

2017-02-23 生物女博士 生信媛

前面介绍了转录组的基本知识以及简单的linux命令,今天开始正式的上机练习,今天先介绍软件的安装。


一、 linux基本操作。


到主目录下,cd表示进入某个目录,~表示主目录

cd ~


查看当前所在位置的路径

pwd


查看目录

ls

ls -l

ls -al


 新建一个目录名为software

mkdir software


进入这个software,并查看所在位置

cd software

pwd


 新建一个名为abc.txt的文件

touch abc.txt

ls


修改abc.txt的名字为xyz.py

mv abc.txt xyz.py

ls


在linux下,后缀名是可以不用太在意的。你写进去的东西,不会因为后缀名修改而修改。


 举个例子

touch example.txt

echo "this is a test" > example.txt

more example.txt


输出结果是:

this is a test


mv example.txt example

more example


 输出结果还是:

this is a test


在这里,我们用echo这个命令把this is a test这句话放到了example.txt中,用>指令覆盖文件原内容,并重新输入内容。若文件不存在则创建文件。举例来说:

echo "this" > example


会发现,原先的内容this is a test被覆盖了为this了


如果不想覆盖,只是想在后面加一些内容怎么办?使用">>"追加

echo "this is a test" >> example

more


输出结果是

this

this is a test


 这几个文件都是没用的。我们删除

rm *


*在这里是一个通配符。rm * 是把当前目录所有文件删除。但是rm删除非空文件夹的时候需要使用rm -r来进行


更详细的使用,可以通过命令rm --help查看具体使用。



可以看到加上-r意味着把整个文件夹里的子文件夹和文件全部删除。


二、软件安装

(1)FastQC

确认我们现在在~/software下

pwd


先来下载fastqc这个软件:

curl -O http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.5.zip


curl 的用法网上有很多的中文版本。你也可以输入curl --help或者curl --manual来在linux下查看帮助文档。


如果遇到下载问题,可以直接到网上先下载到本地电脑,再用我们在《小白生信学习记2》中介绍的软件,传到服务器上。


zip格式的文件可以用unzip来解压:

unzip fastqc_v0.11.5.zip


怎么知道如何安装与使用?

http://www.bioinformatics.bbsrc.ac.uk/projects/download.html#fastqc


大家可以进去看看相关信息。一般官网或者解压后的下载包里都会有相关指南。


由于FastQC是用java编写的。所以其使用需要服务器上安装了java

java -version

如果提示java版本即可以。


根据说明书,我们安装如下:

cd FastQC/

ls -l

chmod +x fastqc

上面这条  chmod +x  命令是使得fastqc变为可执行的命令


为了使得我们无论在哪个路径下都能使用这个软件,我们必须进行一些设置:


  1. 可以把这个命令所在的目录路径,加到~/.bashrc(Linux)或者~./profile(Mac)中:


# On the Mac:

echo export PATH=$PATH:~/software/FastQC >> ~/.profile

source ~/.profile

fastqc -h


# On Linux:

echo export PATH=$PATH:~/software/FastQC >> ~/.bashrc

source ~/.bashrc

fastqc -h


  2. 建一个类似windows下的快捷方式的软连接(shortcut)


mkdir -p ~/bin


# 把fastqc的"shortcut" 放到 ~/bin

ln -s ~/software/FastQC/fastqc ~/bin/fastqc


# Mac:

echo 'export PATH=~/bin:$PATH' >> ~/.profile

source ~/.profile

fastqc -h


# Linux :

echo 'export PATH=~/bin:$PATH' >> ~/.bashrc

source ~/.bashrc

fastqc -h



3.其他:比如用alias命令,等下会使用到


这样,在bin目录下的程序,我们在服务器账号里任何一个位置都可以直接使用了。

我们来试一下:

mkdir seq


把我提供的fastq文件放入此文件夹

fastqc SRR1553610_1.fastq


过一小段时间,会出现2个文件。SRR1553610_1_fastqc.html和SRR1553610_1_fastqc.zip。这两个文件可以导出到本地电脑去打开查看。

另外,fastqc是有windows版本的。


如果有多个fastq在该目录下,想一次性全部用fastqc查看一下测序质量,可以这么操作

fastqc *.fastq



(2)trimmomatic

# trimmomatic说明书地址

http://www.usadellab.org/cms/index.php?page=trimmomatic


curl -O http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.36.zip

unzip Trimmomatic-0.36.zip

cd Trimmomatic-0.36


官网给出的用法如下:

需要输入  java -jar trimmomatic-0.36.jar  一长串才能用起来,有点麻烦,我们可以写一个小脚本来使得这个使用变得简单些:


下面命令的$@ 表示的是把所有的参数都传递给程序

echo '#!/bin/bash' > ~/bin/trimmomatic

echo 'java -jar ~/software/Trimmomatic-0.36/trimmomatic-0.36.jar $@' >> ~/bin/trimmomatic

chmod +x ~/bin/trimmomatic

trimmomatic


此时发现会弹出来说明



或者我们也可以直接用vi来编辑trimmomatic这个文档(如果没有这个文件,则会自动新建这个名字的文件):

vi ~/bin/trimmomatic

此时会看到我们刚才输进去的


#!/bin/bash

java -jar ~/software/Trimmomatic-0.36/trimmomatic-0.36.jar $@


这两句文字。


按下键盘上的   i   键,即切换进如“插入”模式,此时可以改写里面的内容。

如果想退出,先按下  esc  键,假设如下3种情况:

1、做出了更改需要保存:输入    :wq    即可保存并退出。

2、没有更改: :q  即退出

3、更改了不想保存::q!

vi还有其他用法,这里不一一介绍了。


写好trimmomatic文件后,跟上面一样

chmod +x ~/bin/trimmomatic

trimmomatic


这里还可以用alias的方法来简化用法:


echo "alias trimmomatic='java -jar ~/software/Trimmomatic-0.36/trimmomatic-0.36.jar'" >> ~/.bashrc

source ~/.bashrc


即可。


当然,你也可以用vi来编辑~/.bashrc或者~/.profile文件。


好了,今天先写到这里。给大家留下HISAT2和HTSeq自己尝试一下跟着官方提供的说明书来安装一下吧。


今天的内容很多改写自这个课程:http://www.personal.psu.edu/iua1/courses/code-repository-2014.html

这个课程我觉得是完整和详细的(虽然有少量的细节错误),强烈推荐大家可以跟着操作和练习一下!




欢迎关注我们


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存