查看原文
其他

空间转录组第二讲:Space Ranger的使用

邓老师呦 简生信 2022-08-30

10x Genomics在分析软件这一块还是非常给力的,开发的每个软件都非常好用而且操作简单,特别是安装方便,基本解压后就能用。对于10x的空间转录组数据主要用10x自己开发的Space Ranger来进行前期的处理。

   

软件下载地址:

https://support.10xgenomics.com/spatial-gene-expression/software/downloads/latest


可以直接点击下载,也可以用下面的curl或wget命令下载。

 

基因组下载:

 

在前面同一个页面往下拉就能看到。

 

10x提供了专门的用于空间转录组分析的基因组,目前最新的基因组版本是2020年6月更新的,基因注释为Ensembl 98版本,主要包括人和小鼠。


系统要求


Linux系统上运行最低要求:

  • 8核Intel或AMD处理器(建议使用32核)

  • 64GB RAM(建议128GB)

  • 1TB可用磁盘空间

  • 64位CentOS     / RedHat 6.0或Ubuntu 12.04

集群模式下运行需要额外满足以下要求:

  • 每个节点 8核Intel或AMD处理器

  • 每个内核 6GB RAM

  • 共享文件系统(例如NFS)

  • SGE或LSF批处理系统


软件安装


第一步,解压SpaceRanger文件

tar -xzvf spaceranger-1.1.0.tar.gz

第二步,解压参考基因组文件

tar -xzvf refdata-gex-GRCh38-2020-A.tar.gz

第三步,加入环境变量

export PATH=/opt/spaceranger-1.1.0:$PATH

输入文件准备


fastq序列文件:


10x建议测序read2设置90个碱基的长度。从下面10x测试的6个样本来看,reads序列长度达到70bp以后,mapping率就不太变化了,有些样本在长度大于90bp以后mapping率反而下降了。10x给出这样的建议是考虑到建库后插入片段太短的话,太长的序列里面会包含部分polyA甚至UMI序列反而影响比对效果。因为国内目前基本上是测2x150bp的,如果建库片段过短比对率较低的话建议将read2剪切成90bp来分析效果应该会好一点。


Fastq文件名建议是如下格式的,以免运行报错。

图像文件:


Space Ranger支持两种样式的显微镜图像:用苏木精和曙红(H&E)染色的明场图像,必须是24位彩色TIFF,16位灰度TIFF或JPEG。Space Ranger要求任一方向上的图像至少为2000像素。



注意:图像边框的四个角位置是固定的,比如说三角形在左下角,如果扫描出来的图片四个角的位置变了需要先手动调整过来再使用。


软件运行


一般我们拿到的都是直接是fastq序列文件了,所以可以直接跑spaceranger count,不需要再去运行spaceranger mkfastq了。

spaceranger count运行时图片对其有两种方式,一种软件自动识别图片进行对齐,另外一种就是先用Loupe软件手动对齐,生成对于json文件提供给后面的软件,后期会介绍怎么来手动调整图片。


自动对齐

$ cd /home/jdoe/runs$ spaceranger count --id=sample345 \ --transcriptome=/opt/refdata/GRCh38-3.0.0 \ --fastqs=/home/jdoe/runs/HAWT7ADXX/outs/fastq_path \ --sample=mysample \ --image=/home/jdoe/runs/images/sample345.tif \ --slide=V19J01-123 \                   --area=A1

手动对齐

$ cd /home/jdoe/runs$ spaceranger count --id=sample345 \ --transcriptome=/opt/refdata/GRCh38-3.0.0 \ --fastqs=/home/jdoe/runs/HAWT7ADXX/outs/fastq_path \ --sample=mysample \ --image=/home/jdoe/runs/images/sample345.tif \ --slide=V19J01-123 \ --area=A1 \                   --loupe-alignment=sample345.json

参数说明:

--Id:结果输出文件夹名称

--Transcriptome:基因组目录

--Fastqs:fastq文件木兰路

--Sample:原始样本名

--Image:镜像图片文件

--Slide:使用的10x芯片型号

--area:样本所在芯片的区域(四通道芯片位置从上到下分别为A1、B1、C1、D1

--loupe-alignmen:图片手动对齐生成的json文件,如果是自动对齐不要需要此参数


另外,spaceranger默认使用系统上可用的所有内核来执行管。可以使用--localcores选项来限制使用内核的数量。同理,可以使用-localmem来限制使用内存的大小。


结果输出:


成功运行后会到的下面的信息(包括主要的输出文件)

2016-11-10 16:10:09 [runtime] (join_complete) ID.sample345.SPATIAL_RNA_COUNTER_CS.SPATIAL_RNA_COUNTER_CS.SUMMARIZE_REPORTS Outputs:- Run summary HTML: /opt/sample345/outs/web_summary.html- Outputs of spatial pipeline: /opt/sample345/outs/spatial- Run summary CSV: /opt/sample345/outs/metrics_summary.csv- BAM: /opt/sample345/outs/possorted_genome_bam.bam- BAM index: /opt/sample345/outs/possorted_genome_bam.bam.bai- Filtered feature-barcode matrices MEX: /opt/sample345/outs/filtered_feature_bc_matrix- Filtered feature-barcode matrices HDF5: /opt/sample345/outs/filtered_feature_bc_matrix.h5- Unfiltered feature-barcode matrices MEX: /opt/sample345/outs/raw_feature_bc_matrix- Unfiltered feature-barcode matrices HDF5: /opt/sample345/outs/raw_feature_bc_matrix.h5- Secondary analysis output CSV: /opt/sample345/outs/analysis- Per-molecule read information: /opt/sample345/outs/molecule_info.h5- Loupe Browser file: /opt/sample345/outs/cloupe.cloupe Pipestance completed successfully!

长按识别二维码关注公众号,后期更精彩哦!


                                                 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存