其他
单细胞分析的最上游——处理Fastq文件:cellranger
写在前面
形式上来说呢,原本应该安排一次视频课,但是考虑到这部分内容在Linux中完成,制作视频的成本过高。掌握Linux知识并拥有服务器的同学可能不需要视频教程,而没有Linux基础和服务器的同学看了视频也无法自己操作,因此本篇最终采用文字推送的形式呈现。没有条件自己操作的同学也可以在文末联系我。
往期回顾
手把手教你做单细胞测序数据分析(一)——绪论
手把手教你做单细胞测序数据分析(二)——各类输入文件读取
手把手教你做单细胞测序数据分析(三)——单样本分析
手把手教你做单细胞测序数据分析(四)——多样本整合手把手教你做单细胞测序数据分析(五)——细胞类型注释手把手教你做单细胞测序数据分析(六)——组间差异分析及可视化手把手教你做单细胞测序数据分析(七)——基因集富集分析
B站视频:https://www.bilibili.com/video/BV1S44y1b76Z/
单细胞中应该如何做GSVA?
Biomamba助推的第一篇论文发表啦
wget -O cellranger-5.0.1.tar.gz "https://cf.10xgenomics.com/releases/cell-exp/cellranger-5.0.1.tar.gz?Expires=1608489066&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9jZi4xMHhnZW5vbWljcy5jb20vcmVsZWFzZXMvY2VsbC1leHAvY2VsbHJhbmdlci01LjAuMS50YXIuZ3oiLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE2MDg0ODkwNjZ9fX1dfQ__&Signature=bhGO1dQOi6xmaSl-XHACRN6wUjjdau-85VHyNHtPAU6eG~6v3urfrkX5E5uShfjwgCuxsuykcWnn2nJrnRN9UyAVyFnIlrhiswDL0T5Jkox4EBqQ~tL2WTivBGe5G8EFPIxFsPoKYv0FIdDoCQYGRlDaIWIIyu7Cg7dkPPfer5hUBPp6KfmXE3st47O4LV8ZW7ghkjnIPU57NuQa3ZRlIJ2FiEmFwKCfSzy0r3o6cFIfZ~HcaIqxP1Snk5~U9sCVqSKGryFBW9uaP89mbb855hen4J4JD58lxkxp8qwKbL6qH1y5g1VlgydLg5AFllnrkKUaDSCB1gohq4hHwP5Efw__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"
#下载安装包
tar -zxvf cellranger-5.0.1.tar.gz#解压
echo 'export PATH=/cellranger-5.0.1/:$PATH' >> ~/.bashrc
#把cellranger的路径加到$PATH中方便调用
source ~/.bashrc
#更新系统配置文件
cellranger count --help
#查看cellranger使用说明
wget https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-GRCh38-2020-A.tar.gz
#人类参考基因组数据集
tar -xvf refdata-gex-GRCh38-2020-A.tar.gz
wget https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-mm10-2020-A.tar.gz
#mouse参考基因组数据集下载
tar -xvf refdata-gex-mm10-2020-A.tar.gz
wget 'http://cf.10xgenomics.com/samples/cell-exp/2.1.0/neurons_900/neurons_900_fastqs.tar'
#测试数据集下载
tar -xvf neurons_900_fastqs.tar
cellranger count --id=result --transcriptome=../refdata-gex-mm10-2020-A/ --fastqs=/neurons_900_fastqs --sample=neurons_900 --expect-cells=1000 --nosecondary
#成功运行命令!!!
#这里解释一下cellranger的各个参数:
cellranger count --id=sample \
--transcriptome=/opt/refdata-cellranger-GRCh38-1.2.0 \
--fastqs=/home/scRNA/runs/HAWT7ADXX/outs/fastq_path \
--sample=mysample \
--expect-cells=1000 \
--nosecondary
# id指定输出文件存放目录名
# transcriptome指定与CellRanger兼容的参考基因组
# fastqs指定mkfastq或者自定义的测序文件
# sample要和fastq文件的前缀中的sample保持一致,作为软件识别的标志
# expect-cells指定复现的细胞数量,这个要和实验设计结合起来
# nosecondary 只获得表达矩阵,不进行后续的降维、聚类和可视化分析(反正后续要走Seurat,为了节省计算资源,建议加上)
#count函数参数解释
如何联系我们
答疑公约
笑一笑也就算了