扩增子分析QIIME2. 4-沙漠土分析实战Atacama soil
欢迎点击「宏基因组」关注我们!专业干货每日推送!
声明:本文为QIIME2官方帮助文档的中文版,由中科院遗传发育所刘永鑫博士翻译并亲测有效,文档翻译己获QIIME2团队官方授权。由于QIIME2更新频繁,如使用中遇到问题请访问QIIME2官方论坛阅读最新版中文帮助。https://forum.qiime2.org/t/qiime2-1-chinese-manual/838 如中文翻译没有急时更新,新阅读英文原版 https://docs.qiime2.org本人只习惯使用命令行模式分析数据,图形界面和Ipython模式下使用暂不介绍。本系列的教程主要以命令行方式为大家演示。在其它方面有使用的经验的朋友,欢迎共享您的使用笔记于“宏基因组”公众号,方便大家学习和使用。
扩增子分析QIIME2. 4阿塔卡马沙漠微生物组分析
原文地址: https://docs.qiime2.org/2017.6/tutorials/atacama-soils/
此实例需要一些基础知识,要求完成本系列文章前两篇内容:1简介和安装和2分析实战Moving Pictures。
本教程设计有两个目的:熟悉双端数据的处理;基于Moving Pictures后的主自分析练习以积累项目经验。
实验设计
本实验研究对像为智利北部的阿塔卡马沙漠。 此地为世界上最干旱的地区之一,其中有些地方十年降水量不足1毫米。尽管这里极端干旱,但仍有微生物生活在这里。我们的采样地点为东部的Baquedano和西部的Yungay,发现土壤温度与降水量正相关。在这两个地点,我们挖坑,并在不同深度取三组样品。
实验数据下载
# 激活工作环境
source activate qiime2-2017.6
# 建立工作目录
mkdir qiime2-atacama-tutorial
cd qiime2-atacama-tutorial
# 下载实验设计:Google文档在中国大陆无法下载,直接使用我建立的备用链接
# wget -O "sample-metadata.tsv" "https://data.qiime2.org/2017.6/tutorials/atacama-soils/sample_metadata.tsv"
wget http://bailab.genetics.ac.cn/markdown/QIIME2/atacama-soils/sample-metadata.tsv
# 下载双端实验数据(使用10%抽样数据方便下载和演示):分别为正向、反向和barcodes序列三个文件;文来自亚马逊云,有时无法下载或断开,只下载一个文件不同时间多试几次就成功了。
mkdir emp-paired-end-sequences
wget -O "emp-paired-end-sequences/forward.fastq.gz" "https://data.qiime2.org/2017.6/tutorials/atacama-soils/10p/forward.fastq.gz"
wget -O "emp-paired-end-sequences/reverse.fastq.gz" "https://data.qiime2.org/2017.6/tutorials/atacama-soils/10p/reverse.fastq.gz"
wget -O "emp-paired-end-sequences/barcodes.fastq.gz" "https://data.qiime2.org/2017.6/tutorials/atacama-soils/10p/barcodes.fastq.gz"
双端数据分析方法
# 双端数据导入,数据建库类型为EMP双端序列(本示例来自EMP项目)
qiime tools import \
--type EMPPairedEndSequences \
--input-path emp-paired-end-sequences \
--output-path emp-paired-end-sequences.qza
# 按Barcode进行样品:--m-barcodes-file为含有样品与barcode信息对应的实验设计,--m-barcodes-category指定含有barcode信息的列名称,--i-seqs输入文件,--o-per-sample-sequences输出文件, --p-rev-comp-mapping-barcodes为barcode方向,是用实验设计的barcode与测序文件比对确定方向,此分析中为反向互补
qiime demux emp-paired \
--m-barcodes-file sample-metadata.tsv \
--m-barcodes-category BarcodeSequence \
--i-seqs emp-paired-end-sequences.qza \
--o-per-sample-sequences demux \
--p-rev-comp-mapping-barcodes
# 对拆分样品的结果和质量进行统计
qiime demux summarize \
--i-data demux.qza \
--o-visualization demux.qzv
# 展示统计分析结果
qiime tools view demux.qzv
质量分析后,我们根据上图结果和相关表格来确定下步denoise分析参数。详细信息查看点下面链接
https://view.qiime2.org/visualization/?type=html&src=https%3A%2F%2Fdocs.qiime2.org%2F2017.6%2Fdata%2Ftutorials%2Fatacama-soils%2Fdemux.qzv 。网页中交互式图形可以查看每个碱基位置的详细信息。
去噪并生成Feature表和代表性序列
设置左端截掉13bp,右端不截。(我通常处理是先合并双端,再质控,再去引物,虽然复杂更感觉更合理。但此方法可能更适合EMP项目,每个人的设计不同,参数不同)
qiime dada2 denoise-paired \
--i-demultiplexed-seqs demux.qza \
--o-table table \
--o-representative-sequences rep-seqs \
--p-trim-left-f 13 \
--p-trim-left-r 13 \
--p-trunc-len-f 150 \
--p-trunc-len-r 150
# 查看Feature/OTU表的统计结果
qiime feature-table summarize \
--i-table table.qza \
--o-visualization table.qzv \
--m-sample-metadata-file sample-metadata.tsv
# 代表性序列统计
qiime feature-table tabulate-seqs \
--i-data rep-seqs.qza \
--o-visualization rep-seqs.qzv
结果本地qiime tools view查看,本地没有配置可视化环境的,请下载文件在线查看 view.qiime2.org
大家先本地或在线分析Feature表和代表性序列的统计结果,先熟悉数据。再按照2分析实战中方法,继续建树、多样性分析及比较,回答下面的问题?
接下来分析并回答的问题
接下来OTU表标准化参数—p-sampling-depth应该选多少?有多少样品应该从实验中剔除?过滤后核心矩阵中有多少数据量?
实验设计中的那种分级方式中微生物组成差异最大?采用那种距离计算方法分开更明显,是unweighted UniFrac还是Bray-Curtis?考虑尝试使用
qiime diversity beta-correlation and qiime diversity bioenv
分析结果,可以使用--help
查看详细帮助。使用
qiime diversity alpha-correlation
分析样品间的相关性,看看能得到什么结论?按组分析Alpha多样性,并比较是否有显著差异?
在门水平查看不同温度下微生物组成?看那些种类与湿度相关?
在有无植被的取样地点,什么菌门差异明显?
Acknowledgements
本文的数据来自 干旱土壤微生物组:显著增加与温度,在mSystems正在审稿
Reference
https://docs.qiime2.org/2017.6/tutorials/atacama-soils/
The data used in this tutorial is presented in: Arid Soil Microbiome: Significant Impacts of Increasing Aridity. Neilson, Califf, Cardona, Copeland, van Treuren, Josephson, Knight, Gilbert, Quade, Caporaso, and Maier. mSystems (under review).
科研经验系列文章
1云笔记积累个人知识体系
2云协作建立实验室工作总结和内部资料共享平台
3公众号建立实验室共享知识体系和宣传窗口
扩增子图表解读第一季
1箱线图:Alpha多样性,老板再也不操心的我文献阅读了
2散点图:组间整体差异分析(Beta多样性)
3热图:差异菌、OTU及功能
4曼哈顿图:差异OTU或Taxonomy
5火山图:差异OTU数量及变化规律
6韦恩图:比较组间共有和特有OTU或分类单元
7三元图:一图展示三组两两比较
8网络图:节点OTU或类Venn比较
扩增子分析
QIIME2. 2分析实战-最简单的完整分析实例Moving Pictures
QIIME. 2.使用Docker安装并运行
QIIME. 3以管理员安装1.9.1至Ubuntu16.04
微生物相关网络构建教程中文:MENA, LSA, SparCC和 CoNet四种网络
扩增子文献
Nautre:Gordon组文章—采用甘露糖苷选择性抑制尿路致病性大肠杆菌
Nature:植物微生物组开山之作--拟南芥根微生物组的结构和组成
Microbiome:简单套路发高分文章--白杨内生和根际微生物组结构