查看原文
其他

扩增子分析QIIME2. 4-沙漠土分析实战Atacama soil

2017-07-31 刘永鑫 宏基因组

欢迎点击「宏基因组」关注我们!专业干货每日推送!

声明:本文为QIIME2官方帮助文档的中文版,由中科院遗传发育所刘永鑫博士翻译并亲测有效,文档翻译己获QIIME2团队官方授权。由于QIIME2更新频繁,如使用中遇到问题请访问QIIME2官方论坛阅读最新版中文帮助。https://forum.qiime2.org/t/qiime2-1-chinese-manual/838 如中文翻译没有急时更新,新阅读英文原版 https://docs.qiime2.org本人只习惯使用命令行模式分析数据,图形界面和Ipython模式下使用暂不介绍。本系列的教程主要以命令行方式为大家演示。在其它方面有使用的经验的朋友,欢迎共享您的使用笔记于“宏基因组”公众号,方便大家学习和使用。

扩增子分析QIIME2. 4阿塔卡马沙漠微生物组分析

原文地址: https://docs.qiime2.org/2017.6/tutorials/atacama-soils/

此实例需要一些基础知识,要求完成本系列文章前两篇内容:1简介和安装和2分析实战Moving Pictures。

本教程设计有两个目的:熟悉双端数据的处理;基于Moving Pictures后的主自分析练习以积累项目经验。

实验设计

本实验研究对像为智利北部的阿塔卡马沙漠。 此地为世界上最干旱的地区之一,其中有些地方十年降水量不足1毫米。尽管这里极端干旱,但仍有微生物生活在这里。我们的采样地点为东部的Baquedano和西部的Yungay,发现土壤温度与降水量正相关。在这两个地点,我们挖坑,并在不同深度取三组样品。

实验数据下载

# 激活工作环境 source activate qiime2-2017.6 # 建立工作目录 mkdir qiime2-atacama-tutorial cd qiime2-atacama-tutorial # 下载实验设计:Google文档在中国大陆无法下载,直接使用我建立的备用链接 # wget -O "sample-metadata.tsv" "https://data.qiime2.org/2017.6/tutorials/atacama-soils/sample_metadata.tsv" wget http://bailab.genetics.ac.cn/markdown/QIIME2/atacama-soils/sample-metadata.tsv # 下载双端实验数据(使用10%抽样数据方便下载和演示):分别为正向、反向和barcodes序列三个文件;文来自亚马逊云,有时无法下载或断开,只下载一个文件不同时间多试几次就成功了。 mkdir emp-paired-end-sequences wget -O "emp-paired-end-sequences/forward.fastq.gz" "https://data.qiime2.org/2017.6/tutorials/atacama-soils/10p/forward.fastq.gz" wget -O "emp-paired-end-sequences/reverse.fastq.gz" "https://data.qiime2.org/2017.6/tutorials/atacama-soils/10p/reverse.fastq.gz" wget -O "emp-paired-end-sequences/barcodes.fastq.gz" "https://data.qiime2.org/2017.6/tutorials/atacama-soils/10p/barcodes.fastq.gz"

双端数据分析方法

# 双端数据导入,数据建库类型为EMP双端序列(本示例来自EMP项目) qiime tools import \   --type EMPPairedEndSequences \   --input-path emp-paired-end-sequences \   --output-path emp-paired-end-sequences.qza # 按Barcode进行样品:--m-barcodes-file为含有样品与barcode信息对应的实验设计,--m-barcodes-category指定含有barcode信息的列名称,--i-seqs输入文件,--o-per-sample-sequences输出文件, --p-rev-comp-mapping-barcodes为barcode方向,是用实验设计的barcode与测序文件比对确定方向,此分析中为反向互补 qiime demux emp-paired \  --m-barcodes-file sample-metadata.tsv \  --m-barcodes-category BarcodeSequence \  --i-seqs emp-paired-end-sequences.qza \  --o-per-sample-sequences demux \  --p-rev-comp-mapping-barcodes # 对拆分样品的结果和质量进行统计 qiime demux summarize \  --i-data demux.qza \  --o-visualization demux.qzv # 展示统计分析结果 qiime tools view demux.qzv

质量分析后,我们根据上图结果和相关表格来确定下步denoise分析参数。详细信息查看点下面链接
https://view.qiime2.org/visualization/?type=html&src=https%3A%2F%2Fdocs.qiime2.org%2F2017.6%2Fdata%2Ftutorials%2Fatacama-soils%2Fdemux.qzv 。网页中交互式图形可以查看每个碱基位置的详细信息。

去噪并生成Feature表和代表性序列

设置左端截掉13bp,右端不截。(我通常处理是先合并双端,再质控,再去引物,虽然复杂更感觉更合理。但此方法可能更适合EMP项目,每个人的设计不同,参数不同)

qiime dada2 denoise-paired \  --i-demultiplexed-seqs demux.qza \  --o-table table \  --o-representative-sequences rep-seqs \  --p-trim-left-f 13 \  --p-trim-left-r 13 \  --p-trunc-len-f 150 \  --p-trunc-len-r 150 # 查看Feature/OTU表的统计结果 qiime feature-table summarize \  --i-table table.qza \  --o-visualization table.qzv \  --m-sample-metadata-file sample-metadata.tsv # 代表性序列统计 qiime feature-table tabulate-seqs \  --i-data rep-seqs.qza \  --o-visualization rep-seqs.qzv

结果本地qiime tools view查看,本地没有配置可视化环境的,请下载文件在线查看 view.qiime2.org
大家先本地或在线分析Feature表和代表性序列的统计结果,先熟悉数据。再按照2分析实战中方法,继续建树、多样性分析及比较,回答下面的问题?

接下来分析并回答的问题

  1. 接下来OTU表标准化参数—p-sampling-depth应该选多少?有多少样品应该从实验中剔除?过滤后核心矩阵中有多少数据量?

  2. 实验设计中的那种分级方式中微生物组成差异最大?采用那种距离计算方法分开更明显,是unweighted UniFrac还是Bray-Curtis?考虑尝试使用qiime diversity beta-correlation and qiime diversity bioenv分析结果,可以使用--help查看详细帮助。

  3. 使用qiime diversity alpha-correlation分析样品间的相关性,看看能得到什么结论?

  4. 按组分析Alpha多样性,并比较是否有显著差异?

  5. 在门水平查看不同温度下微生物组成?看那些种类与湿度相关?

  6. 在有无植被的取样地点,什么菌门差异明显?

Acknowledgements

本文的数据来自 干旱土壤微生物组:显著增加与温度,在mSystems正在审稿

Reference

  1. https://docs.qiime2.org/2017.6/tutorials/atacama-soils/

  2. The data used in this tutorial is presented in: Arid Soil Microbiome: Significant Impacts of Increasing Aridity. Neilson, Califf, Cardona, Copeland, van Treuren, Josephson, Knight, Gilbert, Quade, Caporaso, and Maier. mSystems (under review).

科研经验系列文章

1云笔记积累个人知识体系

2云协作建立实验室工作总结和内部资料共享平台

3公众号建立实验室共享知识体系和宣传窗口

扩增子图表解读第一季

1箱线图:Alpha多样性,老板再也不操心的我文献阅读了

2散点图:组间整体差异分析(Beta多样性)

3热图:差异菌、OTU及功能

4曼哈顿图:差异OTU或Taxonomy

5火山图:差异OTU数量及变化规律

6韦恩图:比较组间共有和特有OTU或分类单元

7三元图:一图展示三组两两比较

8网络图:节点OTU或类Venn比较

扩增子分析

QIIME2. 1简介和安装

QIIME2. 2分析实战-最简单的完整分析实例Moving Pictures

QIIME2. 3分析实战-粪便菌群移植FMT

QIIME. 1虚拟机安装配置及挂载外部目录

QIIME. 2.使用Docker安装并运行

QIIME. 3以管理员安装1.9.1至Ubuntu16.04

微生物相关网络构建教程中文:MENA, LSA, SparCC和 CoNet四种网络

扩增子文献

Nautre:Gordon组文章—采用甘露糖苷选择性抑制尿路致病性大肠杆菌

Nature:植物微生物组开山之作--拟南芥根微生物组的结构和组成

Microbiome:简单套路发高分文章--白杨内生和根际微生物组结构

Cell:国产首篇CNS--大肠癌耐化疗药,细菌是帮凶

Microbiome:宏蛋白质组揭示健康人肠道菌群的功能,离真相更近了一步

Nature:培养组学+人工重组菌,微生物组从描述转向功能研究

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存