查看原文
其他

扩增子分析QIIME2. 3粪便菌群移植FMT分析实战

2017-07-27 刘永鑫 宏基因组

欢迎点击「宏基因组」关注我们!专业干货每日推送!

声明:本文为QIIME2官方帮助文档的中文版,由中科院遗传发育所刘永鑫博士翻译并亲测有效,文档翻译己获QIIME2团队官方授权。由于QIIME2更新频繁,如使用中遇到问题请访问QIIME2官方论坛阅读最新版中文帮助。
https://forum.qiime2.org/t/qiime2-1-chinese-manual/838
如中文翻译没有急时更新,新阅读英文原版 https://docs.qiime2.org

本人只习惯使用命令行模式分析数据,图形界面和Ipython模式下使用暂不介绍。本系列的教程主要以命令行方式为大家演示。在其它方面有使用的经验的朋友,欢迎共享您的使用笔记于“宏基因组”公众号,方便大家学习和使用。

扩增子分析QIIME2. 3粪便菌群移植分析

原文地址: https://docs.qiime2.org/2017.6/tutorials/fmt/

此实例需要一些基础知识,要求完成本系列文章前两篇内容:1简介和安装2分析实战Moving Pictures

本实验研究自闭症且胃肠道功能紊乱患者,采用粪便菌群移植方法,来降低患者的行为异常和肠道紊乱。监测移植后18个月范围内肠道菌群的变化,采用Hiseq 单端150 bp 测序技术。下图为实验设计。

实验数据下载

# 激活工作环境 source activate qiime2-2017.6 # 创建工作目录并下载实验设计 mkdir qiime2-fmt-tutorial cd qiime2-fmt-tutorial wget -O "sample-metadata.tsv" "https://data.qiime2.org/2017.6/tutorials/fmt/sample_metadata.tsv" # 下载成功跳过此步,下载失败处理方法:因为中国大陆用户没没有访问google的权限,请删除空文件,并下载备用链接 rm sample-metadata.tsv wget http://bailab.genetics.ac.cn/markdown/QIIME2/sample-metadata.tsv # 下载实验数据,为演示分析,只使用原始数据10%的抽样结果,如果下载失败请重试即可。 wget -O "fmt-tutorial-demux-1.qza" "https://data.qiime2.org/2017.6/tutorials/fmt/fmt-tutorial-demux-1-10p.qza" wget -O "fmt-tutorial-demux-2.qza" "https://data.qiime2.org/2017.6/tutorials/fmt/fmt-tutorial-demux-2-10p.qza"

序列质控评估

# 序列质量评估 qiime demux summarize \  --i-data fmt-tutorial-demux-1.qza \  --o-visualization demux-summary-1.qzv qiime demux summarize \  --i-data fmt-tutorial-demux-2.qza \  --o-visualization demux-summary-2.qzv # 查看质量评估结果,用于确定下步质控的参数 qiime tools view demux-summary-1.qzv qiime tools view demux-summary-2.qzv

查看可视化评估结果,也可下载qzv文件,使用 view.qiime2.org 打开查看,或直接打开作者在线预计算好的结果。 https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.6%2Fdata%2Ftutorials%2Ffmt%2Fdemux-summary-1.qzv

问题:从上图中我们判断选择质控的参数是什么?
序列上游13 bp的序列质量偏低,设置trim-left 13截掉前13bp序列;整体150bp的质量都不错,则保留150 bp的序列长度。

Feature表和代表性序列生成

# dada2去质控和去冗余,本实验有两批独立的数据,需要处理两次,生成代表序列和OTU表 qiime dada2 denoise-single \  --p-trim-left 13 \  --p-trunc-len 150 \  --i-demultiplexed-seqs fmt-tutorial-demux-1.qza \  --o-representative-sequences rep-seqs-1.qza \  --o-table table-1.qza qiime dada2 denoise-single \  --p-trim-left 13 \  --p-trunc-len 150 \  --i-demultiplexed-seqs fmt-tutorial-demux-2.qza \  --o-representative-sequences rep-seqs-2.qza \  --o-table table-2.qza

合并不同组的序列和表

# 合并两组数据和OTU表 qiime feature-table merge \  --i-table1 table-1.qza \  --i-table2 table-2.qza \  --o-merged-table table.qza # 合并两组数据的代表性序列 qiime feature-table merge-seq-data \  --i-data1 rep-seqs-1.qza \  --i-data2 rep-seqs-2.qza \  --o-merged-data rep-seqs.qza # OTU表统计 qiime feature-table summarize \  --i-table table.qza \  --o-visualization table.qzv \  --m-sample-metadata-file sample-metadata.tsv # 查看Feature/OTU表的统计结果 qiime tools view table.qzv # 代表性序列统计 qiime feature-table tabulate-seqs \  --i-data rep-seqs.qza \  --o-visualization rep-seqs.qzv # 查看代表性序列的统计结果 qiime tools view rep-seqs.qzv

table.qzv文件中Feature/OTU表统计的结果如下,或在线查看详细信息:https://view.qiime2.org/visualization/?type=html&src=https%3A%2F%2Fdocs.qiime2.org%2F2017.6%2Fdata%2Ftutorials%2Ffmt%2Ftable.qzv  

OTU表总结

MetricSample
Number of samples121
Number of features337
Total frequency48,925

样品数据量分布

TypeFrequency
Minimum frequency84.0
1st quartile276.0
Median frequency380.0
3rd quartile492.0
Maximum frequency860.0
Mean frequency404.3388429752066

特征表频率统计

TypeFrequency
Minimum frequency2.0
1st quartile9.0
Median frequency24.0
3rd quartile85.0
Maximum frequency10,832.0
Mean frequency145.1780415430267

通过上表,我们可以确定Feature特征表标准化的重抽样数据,由于本测试,只用了文章原始数据的10%的数据,数据量很小,最小值为84,第一分位数为276,我们可选择276保留75%以上的样品。一般最小值最少1000,推荐5000以上。

多样性分析

现在我们已经获得了特征表(Feature/OTU),以及代表性序列(Feature Seq)
自己尝试用上篇文章的分析方法,回答下面这些问题。

前两节课的知识应该可以回答下面的问题,过两天我也会分析并做出答案。大家一定要实操才有真正分析的能力,想不出来就多操作和思路上一篇分析。

  1. 个人微生物组;

    1. 按subject-id分类存在组成差异?

    2. 按subject-id分类存在丰富度差异?

    3. 按subject-id分类存在均匀度差异?

  2. 菌群移植;

    1. 移植几周后,患者的菌群在unweighted unifrac距离下最像供体;

    2. 移植几周后,患者的菌群在bray-curtis距离下最像供体;

    3. 比较两种距离结果那种解释更好;

  3. 实验设计:比较粪便和试子样品采集方法

    1. 比较不同取样方法结果中最大差别的类别?差异类别用blast,或classifier注释有什么不同?

    2. 两类样品的unweighted unifrac和bray-curtis间有什么不同?

    3. 供体粪便与那种取样的结果更像?

    4. 两类取样方法的Alpha多样性存在差别吗?

  4. 每个测序Run中有多少样品?在不同测序Run中是否存在系统性差异?

Reference

  1. https://docs.qiime2.org/2017.6/tutorials/fmt/

  2. The data in this tutorial was initially presented in: Microbiota Transfer Therapy alters gut ecosystem and improves gastrointestinal and autism symptoms: an open-label study. Dae-Wook Kang, James B. Adams, Ann C. Gregory, Thomas Borody, Lauren Chittick, Alessio Fasano, Alexander Khoruts, Elizabeth Geis, Juan Maldonado, Sharon McDonough-Means, Elena L. Pollard, Simon Roux, Michael J. Sadowsky, Karen Schwarzberg Lipson, Matthew B. Sullivan, J. Gregory Caporaso and Rosa Krajmalnik-Brown. Microbiome (2017) 5:10. DOI: 10.1186/s40168-016-0225-7.

科研经验系列文章

1云笔记积累个人知识体系

2云协作建立实验室工作总结和内部资料共享平台

3公众号建立实验室共享知识体系和宣传窗口

扩增子图表解读第一季

1箱线图:Alpha多样性,老板再也不操心的我文献阅读了

2散点图:组间整体差异分析(Beta多样性)

3热图:差异菌、OTU及功能

4曼哈顿图:差异OTU或Taxonomy

5火山图:差异OTU数量及变化规律

6韦恩图:比较组间共有和特有OTU或分类单元

7三元图:一图展示三组两两比较

8网络图:节点OTU或类Venn比较

扩增子分析

QIIME2. 1简介和安装

QIIME2. 2分析实战Moving Pictures

QIIME. 1虚拟机安装配置及挂载外部目录

QIIME. 2.使用Docker安装并运行

QIIME. 3以管理员安装1.9.1至Ubuntu16.04

微生物相关网络构建教程中文:MENA, LSA, SparCC和 CoNet四种网络

想了解更多宏基因组、16S分析相关文章,

快关注“宏基因组”公众号,干货第一时间推送。

系统学习生物信息,快关注“生信宝典”,

那里有几千志同道合的小伙伴一起学习。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存