扩增子分析QIIME2. 3粪便菌群移植FMT分析实战
欢迎点击「宏基因组」关注我们!专业干货每日推送!
声明:本文为QIIME2官方帮助文档的中文版,由中科院遗传发育所刘永鑫博士翻译并亲测有效,文档翻译己获QIIME2团队官方授权。由于QIIME2更新频繁,如使用中遇到问题请访问QIIME2官方论坛阅读最新版中文帮助。
https://forum.qiime2.org/t/qiime2-1-chinese-manual/838
如中文翻译没有急时更新,新阅读英文原版 https://docs.qiime2.org
本人只习惯使用命令行模式分析数据,图形界面和Ipython模式下使用暂不介绍。本系列的教程主要以命令行方式为大家演示。在其它方面有使用的经验的朋友,欢迎共享您的使用笔记于“宏基因组”公众号,方便大家学习和使用。
扩增子分析QIIME2. 3粪便菌群移植分析
原文地址: https://docs.qiime2.org/2017.6/tutorials/fmt/
此实例需要一些基础知识,要求完成本系列文章前两篇内容:1简介和安装和2分析实战Moving Pictures。
本实验研究自闭症且胃肠道功能紊乱患者,采用粪便菌群移植方法,来降低患者的行为异常和肠道紊乱。监测移植后18个月范围内肠道菌群的变化,采用Hiseq 单端150 bp 测序技术。下图为实验设计。
实验数据下载
# 激活工作环境
source activate qiime2-2017.6
# 创建工作目录并下载实验设计
mkdir qiime2-fmt-tutorial
cd qiime2-fmt-tutorial
wget -O "sample-metadata.tsv" "https://data.qiime2.org/2017.6/tutorials/fmt/sample_metadata.tsv"
# 下载成功跳过此步,下载失败处理方法:因为中国大陆用户没没有访问google的权限,请删除空文件,并下载备用链接
rm sample-metadata.tsv
wget http://bailab.genetics.ac.cn/markdown/QIIME2/sample-metadata.tsv
# 下载实验数据,为演示分析,只使用原始数据10%的抽样结果,如果下载失败请重试即可。
wget -O "fmt-tutorial-demux-1.qza" "https://data.qiime2.org/2017.6/tutorials/fmt/fmt-tutorial-demux-1-10p.qza"
wget -O "fmt-tutorial-demux-2.qza" "https://data.qiime2.org/2017.6/tutorials/fmt/fmt-tutorial-demux-2-10p.qza"
序列质控评估
# 序列质量评估
qiime demux summarize \
--i-data fmt-tutorial-demux-1.qza \
--o-visualization demux-summary-1.qzv
qiime demux summarize \
--i-data fmt-tutorial-demux-2.qza \
--o-visualization demux-summary-2.qzv
# 查看质量评估结果,用于确定下步质控的参数
qiime tools view demux-summary-1.qzv
qiime tools view demux-summary-2.qzv
查看可视化评估结果,也可下载qzv文件,使用 view.qiime2.org 打开查看,或直接打开作者在线预计算好的结果。 https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.6%2Fdata%2Ftutorials%2Ffmt%2Fdemux-summary-1.qzv
问题:从上图中我们判断选择质控的参数是什么?
序列上游13 bp的序列质量偏低,设置trim-left 13截掉前13bp序列;整体150bp的质量都不错,则保留150 bp的序列长度。
Feature表和代表性序列生成
# dada2去质控和去冗余,本实验有两批独立的数据,需要处理两次,生成代表序列和OTU表
qiime dada2 denoise-single \
--p-trim-left 13 \
--p-trunc-len 150 \
--i-demultiplexed-seqs fmt-tutorial-demux-1.qza \
--o-representative-sequences rep-seqs-1.qza \
--o-table table-1.qza
qiime dada2 denoise-single \
--p-trim-left 13 \
--p-trunc-len 150 \
--i-demultiplexed-seqs fmt-tutorial-demux-2.qza \
--o-representative-sequences rep-seqs-2.qza \
--o-table table-2.qza
合并不同组的序列和表
# 合并两组数据和OTU表
qiime feature-table merge \
--i-table1 table-1.qza \
--i-table2 table-2.qza \
--o-merged-table table.qza
# 合并两组数据的代表性序列
qiime feature-table merge-seq-data \
--i-data1 rep-seqs-1.qza \
--i-data2 rep-seqs-2.qza \
--o-merged-data rep-seqs.qza
# OTU表统计
qiime feature-table summarize \
--i-table table.qza \
--o-visualization table.qzv \
--m-sample-metadata-file sample-metadata.tsv
# 查看Feature/OTU表的统计结果
qiime tools view table.qzv
# 代表性序列统计
qiime feature-table tabulate-seqs \
--i-data rep-seqs.qza \
--o-visualization rep-seqs.qzv
# 查看代表性序列的统计结果
qiime tools view rep-seqs.qzv
table.qzv文件中Feature/OTU表统计的结果如下,或在线查看详细信息:https://view.qiime2.org/visualization/?type=html&src=https%3A%2F%2Fdocs.qiime2.org%2F2017.6%2Fdata%2Ftutorials%2Ffmt%2Ftable.qzv
OTU表总结
Metric | Sample |
---|---|
Number of samples | 121 |
Number of features | 337 |
Total frequency | 48,925 |
样品数据量分布
Type | Frequency |
---|---|
Minimum frequency | 84.0 |
1st quartile | 276.0 |
Median frequency | 380.0 |
3rd quartile | 492.0 |
Maximum frequency | 860.0 |
Mean frequency | 404.3388429752066 |
特征表频率统计
Type | Frequency |
---|---|
Minimum frequency | 2.0 |
1st quartile | 9.0 |
Median frequency | 24.0 |
3rd quartile | 85.0 |
Maximum frequency | 10,832.0 |
Mean frequency | 145.1780415430267 |
通过上表,我们可以确定Feature特征表标准化的重抽样数据,由于本测试,只用了文章原始数据的10%的数据,数据量很小,最小值为84,第一分位数为276,我们可选择276保留75%以上的样品。一般最小值最少1000,推荐5000以上。
多样性分析
现在我们已经获得了特征表(Feature/OTU),以及代表性序列(Feature Seq)
自己尝试用上篇文章的分析方法,回答下面这些问题。
前两节课的知识应该可以回答下面的问题,过两天我也会分析并做出答案。大家一定要实操才有真正分析的能力,想不出来就多操作和思路上一篇分析。
个人微生物组;
按subject-id分类存在组成差异?
按subject-id分类存在丰富度差异?
按subject-id分类存在均匀度差异?
菌群移植;
移植几周后,患者的菌群在unweighted unifrac距离下最像供体;
移植几周后,患者的菌群在bray-curtis距离下最像供体;
比较两种距离结果那种解释更好;
实验设计:比较粪便和试子样品采集方法
比较不同取样方法结果中最大差别的类别?差异类别用blast,或classifier注释有什么不同?
两类样品的unweighted unifrac和bray-curtis间有什么不同?
供体粪便与那种取样的结果更像?
两类取样方法的Alpha多样性存在差别吗?
每个测序Run中有多少样品?在不同测序Run中是否存在系统性差异?
Reference
https://docs.qiime2.org/2017.6/tutorials/fmt/
The data in this tutorial was initially presented in: Microbiota Transfer Therapy alters gut ecosystem and improves gastrointestinal and autism symptoms: an open-label study. Dae-Wook Kang, James B. Adams, Ann C. Gregory, Thomas Borody, Lauren Chittick, Alessio Fasano, Alexander Khoruts, Elizabeth Geis, Juan Maldonado, Sharon McDonough-Means, Elena L. Pollard, Simon Roux, Michael J. Sadowsky, Karen Schwarzberg Lipson, Matthew B. Sullivan, J. Gregory Caporaso and Rosa Krajmalnik-Brown. Microbiome (2017) 5:10. DOI: 10.1186/s40168-016-0225-7.
科研经验系列文章
1云笔记积累个人知识体系
2云协作建立实验室工作总结和内部资料共享平台
3公众号建立实验室共享知识体系和宣传窗口
扩增子图表解读第一季
1箱线图:Alpha多样性,老板再也不操心的我文献阅读了
2散点图:组间整体差异分析(Beta多样性)
3热图:差异菌、OTU及功能
4曼哈顿图:差异OTU或Taxonomy
5火山图:差异OTU数量及变化规律
6韦恩图:比较组间共有和特有OTU或分类单元
7三元图:一图展示三组两两比较
8网络图:节点OTU或类Venn比较
扩增子分析
QIIME. 2.使用Docker安装并运行
QIIME. 3以管理员安装1.9.1至Ubuntu16.04
微生物相关网络构建教程中文:MENA, LSA, SparCC和 CoNet四种网络
想了解更多宏基因组、16S分析相关文章,
快关注“宏基因组”公众号,干货第一时间推送。
系统学习生物信息,快关注“生信宝典”,
那里有几千志同道合的小伙伴一起学习。