扩增子分析QIIME2. 9训练特征分类集Training feature classifiers
点击上方蓝色「宏基因组」关注我们!专业干货每日推送!
声明:本文为QIIME2官方帮助文档的中文版,由中科院遗传发育所刘永鑫博士翻译并亲测有效,文档翻译己获QIIME2团队官方授权。由于QIIME2更新频繁,如使用中遇到问题请访问QIIME2官方论坛阅读最新版中文帮助。
https://forum.qiime2.org/t/qiime2-1-chinese-manual/838
如中文翻译没有急时更新,请阅读英文原版 https://docs.qiime2.org
扩增子分析QIIME2. 9训练特征分类集Training feature classifiers with q2-feature-classifier
完成此本文分析,必须成功安装QIIME2。
为什么为训练分类集?
因为不同实验的扩增区域不同,鉴定物种分类的精度不同,提前的训练可以让分类结果更准确。
分析前准备
# 安装QIIME2 2017.7,安装过的请跳过
conda update conda
conda create -n qiime2-2017.7 --file https://data.qiime2.org/distro/core/qiime2-2017.7-conda-linux-64.txt
# 激活工作环境
source activate qiime2-2017.7
# 建立工作目录
mkdir training-feature-classifiers
cd training-feature-classifiers
下载和导入参考数据集
# 下载参考OTU数据集
wget -O "85_otus.fasta" "https://data.qiime2.org/2017.7/tutorials/training-feature-classifiers/85_otus.fasta"
# 原文件数据下载缓慢,无法下载尝试我建立的备份
rm 85_otus.fasta
wget http://bailab.genetics.ac.cn/markdown/QIIME2/85_otus.fasta
# 下载参考数据集的物种分类信息
wget -O "85_otu_taxonomy.txt" "https://data.qiime2.org/2017.7/tutorials/training-feature-classifiers/85_otu_taxonomy.txt"
# 下载研究中分析得到的代表性序列文件:示例
wget -O "rep-seqs.qza" "https://data.qiime2.org/2017.7/tutorials/training-feature-classifiers/rep-seqs.qza"
# 导入参考序列
qiime tools import \
--type 'FeatureData[Sequence]' \
--input-path 85_otus.fasta \
--output-path 85_otus.qza
# 导入物种分类信息
qiime tools import \
--type 'FeatureData[Taxonomy]' \
--source-format HeaderlessTSVTaxonomyFormat \
--input-path 85_otu_taxonomy.txt \
--output-path ref-taxonomy.qza
提取参考序列 Extract reference reads
# 按我们测序的引物来提取参考序列中的一段
qiime feature-classifier extract-reads \
--i-sequences 85_otus.qza \
--p-f-primer GTGCCAGCMGCCGCGGTAA \
--p-r-primer GGACTACHVGGGTWTCTAAT \
--p-trunc-len 100 \
--o-reads ref-seqs.qza
训练分类集
# 基于筛选的指定区段,生成实验特异的分类集
qiime feature-classifier fit-classifier-naive-bayes \
--i-reference-reads ref-seqs.qza \
--i-reference-taxonomy ref-taxonomy.qza \
--o-classifier classifier.qza
测试分类集
# 使用训练后的分类集对结果进行注释
qiime feature-classifier classify-sklearn \
--i-classifier classifier.qza \
--i-reads rep-seqs.qza \
--o-classification taxonomy.qza
# 可视化注释的结果
qiime metadata tabulate \
--m-input-file taxonomy.qza \
--o-visualization taxonomy.qzv
下载并在线view.qiime2.org查看;或点击链接查看预计算的结果https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.7%2Fdata%2Ftutorials%2Ffeature-classifier%2Ftaxonomy.qzv
感兴趣的朋友,可以拿这个训练后的结果,和之前的比较。看看有什么变化?
Reference
https://docs.qiime2.org/2017.7/tutorials/feature-classifier/
科研经验
1云笔记积累个人知识体系
2云协作建立实验室工作总结和内部资料共享平台
3公众号建立实验室共享知识体系和宣传窗口
宏基因组公众号14天受邀原创-诚邀同行共享研究经验
扩增子图表解读第一季
1箱线图:Alpha多样性,老板再也不操心的我文献阅读了
2散点图:组间整体差异分析(Beta多样性)
3热图:差异菌、OTU及功能
4曼哈顿图:差异OTU或Taxonomy
5火山图:差异OTU数量及变化规律
6韦恩图:比较组间共有和特有OTU或分类单元
7三元图:美的不要不要的,再多用也不过分
8网络图:节点OTU或类Venn比较
扩增子分析
QIIME2. 2最简单的完整分析实例Moving Pictures
微生物相关网络教程:MENA, LSA, SparCC和 CoNet
QIIME. 2.使用Docker安装并运行
QIIME. 3以管理员安装1.9.1至Ubuntu16.04
扩增子文献
Review:Microbiota, metagenome, microbiome傻傻分不清
Nautre:Gordon文章—甘露糖苷选择性抑制致病性大肠杆菌
Nature:培养组学+人工重组菌群,微生物组从描述转向功能研究
Microbiome:简单套路发高分文章--白杨内生和根际微生物组
Microbiome:宏蛋白质组揭示人肠道菌群功能,离真相更近一步
想了解更多宏基因组、16S分析相关文章,
快关注“宏基因组”公众号,干货第一时间推送。
系统学习生物信息,快关注“生信宝典”,
那里有几千志同道合的小伙伴一起学习。