查看原文
其他

扩增子分析QIIME2. 9训练特征分类集Training feature classifiers

2017-08-06 刘永鑫 宏基因组

点击上方蓝色「宏基因组」关注我们!专业干货每日推送!

声明:本文为QIIME2官方帮助文档的中文版,由中科院遗传发育所刘永鑫博士翻译并亲测有效,文档翻译己获QIIME2团队官方授权。由于QIIME2更新频繁,如使用中遇到问题请访问QIIME2官方论坛阅读最新版中文帮助。
https://forum.qiime2.org/t/qiime2-1-chinese-manual/838
如中文翻译没有急时更新,请阅读英文原版 https://docs.qiime2.org

扩增子分析QIIME2. 9训练特征分类集Training feature classifiers with q2-feature-classifier

完成此本文分析,必须成功安装QIIME2。

为什么为训练分类集?

因为不同实验的扩增区域不同,鉴定物种分类的精度不同,提前的训练可以让分类结果更准确。

分析前准备

# 安装QIIME2 2017.7,安装过的请跳过 conda update conda conda create -n qiime2-2017.7 --file https://data.qiime2.org/distro/core/qiime2-2017.7-conda-linux-64.txt # 激活工作环境 source activate qiime2-2017.7 # 建立工作目录 mkdir training-feature-classifiers cd training-feature-classifiers

下载和导入参考数据集

# 下载参考OTU数据集 wget -O "85_otus.fasta" "https://data.qiime2.org/2017.7/tutorials/training-feature-classifiers/85_otus.fasta" # 原文件数据下载缓慢,无法下载尝试我建立的备份 rm 85_otus.fasta wget http://bailab.genetics.ac.cn/markdown/QIIME2/85_otus.fasta # 下载参考数据集的物种分类信息 wget -O "85_otu_taxonomy.txt" "https://data.qiime2.org/2017.7/tutorials/training-feature-classifiers/85_otu_taxonomy.txt" # 下载研究中分析得到的代表性序列文件:示例 wget -O "rep-seqs.qza" "https://data.qiime2.org/2017.7/tutorials/training-feature-classifiers/rep-seqs.qza" # 导入参考序列 qiime tools import \  --type 'FeatureData[Sequence]' \  --input-path 85_otus.fasta \  --output-path 85_otus.qza # 导入物种分类信息 qiime tools import \  --type 'FeatureData[Taxonomy]' \  --source-format HeaderlessTSVTaxonomyFormat \  --input-path 85_otu_taxonomy.txt \  --output-path ref-taxonomy.qza

提取参考序列 Extract reference reads

# 按我们测序的引物来提取参考序列中的一段 qiime feature-classifier extract-reads \  --i-sequences 85_otus.qza \  --p-f-primer GTGCCAGCMGCCGCGGTAA \  --p-r-primer GGACTACHVGGGTWTCTAAT \  --p-trunc-len 100 \  --o-reads ref-seqs.qza

训练分类集

# 基于筛选的指定区段,生成实验特异的分类集 qiime feature-classifier fit-classifier-naive-bayes \  --i-reference-reads ref-seqs.qza \  --i-reference-taxonomy ref-taxonomy.qza \  --o-classifier classifier.qza

测试分类集

# 使用训练后的分类集对结果进行注释 qiime feature-classifier classify-sklearn \  --i-classifier classifier.qza \  --i-reads rep-seqs.qza \  --o-classification taxonomy.qza # 可视化注释的结果 qiime metadata tabulate \  --m-input-file taxonomy.qza \  --o-visualization taxonomy.qzv

下载并在线view.qiime2.org查看;或点击链接查看预计算的结果https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.7%2Fdata%2Ftutorials%2Ffeature-classifier%2Ftaxonomy.qzv

感兴趣的朋友,可以拿这个训练后的结果,和之前的比较。看看有什么变化?

Reference

  1. https://docs.qiime2.org/2017.7/tutorials/feature-classifier/

科研经验

1云笔记积累个人知识体系
2云协作建立实验室工作总结和内部资料共享平台
3公众号建立实验室共享知识体系和宣传窗口
宏基因组公众号14天受邀原创-诚邀同行共享研究经验

扩增子图表解读第一季

1箱线图:Alpha多样性,老板再也不操心的我文献阅读了
2散点图:组间整体差异分析(Beta多样性)
3热图:差异菌、OTU及功能
4曼哈顿图:差异OTU或Taxonomy
5火山图:差异OTU数量及变化规律
6韦恩图:比较组间共有和特有OTU或分类单元
7三元图:美的不要不要的,再多用也不过分
8网络图:节点OTU或类Venn比较  

扩增子分析

QIIME2. 1简介和安装

QIIME2. 2最简单的完整分析实例Moving Pictures

QIIME2. 3粪便菌群移植分析FMT

QIIME2. 4-沙漠土分析Atacama soil

antiSMASH微生物次生代谢物合成基因组簇查询和预测

微生物相关网络教程:MENA, LSA, SparCC和 CoNet

QIIME. 1虚拟机安装配置及挂载外部目录

QIIME. 2.使用Docker安装并运行

QIIME. 3以管理员安装1.9.1至Ubuntu16.04

扩增子文献

Review:Microbiota, metagenome, microbiome傻傻分不清

Nature:植物微生物组开山之作--拟南芥根微生物组

Nautre:Gordon文章—甘露糖苷选择性抑制致病性大肠杆菌

Nature:培养组学+人工重组菌群,微生物组从描述转向功能研究

Cell:国产首篇CNS--大肠癌耐化疗药,细菌是帮凶

Microbiome:简单套路发高分文章--白杨内生和根际微生物组

Microbiome:宏蛋白质组揭示人肠道菌群功能,离真相更近一步

想了解更多宏基因组、16S分析相关文章,

快关注“宏基因组”公众号,干货第一时间推送。

系统学习生物信息,快关注“生信宝典”,

那里有几千志同道合的小伙伴一起学习。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存