查看原文
其他

宏基因组扩增子最新分析流程QIIME2:官方中文帮助文档

2017-09-13 刘永鑫 宏基因组

点击上方蓝色「宏基因组」关注我们!专业干货每日推送!

注:文为蓝色字均为文章链接,可点击直达

写在前面

声明:本文为QIIME2官方帮助文档的中文版,由中科院遗传发育所刘永鑫博士翻译并亲测有效,文档翻译己获QIIME2团队官方授权。由于QIIME2更新频繁,如使用中遇到问题请访问QIIME2官方论坛阅读最新版中文帮助。
https://forum.qiime2.org/t/qiime2-1-chinese-manual/838
如中文翻译没有急时更新,新阅读英文原版 https://docs.qiime2.org

本人只习惯使用命令行模式分析数据,图形界面和Ipython模式下使用暂不介绍。本系列的教程主要以命令行方式为大家演示。在其它方面有使用的经验的朋友,欢迎共享您的使用笔记发布于“宏基因组”公众号,方便大家学习和使用。

简介

QIIME2是微生物组分析流程QIIME(截止17.9.10被引8335次)的全新版(不是升级版),采用python3全新编写,并于2018年1月全面接档QIIME,是代表末来的分析方法标准(大牛们制定方法标准,我们跟着用就好了)。

目前还在不断开发中,建议只做学习,不要直接用于分析课题,功能还不完善。但思路和方法是最新的。

优点

  1. 更易于安装:曾经QIIME的安装让无数生信人竞折腰,QIIME2引入了Miniconda软件包管理器,没有管理员权限也可以轻松安装;同时发布了docker镜像,下载即可运行;

  2. 使用方法多样:支持命令行模式(q2cli),也支持图型用户界面q2studio;还有Python用户喜欢的Artifact API(类似IPython notebook);

  3. 分析流程化:分析流程更加标准化,不让用户盲然下面该做什么;

  4. 可视化增强:QIIME后发制人,超越引用6964次的mothur流程,就是其可视化方面的优势,现可视化结果更加漂亮,且全新采用交互式图形结果,点选可查看细节,更易于分析;

  5. 方便合作:项目很少一个组可完成,多人多地结果图表方便共享,适合当下科研合作的需求;

  6. 可扩展:支持自定义功能并加入分析流程;高手可以自己写包,加入QIIME2的流程中了;

  7. 分析可重复:全新定义了文件系统,即包括分析数据、也包括分析过程和结果,每一步的结果,均可追溯全部分析过程,方便检查和重复。

QIIME2官方帮助中文版

共分为9章,具体内容和简介如下。每章详细请点击标题。

1简介和安装

不同环境的安装方法,升级等。以及软件体系中的名词解释。

2人体微生物组分析实战Moving Pictures

示例的的数据来自文章《Moving pictures of the human microbiome》,Genome Biology 2011,取样来自两个人身体四个部位五个时间点。分析不同人、不同时间、不同组织间的微生物组差异。

3粪便菌群移植分析实战FMT

本实验研究自闭症且胃肠道功能紊乱患者,采用粪便菌群移植方法,来降低患者的行为异常和肠道紊乱。监测移植后18个月范围内肠道菌群的变化,采用MiSeq PE300测序技术。

4沙漠土微生物组分析实战Atacama soil

本实验研究对像为智利北部的阿塔卡马沙漠。 此地为世界上最干旱的地区之一,其中有些地方十年降水量不足1毫米。尽管这里极端干旱,但仍有微生物生活在这里。我们的采样地点为东部的Baquedano和西部的Yungay,发现土壤温度与降水量正相关。在这两个地点,我们挖坑,并在不同深度取三组样品。

5数据导入

QIIME2使用了标准文件格式qza和qzv,分别是数据文件和统计图表文件;目的是统一文件格式,方便追溯分析过程。
本人将带大家熟悉QIIME2分析流程的不同阶段,导入数据。

6数据导出

QIIME2采用统一qza文件格式,是为了保证文件格式统一和分析流程可追溯。但不可能要求每个人都用此需系统,需要导出其它软件兼容的格式,方便交流和其它用户更个性化的分析。

7实验设计编写

元数据是实验设计的描述信息表或统计结果,是分析原始数据必须的基本信息。
元数据是从原始数据中获得生物学发现的关键。在QIIME2中,样品的元数据包括技术细节,如DNA条形码用于区分样品、样品描述,如分类、时间点、取样部分等。对于特征表(Feature,原称OTU)的元数据,一般为特征的注释信息,如物种分类信息。样品和特征表的元数据在QIIME2中很多步分析需要使用。

8数据筛选

复杂的实验通常会有非常多的组,具体分析中会根据批次、处理条件、基因型等信息进行反复筛选和分析,是分析中常用的操作。本文主讲特征表(Feature/OTU table)和距离矩阵的筛选。

9训练物种分类器

因为不同实验的扩增区域不同,鉴定物种分类的精度不同,提前的训练可以让分类结果更准确。

更多相关文章,请点击“宏基因组”文章目录阅读;

想了解更多16S扩增子、宏基因组文献和分析相关文章,快关注“宏基因组”公众号,干货每日推送


系统学习生物信息,快关注“生信宝典”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存