查看原文
其他

扩增子分析QIIME2. 7元数据Metadata

2017-08-04 刘永鑫 宏基因组

点击上方蓝色「宏基因组」关注我们!专业干货每日推送!

本节分析需要完成本系列前两章:QIIME2安装和分析实战Moving Picture。

什么是元数据Metadata

元数据是实验设计的描述信息表或统计结果,是分析原始数据必须的基本信息。
元数据是从原始数据中获得生物学发现的关键。在QIIME2中,样品的元数据包括技术细节,如DNA条形码用于区分样品、样品描述,如分类、时间点、取样部分等。对于特征表(Feature,原称OTU)的元数据,一般为特征的注释信息,如物种分类信息。样品和特征表的元数据在QIIME2中很多步分析需要使用。

文本格式实验设计(mapping file)格式要求

为了方便分析,对样品的描述必须包括一些基本信息和格式规范,QIIME2中实验设计mapping file基本要求如下:

  • 文件必须是制表符分隔的纯文本文件,建议使用Excel编辑并复制到纯文本编辑器(如editplus, ultraedit等)中保存为txt格式;

  • 注释行以#开头,可以出现在文中任意位置,程序会自己忽略;

  • 空行也会被忽略;

  • 第一行为表头,与QIIME1相比不再以#开头,更合理;

  • 表头每列名称必须唯一,不能包括标点符号;(建议实验设计只使用字母和数字,任何符号在后续分析都可能会有问题)

  • 文件至少包括除表头外的一行数据;

  • 第一列为样品名,用于标识每个样品,必须名字唯一。

下载示例元文件

mkdir qiime2-metadata-tutorial cd qiime2-metadata-tutorial # 下载示例样本信息 wget -O "sample-metadata.tsv" "https://data.qiime2.org/2017.7/tutorials/moving-pictures/sample_metadata.tsv" # 下载失败,尝试下面方法 rm sample-metadata.tsv wget http://bailab.genetics.ac.cn/markdown/QIIME2/metadata/sample-metadata.tsv

查看示例元文件—实验设计

# 使用less直接查看样品信息 less sample-metadata.tsv # 使用QIIME2生成网页查看 qiime metadata tabulate \  --m-input-file sample-metadata.tsv \  --o-visualization tabulated-sample-metadata.qzv # 查看网页结果 qiime tools view tabulated-sample-metadata.qzv

查看结果需要配置ssh方式的可视化,推荐阅读xshell+xmanager或xming配置ssh的X11转发,可图型显示支持;
或下载qzv文件在https://view.qiime2.org/网站在线查看;或直接点击下面链接查看
https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.7%2Fdata%2Ftutorials%2Fmetadata%2Ftabulated-sample-metadata.qzv

用户思考时间:
上面的示例元文件,subject-1的样品有多少个?来自gut的样品有多少个?
提示:linux下可以使用grep检索;网页中可以按列排序。

查看QIIME2生成的文件元数据

# 下载Alpha多样性PD算法的结果 wget -O "faith_pd_vector.qza" "https://data.qiime2.org/2017.7/tutorials/metadata/faith_pd_vector.qza" # 结果可视化 qiime metadata tabulate \  --m-input-file faith_pd_vector.qza \  --o-visualization tabulated-faith-pd-metadata.qzv

请最好下载在线查看效果最好,可以网页中直接操作结果(SSH转发的图像操作效果差)?

用户思考时间:
Faith’s PD的最大值是多少?最小值是多少?提示:使用列排序功能。
qzv文件包括结果生成的过程,请查看该结果的追溯图,研究分析过程。

组合型原数据

# 将样品信息和Alpha多样性组合可视化 qiime metadata tabulate \  --m-input-file sample-metadata.tsv \  --m-input-file faith_pd_vector.qza \  --o-visualization tabulated-combined-metadata.qzv

https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.7%2Fdata%2Ftutorials%2Fmetadata%2Ftabulated-combined-metadata.qzv 在线查看结果。用户自己的数据 ,需使用qiime tools view命令或下载后在线打开。

查看结果:只包括两个文件中的交集部分,这在以后是很常见的操作,用于选择部分结果。

# 组合Alpha和Beta多样性 wget -O "unweighted_unifrac_pcoa_results.qza" "https://data.qiime2.org/2017.7/tutorials/metadata/unweighted_unifrac_pcoa_results.qza" qiime emperor plot \  --i-pcoa unweighted_unifrac_pcoa_results.qza \  --m-metadata-file sample-metadata.tsv \  --m-metadata-file faith_pd_vector.qza \  --o-visualization unweighted-unifrac-emperor-with-alpha.qzv

https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.7%2Fdata%2Ftutorials%2Fmetadata%2Funweighted-unifrac-emperor-with-alpha.qzv 查看组合后的结果

思才情:那一类取样位置有最高的Faith’s进化多样性值?查看中使用按body site上色,再按Faith’s PD连续着色;

查看特征(Feature/OTU)元数据

wget -O "rep-seqs.qza" "https://data.qiime2.org/2017.7/tutorials/metadata/rep-seqs.qza" wget -O "taxonomy.qza" "https://data.qiime2.org/2017.7/tutorials/metadata/taxonomy.qza" qiime metadata tabulate \  --m-input-file rep-seqs.qza \  --m-input-file taxonomy.qza \  --o-visualization tabulated-feature-metadata.qzv

https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.7%2Fdata%2Ftutorials%2Fmetadata%2Ftabulated-feature-metadata.qzv 查看代表序列和分类信息的组合结果

用户思考:所有.qza都是元数据吗?使用qiime metadata tabulate自己试试吧。

网页中查看可以导出任意格式的结果,并可追溯实验的分析过程。

Reference

  1. https://docs.qiime2.org/2017.7/tutorials/metadata


科研经验

1云笔记积累个人知识体系
2云协作建立实验室工作总结和内部资料共享平台
3公众号建立实验室共享知识体系和宣传窗口
宏基因组公众号14天受邀原创-诚邀同行共享研究经验

扩增子图表解读第一季

1箱线图:Alpha多样性,老板再也不操心的我文献阅读了
2散点图:组间整体差异分析(Beta多样性)
3热图:差异菌、OTU及功能
4曼哈顿图:差异OTU或Taxonomy
5火山图:差异OTU数量及变化规律
6韦恩图:比较组间共有和特有OTU或分类单元
7三元图:美的不要不要的,再多用也不过分
8网络图:节点OTU或类Venn比较  

扩增子分析

QIIME2. 1简介和安装

QIIME2. 2最简单的完整分析实例Moving Pictures

QIIME2. 3粪便菌群移植分析FMT

QIIME2. 4-沙漠土分析Atacama soil

antiSMASH微生物次生代谢物合成基因组簇查询和预测

微生物相关网络教程:MENA, LSA, SparCC和 CoNet

QIIME. 1虚拟机安装配置及挂载外部目录

QIIME. 2.使用Docker安装并运行

QIIME. 3以管理员安装1.9.1至Ubuntu16.04

扩增子文献

Review:Microbiota, metagenome, microbiome傻傻分不清

Nature:植物微生物组开山之作--拟南芥根微生物组

Nautre:Gordon文章—甘露糖苷选择性抑制致病性大肠杆菌

Nature:培养组学+人工重组菌群,微生物组从描述转向功能研究

Cell:国产首篇CNS--大肠癌耐化疗药,细菌是帮凶

Microbiome:简单套路发高分文章--白杨内生和根际微生物组

Microbiome:宏蛋白质组揭示人肠道菌群功能,离真相更近一步

想了解更多宏基因组、16S分析相关文章,

快关注“宏基因组”公众号,干货第一时间推送。

系统学习生物信息,快关注“生信宝典”,

那里有几千志同道合的小伙伴一起学习。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存