扩增子分析QIIME2. 7元数据Metadata
点击上方蓝色「宏基因组」关注我们!专业干货每日推送!
本节分析需要完成本系列前两章:QIIME2安装和分析实战Moving Picture。
什么是元数据Metadata
元数据是实验设计的描述信息表或统计结果,是分析原始数据必须的基本信息。
元数据是从原始数据中获得生物学发现的关键。在QIIME2中,样品的元数据包括技术细节,如DNA条形码用于区分样品、样品描述,如分类、时间点、取样部分等。对于特征表(Feature,原称OTU)的元数据,一般为特征的注释信息,如物种分类信息。样品和特征表的元数据在QIIME2中很多步分析需要使用。
文本格式实验设计(mapping file)格式要求
为了方便分析,对样品的描述必须包括一些基本信息和格式规范,QIIME2中实验设计mapping file基本要求如下:
文件必须是制表符分隔的纯文本文件,建议使用Excel编辑并复制到纯文本编辑器(如editplus, ultraedit等)中保存为txt格式;
注释行以#开头,可以出现在文中任意位置,程序会自己忽略;
空行也会被忽略;
第一行为表头,与QIIME1相比不再以#开头,更合理;
表头每列名称必须唯一,不能包括标点符号;(建议实验设计只使用字母和数字,任何符号在后续分析都可能会有问题)
文件至少包括除表头外的一行数据;
第一列为样品名,用于标识每个样品,必须名字唯一。
下载示例元文件
mkdir qiime2-metadata-tutorial
cd qiime2-metadata-tutorial
# 下载示例样本信息
wget -O "sample-metadata.tsv" "https://data.qiime2.org/2017.7/tutorials/moving-pictures/sample_metadata.tsv"
# 下载失败,尝试下面方法
rm sample-metadata.tsv
wget http://bailab.genetics.ac.cn/markdown/QIIME2/metadata/sample-metadata.tsv
查看示例元文件—实验设计
# 使用less直接查看样品信息
less sample-metadata.tsv
# 使用QIIME2生成网页查看
qiime metadata tabulate \
--m-input-file sample-metadata.tsv \
--o-visualization tabulated-sample-metadata.qzv
# 查看网页结果
qiime tools view tabulated-sample-metadata.qzv
查看结果需要配置ssh方式的可视化,推荐阅读xshell+xmanager或xming配置ssh的X11转发,可图型显示支持;
或下载qzv文件在https://view.qiime2.org/网站在线查看;或直接点击下面链接查看
https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.7%2Fdata%2Ftutorials%2Fmetadata%2Ftabulated-sample-metadata.qzv
用户思考时间:
上面的示例元文件,subject-1的样品有多少个?来自gut的样品有多少个?
提示:linux下可以使用grep检索;网页中可以按列排序。
查看QIIME2生成的文件元数据
# 下载Alpha多样性PD算法的结果
wget -O "faith_pd_vector.qza" "https://data.qiime2.org/2017.7/tutorials/metadata/faith_pd_vector.qza"
# 结果可视化
qiime metadata tabulate \
--m-input-file faith_pd_vector.qza \
--o-visualization tabulated-faith-pd-metadata.qzv
请最好下载在线查看效果最好,可以网页中直接操作结果(SSH转发的图像操作效果差)?
用户思考时间:
Faith’s PD的最大值是多少?最小值是多少?提示:使用列排序功能。
qzv文件包括结果生成的过程,请查看该结果的追溯图,研究分析过程。
组合型原数据
# 将样品信息和Alpha多样性组合可视化
qiime metadata tabulate \
--m-input-file sample-metadata.tsv \
--m-input-file faith_pd_vector.qza \
--o-visualization tabulated-combined-metadata.qzv
https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.7%2Fdata%2Ftutorials%2Fmetadata%2Ftabulated-combined-metadata.qzv 在线查看结果。用户自己的数据 ,需使用qiime tools view命令或下载后在线打开。
查看结果:只包括两个文件中的交集部分,这在以后是很常见的操作,用于选择部分结果。
# 组合Alpha和Beta多样性
wget -O "unweighted_unifrac_pcoa_results.qza" "https://data.qiime2.org/2017.7/tutorials/metadata/unweighted_unifrac_pcoa_results.qza"
qiime emperor plot \
--i-pcoa unweighted_unifrac_pcoa_results.qza \
--m-metadata-file sample-metadata.tsv \
--m-metadata-file faith_pd_vector.qza \
--o-visualization unweighted-unifrac-emperor-with-alpha.qzv
https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.7%2Fdata%2Ftutorials%2Fmetadata%2Funweighted-unifrac-emperor-with-alpha.qzv 查看组合后的结果
思才情:那一类取样位置有最高的Faith’s进化多样性值?查看中使用按body site上色,再按Faith’s PD连续着色;
查看特征(Feature/OTU)元数据
wget -O "rep-seqs.qza" "https://data.qiime2.org/2017.7/tutorials/metadata/rep-seqs.qza"
wget -O "taxonomy.qza" "https://data.qiime2.org/2017.7/tutorials/metadata/taxonomy.qza"
qiime metadata tabulate \
--m-input-file rep-seqs.qza \
--m-input-file taxonomy.qza \
--o-visualization tabulated-feature-metadata.qzv
https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.7%2Fdata%2Ftutorials%2Fmetadata%2Ftabulated-feature-metadata.qzv 查看代表序列和分类信息的组合结果
用户思考:所有.qza
都是元数据吗?使用qiime metadata tabulate自己试试吧。
网页中查看可以导出任意格式的结果,并可追溯实验的分析过程。
Reference
https://docs.qiime2.org/2017.7/tutorials/metadata
科研经验
1云笔记积累个人知识体系
2云协作建立实验室工作总结和内部资料共享平台
3公众号建立实验室共享知识体系和宣传窗口
宏基因组公众号14天受邀原创-诚邀同行共享研究经验
扩增子图表解读第一季
1箱线图:Alpha多样性,老板再也不操心的我文献阅读了
2散点图:组间整体差异分析(Beta多样性)
3热图:差异菌、OTU及功能
4曼哈顿图:差异OTU或Taxonomy
5火山图:差异OTU数量及变化规律
6韦恩图:比较组间共有和特有OTU或分类单元
7三元图:美的不要不要的,再多用也不过分
8网络图:节点OTU或类Venn比较
扩增子分析
QIIME2. 2最简单的完整分析实例Moving Pictures
微生物相关网络教程:MENA, LSA, SparCC和 CoNet
QIIME. 2.使用Docker安装并运行
QIIME. 3以管理员安装1.9.1至Ubuntu16.04
扩增子文献
Review:Microbiota, metagenome, microbiome傻傻分不清
Nautre:Gordon文章—甘露糖苷选择性抑制致病性大肠杆菌
Nature:培养组学+人工重组菌群,微生物组从描述转向功能研究
Microbiome:简单套路发高分文章--白杨内生和根际微生物组
Microbiome:宏蛋白质组揭示人肠道菌群功能,离真相更近一步
想了解更多宏基因组、16S分析相关文章,
快关注“宏基因组”公众号,干货第一时间推送。
系统学习生物信息,快关注“生信宝典”,
那里有几千志同道合的小伙伴一起学习。