16s扩增子分析注意事项和经验总结Tips

查看原文

其他

16s扩增子分析注意事项和经验总结Tips

2017-08-01 刘永鑫 植物微生物组

欢迎点击「植物微生物组」关注我们！

个人1年多16s/ITS扩增子分析中积累的点点滴滴，此文适合新人了解相关零散知识，也适合有分析经验的人交流与讨论。

以下分析的经验，是以测序数据类型为Illumina HiSeq 2500产出的双端250数据类型(PE250)为基础。

扩增测序技术选择：推荐使用PE250，性价比超高；
原始数据使用fastqc质量评估，会发现数据右端末端质量较差，这是测序仪原理导致，我们在双端合并时还会利用另一端高质量序列进行校正，此处不必过分担心；
双端序列合并方法qiime中有fastq-join和seqprep可选，不必太纠结，原理非常简单事，亲测两者差别不大，用默认fastq-join较快；
extract_barcodes.py提取barcode的种类很多，记得只有左端用barcode_single_end，其它全用barcode_paired_stitched，接头长度如实填写即可。
split_libraries_fastq.py中过滤质量-q选20，即准确度99%； —max_barcode_errors选项是否允许barcode错配不用纠结，一般的barcode调也不支持。
cutadapt去除引物需要-g/-a分两次去除，一次同时去会有很多无法去掉；
聚类OTU前先使用usearch -derep_fulllength先去冗余，不然QIIME慢到想哭；
聚类OTU推荐usearch -cluster_otus，直接高效的去除了嵌合体；
依据参考数据库去除嵌合体，推荐使用usearch -uchime_ref和RDP_gold数据库
align_seqs.py和filter_fasta.py配合去除非细菌序列；
biom的convert, add-metadata要学用，不仅需要格式转换，还需加添加注释信息；
assign_taxonomy.py的方法有uclust, blast, rdp等，我比较感觉rdp方法注释的最全面；
多序列比对使用clustalo方便多线程快速比对；
make_phylogeny.py默认使用fasttree建树极快；
alpha_diversity.py计算前需要使用single_rarefaction.py进行重抽样，推荐数据量1万-3万；
alpha_diversity.py常用的多样性种类，包括shannon,chao1,observed_otus,PD_whole_tree，最后一种还需要树方件；
normalize_table.py将OTU-table进行CSS方法标准化，再进行beta多样性分析结果更好；
beta_diversity.py常用方法有bray_curtis,weighted_unifrac,unweighted_unifrac，根据结果再选方法；

阅读更多微生物组文章，欢迎扫码关注“植物微生物组”

震撼！上海开放Google、Meta等国际平台，中国数字化迈出历史性一步！

战争烈度再升级，特朗普加征10%对华关税

特朗普称计划对中国商品征收25%的关税，外交部回应

从地方目标看全国！今年经济增长还是有很高要求

二姐李思林早知道李玟有轻生的念头，居然没一点防备措施！

16s扩增子分析注意事项和经验总结Tips

您可能也对以下帖子感兴趣

震撼！上海开放Google、Meta等国际平台，中国数字化迈出历史性一步！

战争烈度再升级，特朗普加征10%对华关税

特朗普称计划对中国商品征收25%的关税，外交部回应

从地方目标看全国！今年经济增长还是有很高要求

二姐李思林早知道李玟有轻生的念头，居然没一点防备措施！

生成图片，分享到微信朋友圈

16s扩增子分析注意事项和经验总结Tips

您可能也对以下帖子感兴趣