Nature: DNA提取vs数据分析,谁对结果影响大?
本文转载自“微微悦明”,己获授权。
上周与大家分享了Nature Biotchnology的好文 《DNA提取也能发Nature?》
本以为只是偶发的宏基因组方法评估类的高分文章,谁知道拔起萝卜连着泥,其竟然还有一篇姐妹篇,依旧是发表在Nature Biotechnology,依旧是方法评估!
综合看下来,其设计更复杂,涉及的实验环节更多,与生物信息更息息相关,更加值得我们关注。
Sinha R, Abuali G, Vogtmann E, et al. Assessment of variation in microbial community amplicon sequencing by the Microbiome Quality Control (MBQC) project consortium.[J]. Nature Biotechnology, 2017.
研究目标:评估16S扩增子宏基因组测序过程中不同阶段(DNA提取、样本保存、测序和数据分析)对结果的影响
样本数:23个。(注:虽然比上篇的2个样本数略多了一点,但比起现在动辄上百上千的样本数研究还是少很多,可见实验贵在精,即使少样本数依旧可以发高分文章)
23份样本,包括11份新鲜的粪便样本,7份冻干的粪便样本,2份Chemostat培养后样本,2份模拟样本,和1份阴性对照样本。
方法:所有样本经分装至96孔板后被分送至15家实验室分别进行DNA提取、16S建库和高通量测序。所得测序结果被分送至9家实验室分别进行生物信息分析。
关键字:15家实验室+9家数据分析 又是一个多单位大动作的联合实验对照
实验所涉及的对照:
(1)样本类型:粪便 vs 口腔;新鲜样本 vs 冻干样本;真实样本 vs 模拟样本
(2)DNA提取:中心实验室集中提取 vs 15家实验室分别提取;各实验室采用不同的DNA提取protocal(Mobio vs Promega vs Qiagen等)
(3)建库方法:16S扩增引物 (V3-V4 vs only V4)
(4)测序方法:Hiseq vs Miseq;单端测序 vs 双端测序;测序长度150bp~300bp
(5) 生物信息方法:QIIME vs UPARSE vs 很多。。。。
下表为文中涉及的各方法。左列为方法类别和方法名,右列为采用该方法的实验室数量。
注:本文涉及的对照方法太多,最终测序的样本数高达15,749个,其中真实样本1,991个,模拟样本(Artifical 样本)2033个,以及1725个chemostat samples。每个样本的测序read数在3万5至4万左右。
这篇牛文的内容过于丰富,结果太多,仅附图就有15个,附表9个,附文9个。在本文中,小编仅取部分精华与大家分享,更多细节请参照原文~
一句话结论: 不同实验阶段(样本提取、建库、数据分析)对最终结果皆有一定影响,其中DNA提取影响最大。
1、DNA提取方法影响16S宏基因组结果
该文的结果与其姐妹篇一致,皆证实了DNA提取方法对结果的显著影响,如下图所示,使用不同DNA提取方法,样本中各菌属的丰度会发生明显变化。
下图中横坐标代表不同的DNA提取方法,
本文还罗列了近年的相关文章,进一步证实该结果的可靠性。如下表所示,+表示该因素对结果有显著影响。
2、DNA提取方法对结果的影响高于生物信息学方法
在该实验中,作者设计了两个阶段的双盲检测,阶段1(实验)+阶段2(生物信息分析),文中评估不同因素对结果的影响,结果显示DNA提取方法影响实验结果,且其影响程度高于生物信息学方法。
如下图所示,不同颜色代表不同类型的样本(Human\Chemostat\Artifical\Blank),纵坐标越高代表影响较大。由图可知,不同提取方法的影响高于不同数据分析方法的影响。不同方法对真实样本的影响高于对模拟样本的影响。
3、不同类型样本受方法影响不同
相比较于真实样本,模拟样本受不同方法的影响较少。
如图所示,左图为真实样本,右图为模拟样本。横坐标为不同实验室。图中可见真实样本不同实验室的处理结果有明显差别。
4、实验室中存在样本污染的情况
以HL-A实验室为例,其所处理的所有样本中Lactobacillus与其他实验室相比都有升高。另有三家实验室有明显的Pseudomonas升高。
实验采用Tris-HCL buffer做为阴性对照样本,在不同实验室中检测出不同的污染菌。
微微碎碎念:作为一只生物信息狗,小编为啥一直一直关注测序实验的文章呢?
这篇文章帮我做出了最好的回答~
测序实验作为数据的来源,其中有太多的影响因素(坑)存在了。实验过程(Protocal)的所导致的对结果的变化远大于生物信息方法。
因此,在我们这些生物信息狗选择程序、纠结参数、优化结果之前,实验阶段的严格把关、标准化处理,才是我们应该最先关注的!
你以为你找到了Marker菌,也许只是实验污染。
你以为两组样本间有显著差异,也许只是采用了不同的protocal。
为避免这样的惨剧发生,小编再次呼吁
测序实验标准化很重要!
微信号:
Mypathogen
微微悦明科学的乐趣是获得新知识的喜悦
高通量测序、大数据
病原微生物检测和监测
健康大数据行业资讯记录与分享
猜你喜欢
热文:图表规范 DNA提取发Nature
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外六十位多PI,六百多名一线科研人员加入。参与讨论,获得专业指导、问题解答,欢迎分享此文至朋友圈,并扫码加创始人好友带你入群,务必备注“姓名-单位-研究方向-职务”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决推荐生信技能树-微生物组版块(http://www.biotrainee.com/forum-88-1.html) 发贴,并转发链接入群,问题及解答方便检索,造福后人。
学习16S扩增子、宏基因组科研思路和分析技术,快关注“宏基因组”