16S单V4区是最佳选择?——引物与测序平台选择大讨论
本文转载自“微微悦明”,已获授权。
类似的情况已经出现过好几次了,微微忍不住要唠叨几句了。
诸君且听我说!
在前篇《漫谈16S的前世今生》中也提到了,可反映细菌亲缘关系的16S基因含有9个可变区。其中V4区是指第四个可变区,一般是指515~806bp这个区域,长度约为290bp。而V3-V4区是指第三和第四两个可变区,一般是指341~805bp这个区域,长度约为460bp。
目前大部分公司和实验室都是采用以下两对引物扩增V4区和V3-V4区。部分公司采用的扩增引物会略有差异,这个区域可能会有几个碱基的出入,但不会有大的变动。16S建库方法可参照前贴《高通量测序DNA样本建库方法(3):扩增法》。
Type | Name | Sequences |
---|---|---|
V4 | 515F | GTGYCAGCMGCCGCGGTAA |
V4 | 806R | GGACTACNVGGGTWTCTAA |
V3-V4 | 341F | CCTACGGGNGGCWGCAG |
V3-V4 | 805R | GACTACHVGGGTATCTAATCC |
两者啥关系?包含关系啊!
正如下图所示,V3-V4区是16S全长的子集,V4区是V3-V4区的子集。
V3-V4区的长度是单V4区的1.6倍。
长度代表了什么?代表了可用于鉴别物种的信息位点。长度越长,可用于反映细菌亲缘关系的位点数越多。
打个比方,16S就如同人类的指纹,识别16S全长序列就可以把所有的菌区分开来(实际上是做不到的,这个以后再细讲);V3-V4区就只代表了细菌指纹的一部分,只能识别部分菌;而单V4区就更小了,只是V3-V4区的一部分,它说能识别的菌数量更少。
因此,从准确识别样本中菌群结构的角度,
16S全长 优于 V3-V4区, V3-V4区 优于 单V4区!
此处常见误区(槽点):有些人会说“V3-V4区也只能分辨一部分菌到种的水平,还是有些分辨不出来的,因此你只测V4区就行了。”
这个逻辑实在太奇怪了,小编忍不住吐槽。按这个逻辑,我1200万像素的手机因为拍不出单反的效果,干脆就扔了算了,换个800万像素的手机? 当然,你价格低也行啊。同等的价位,凭啥我不用1200万像素的手机而选低配的呢?测序同理。同等的价格,V3-V4区分辨率优于单V4区。即使它还有问题解决不了,也不代表我要换用低质量的选择。
16S全长的测序需采用三代测序手段,价格较高,这里不做讨论。只讨论可用二代测序方法实现的单V4区和V3-V4区测序。
从理论上,单V4区和V3-V4区的试剂成本是一致的!
二者都是采用illumina测序平台(Hiseq2500和Miseq)的PE250试剂盒进行双端测序。
然而,实际上却有一定的差别。
首先,Illumina测序平台的测序数据质量是随着长度的延伸而逐渐下降的。
即1~100bp的质量 优于 101~200bp 优于 201~250bp。当测序质量值低于一定程度(一般指Q20),该位点是不能用于分析的,需要切除掉。
因此,illumina下机数据虽然是双端250bp的序列,但真实用于后续分析的序列长度是短于250bp的!
其次,单V4区的长度和V3-V4区的长度是不同的!290bp vs 460bp
因此,单V4区左右两端序列如果要拼接的话只需两侧各150bp就可以搭起来了(150bp+150bp=300bp>290bp)。换言之,即使测序质量较差,测得序列末尾有100bp不能用,单V4区还是可以拼接测通的。
然而,V3-V4区需要两侧至少各230bp的序列才能搭起来!(230+230=460bp)。
也就是说,V3-V4区想测通,需要对测序质量要求非常高,序列末尾只允许有不到20bp的低质量位点!!这对测序实验的要求是非常高的。
再换个说法,同样测5万条序列,不管测的再差,V4区测通是完全没有问题的,99%的序列都是可以用的;但是如果选择V3-V4区,由于尾端质量值低的原因,可能只有50%的序列是可以用的。那么为了得到5万条拼接测通的序列(目前大多数合同都是这么要求的,没有拼接测通的序列无法进行下一步的分析),可能就需要测10万条甚至更多序列才能满足,因此测序成本就大大提高了。
还有一个提高测通效率的方法,就是采用PE300试剂盒。然而,同样会增加测序成本。
一张表综合比较V3-V4区和单V4区:
高中低三档,不同的准确度,不同的成本,根据个人需要,任君选择
V3-V4和单V4区如果是同样的价格,能测V3-V4区,一定测V3-V4区!
如果有人跟你说,单V4区和V3-V4区测序价格一样且结果更好,你可以告诉他“呵呵!”
扫码下方二维码,关注“微微悦明”
猜你喜欢
写在后面
为促进读者交流、加速科学问题解决,我们建立了“宏基因组”专业讨论群,目前己有八百多名一线科研人员加入。参与讨论,获得专业指导、问题解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职务”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论。问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”