Microbiome: 绝对定量环境样本细菌、真菌、真核群落丰度
The following article is from Listenlii Author Young In
本文转载自Listenlii,己获授权。
研究背景
目前高通量测序只能得到微生物群落的相对丰度(relative abundance)而不能决定定量基因或细胞数量(absolute quantitation),因此就带来了不同引物(16S,18S,ITS)、不同研究得到的数据无法比较的难题。
前人研究表明通过加入一种在给定环境中不存在的已知物种的确定数量的细胞,可以对样本进行内标(spike)。在对RNA研究中,通常会加入一些合成的RNA标准到环境样本,之后再进行RNA分离、逆转录、测序。通过加入的标准RNA的量来比较样本之间RNA的相对丰度。
方法
本文通过改进RNA内标方法提出了基于DNA内标法。
设计了短嵌合体合成DNA片段(short chimeric synthetic DNAfragments),包含三类域的引物结合区:原核、真核、真菌。设计基于三个原则:
包含引物结合区(primer binding sites, PBSs);最优的扩增长度和GC含量;易于获取。
P:原核生物16S V4区,引物515F/806R;
E:真核生物18S,引物F1427/R1616。包含广泛的真核生物类群,藻类,硅藻,动物,挖掘动物(原生生物,鞭毛虫),真菌和霉菌;
F:特异性针对真菌ITS,引物ITS1F/ITS2R。
P,E,F扩增长度分别为292 bp,212 bp,272bp;
GC 含量被设计为与环境样本相似;
DNA合成后导入pMA-T质粒,分别得到pSpike-P,pSpike-E and pSpike-F,质粒导入大肠杆菌备用。
图1 P,E,F的内标序列
PCR过程中这些合成的DNA分子会产生对应的产物。在环境样本中加入已知量的合成DNA,测序结果中通过计算他们的相对丰度,可以计算出样本中特定类群的绝对丰度。
图2 三种内标合成方法。通过引物结合位点PBS设计P,E,F 的内标,另外还要考虑长度和GC含量。
实验设计
使用纯细菌和复杂土壤测试该方法。
Ø土壤样本
BS--来自于超过20年未耕地的土壤
WS--来自森林土
Ø纯菌Rhizobium leguminosarum bv. viciae 3841
梯度稀释到1.11 × 109 CFU /mL菌液。
该根瘤菌基因组有3个16S的拷贝,因此16S拷贝数为3.33× 109/mL菌液。
1. 使用BS
图 3 实验1方案。
a-c,P内标DNA在提取样本DNA之前混入样本;d-f, P内标DNA在DNA提取之后混入样本。
a-b,1ml根瘤菌或者1g土壤加入不同梯度的P内标 DNA(14 (circle), 34 (square), 70 (upwardtriangle), 140 (downward triangle) , 340 (diamond) pg)。
c, 1g土壤加入 39 (square) pg P 内标DNA。
注意合成的内标DNA质粒可能会在DNA纯化步骤裂开。水平线为平均值。
2. 使用BS和WS,设计8个不同水平的P、E、F 内标。每个水平三个重复。
表1 实验二设计
之后进行PCR,qPCR 和Illumina Miseq 300PE测序。数据质控后Unoise3划分OTU,去掉singletons和内标PEF序列。分别用SILVA, PR2 和 ITSone 数据库对原核16SrRNA, 真核 18S rRNA 和fungal ITS进行注释。
结果
1. 内标可以准确检测群落的丰度。
对于第一个实验,从图3a,b,c可知,根瘤菌存在与否内标法都能准确检测土壤群落的丰度。d-f结果差于a-c。内标在DNA提取之前加入样本能得到最准确的结果。
2. 内标法可以原位检测不同类型土壤DNA丰度和微生物群落组成
对于第二个实验,加入内标的量越多检出的读长也越多,但是会存在平台期。为了确定最佳的内标量建立了一个简单的模型。SR1000是每1000个读长中检出的内标读长的数量。NS是每克土加入的内标量,ENV是每克土的基因拷贝数。显然存在下列公式:
下图表明,控制相同水平的内标物,内标读长的数量ITS>18S>16S。印证了土壤中基因数量16S >18S>ITS。
图4 不同内标水平下内标读长的数量
3. 不同水平的内标检出的物种组成并没有显著的变化。
但是从图上看感觉发生了变化,我也没看到显著性检验。所以作者是如何判断没有显著变化的?
图5 群落结构的NMD。a,原核;b,真核;c.真菌。
4. 不同土壤类型原位微生物基因丰度检测
显然的:
rRNA基因丰度 = (微生物群落读长数/内标DNA读长数)× 内标DNA基因拷贝数作者建议内标的使用量要>20%环境样本基因丰度。内标量太高(> 80%)需要额外增加测序深度,可能带来其他的偏差。即最优的内标使用量为20-80%环境样本基因丰度。
另外,16S和ITS中内标加入的越多,微生物群落基因丰度越低。但是18S正好相反。可能是因为土壤类型导致低水平的内标残留在土中,而高水平的内标又会高估群落基因数量。
图6 不同水平内标检出的基因数
5. 绝对定量改变了群落系统发育结构
图7表明16S和18S绝对丰度和相对丰度存在着明显的差异。ITS也类似。但是真菌的图错误很多就不放了。图题显示有a-e5个图,而图片只有a-c三个。d和e离奇失踪???另外图c对应的应该是图e的题目。
图7 16S和18S的物种组成。a.16S相对丰度;b.16S绝对丰度;c.18S相对丰度;d.18S绝对丰度。图例中B或W指该物种在哪种土壤类型中丰度更高。*代表t-test并使用Bonferroni校正得到的显著性水平。
6. 18S和ITS得到的结果存在差异。
18S引物过度表达真菌物种或者ITS引物覆盖度不够都会导致偏差。
7.由于不同物种拷贝数不能确定,方法的局限是只能得到基因数量,不能得到细胞数量。前人研究表明真菌占细菌+真菌的0.6-4.2%。而本文内标法得到8.6%(qPCR 7.6%)。真菌多可能是因为土壤肥力高、有机碳含量高、土地免耕等因素。
8. 作者建议先做标准曲线,选择最优的探针量。加入的太高或者太低,虽然不影响群落结构,但是对定量产生影响。确定了标准曲线,探针水平可以设计几个梯度以增强重复性。
本方法可以在任何基于扩增子的类群中使用如食物样本,肠道。
其他内标文章:(点击即可查看)
Listenlii:文献解读——扩增子测序中的内标法(Internal standard)
微生态笔记:土壤细菌定量方法结合相对丰度分析揭示种群的真实变化欢迎大家扫描下方二维码关注我的公众号,若有问题也可直接加我的微信:水岸风堤(lii32703)。
欢迎分享,转载请联系我。
猜你喜欢
10000+:肠道细菌 人体上的生命 宝宝与猫狗 梅毒狂想曲 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊
文献阅读 热心肠 SemanticScholar Geenmedical
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外1700+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”