查看原文
其他

Microbiome: 绝对定量环境样本细菌、真菌、真核群落丰度

宏基因组 2022-03-28

The following article is from Listenlii Author Young In

本文转载自Listenlii,己获授权。


研究背景


目前高通量测序只能得到微生物群落的相对丰度(relative abundance)而不能决定定量基因或细胞数量(absolute quantitation),因此就带来了不同引物(16S,18S,ITS)、不同研究得到的数据无法比较的难题。

已有的定量方法:

1. Cpn60蛋白,普遍存在于原核生物及真核生物的线粒体、叶绿体中。因此可以根据Cpn60含量比较群落的相对丰度。但是此方法局限性在于数据库非常小。

2.  使用微生物普遍存在的基因,如rpoB, amoA, pmoA, nirS, nirK, nosZ, pufM进行标记。尤其是rpoB,在识别相似物种的时候非常强大。但是这些引物是针对海绵共生体(sponge symbionts)设计的,可能在更加复杂的肠道、土壤环境中失去系统发育的识别能力。

另外,这两种方法只适用于一个域(domain)之内比较相对丰度,不能提供样本中总DNA的丰度信息。

3.  qPCR可以用于估计丰度,但是得不到基因的原位丰度。

4. 其他方法包括ATP,流式细胞仪,磷脂脂肪酸、生物炭等细胞计数方法。


前人研究表明通过加入一种在给定环境中不存在的已知物种的确定数量的细胞,可以对样本进行内标(spike)。在对RNA研究中,通常会加入一些合成的RNA标准到环境样本,之后再进行RNA分离、逆转录、测序。通过加入的标准RNA的量来比较样本之间RNA的相对丰度。


方法


本文通过改进RNA内标方法提出了基于DNA内标法。

设计了短嵌合体合成DNA片段(short chimeric synthetic DNAfragments),包含三类域的引物结合区:原核、真核、真菌。设计基于三个原则:

包含引物结合区(primer binding sites, PBSs);最优的扩增长度和GC含量;易于获取。

P:原核生物16S V4区,引物515F/806R;

E:真核生物18S,引物F1427/R1616。包含广泛的真核生物类群,藻类,硅藻,动物,挖掘动物(原生生物,鞭毛虫),真菌和霉菌;

F:特异性针对真菌ITS,引物ITS1F/ITS2R。

P,E,F扩增长度分别为292 bp,212 bp,272bp;

GC 含量被设计为与环境样本相似;

DNA合成后导入pMA-T质粒,分别得到pSpike-P,pSpike-E and pSpike-F,质粒导入大肠杆菌备用。





图1 P,E,F的内标序列


PCR过程中这些合成的DNA分子会产生对应的产物。在环境样本中加入已知量的合成DNA,测序结果中通过计算他们的相对丰度,可以计算出样本中特定类群的绝对丰度。


图2 三种内标合成方法。通过引物结合位点PBS设计P,E,F 的内标,另外还要考虑长度和GC含量。


实验设计


使用纯细菌和复杂土壤测试该方法。

Ø土壤样本

BS--来自于超过20年未耕地的土壤

WS--来自森林土


Ø纯菌Rhizobium leguminosarum bv. viciae 3841

梯度稀释到1.11 × 10CFU /mL菌液。

该根瘤菌基因组有3个16S的拷贝,因此16S拷贝数为3.33× 109/mL菌液。


1.  使用BS



图 3 实验1方案。

a-c,P内标DNA在提取样本DNA之前混入样本;d-f, P内标DNA在DNA提取之后混入样本。

a-b,1ml根瘤菌或者1g土壤加入不同梯度的P内标 DNA(14 (circle), 34 (square), 70 (upwardtriangle), 140 (downward triangle) , 340 (diamond) pg)。

c, 1g土壤加入 39 (square) pg P 内标DNA。

注意合成的内标DNA质粒可能会在DNA纯化步骤裂开。水平线为平均值。




2. 使用BS和WS,设计8个不同水平的P、E、F 内标。每个水平三个重复。


表1 实验二设计


之后进行PCR,qPCR 和Illumina Miseq 300PE测序。数据质控后Unoise3划分OTU,去掉singletons和内标PEF序列。分别用SILVA, PR2 和 ITSone 数据库对原核16SrRNA, 真核 18S rRNA 和fungal ITS进行注释。



结果



1. 内标可以准确检测群落的丰度。

对于第一个实验,从图3a,b,c可知,根瘤菌存在与否内标法都能准确检测土壤群落的丰度。d-f结果差于a-c。内标在DNA提取之前加入样本能得到最准确的结果。


2. 内标法可以原位检测不同类型土壤DNA丰度和微生物群落组成

对于第二个实验,加入内标的量越多检出的读长也越多,但是会存在平台期。为了确定最佳的内标量建立了一个简单的模型。SR1000是每1000个读长中检出的内标读长的数量。NS是每克土加入的内标量,ENV是每克土的基因拷贝数。显然存在下列公式:

下图表明,控制相同水平的内标物,内标读长的数量ITS>18S>16S。印证了土壤中基因数量16S >18S>ITS。


图4 不同内标水平下内标读长的数量


3. 不同水平的内标检出的物种组成并没有显著的变化。

但是从图上看感觉发生了变化,我也没看到显著性检验。所以作者是如何判断没有显著变化的?


图5 群落结构的NMD。a,原核;b,真核;c.真菌。


4. 不同土壤类型原位微生物基因丰度检测

显然的:

rRNA基因丰度 = (微生物群落读长数/内标DNA读长数)× 内标DNA基因拷贝数



作者建议内标的使用量要>20%环境样本基因丰度。内标量太高(> 80%)需要额外增加测序深度,可能带来其他的偏差。即最优的内标使用量为20-80%环境样本基因丰度。

另外,16S和ITS中内标加入的越多,微生物群落基因丰度越低。但是18S正好相反。可能是因为土壤类型导致低水平的内标残留在土中,而高水平的内标又会高估群落基因数量。


图6 不同水平内标检出的基因数


5. 绝对定量改变了群落系统发育结构

图7表明16S和18S绝对丰度和相对丰度存在着明显的差异。ITS也类似。但是真菌的图错误很多就不放了。图题显示有a-e5个图,而图片只有a-c三个。d和e离奇失踪???另外图c对应的应该是图e的题目。


图7 16S和18S的物种组成。a.16S相对丰度;b.16S绝对丰度;c.18S相对丰度;d.18S绝对丰度。图例中B或W指该物种在哪种土壤类型中丰度更高。*代表t-test并使用Bonferroni校正得到的显著性水平。


6. 18S和ITS得到的结果存在差异。

18S引物过度表达真菌物种或者ITS引物覆盖度不够都会导致偏差。


7.由于不同物种拷贝数不能确定,方法的局限是只能得到基因数量,不能得到细胞数量。前人研究表明真菌占细菌+真菌的0.6-4.2%。而本文内标法得到8.6%(qPCR 7.6%)。真菌多可能是因为土壤肥力高、有机碳含量高、土地免耕等因素。


8. 作者建议先做标准曲线,选择最优的探针量。加入的太高或者太低,虽然不影响群落结构,但是对定量产生影响。确定了标准曲线,探针水平可以设计几个梯度以增强重复性。

本方法可以在任何基于扩增子的类群中使用如食物样本,肠道。


     

其他内标文章:(点击即可查看)

Listenlii:文献解读——扩增子测序中的内标法(Internal standard)

微生物生态:内标法测序研究生物炭对大豆土壤细菌群落的影响

微生物生态:两种土壤细菌群落结构高通量绝对定量方法

微生态笔记:土壤细菌定量方法结合相对丰度分析揭示种群的真实变化


欢迎大家扫描下方二维码关注我的公众号,若有问题也可直接加我的微信:水岸风堤(lii32703)。

欢迎分享,转载请联系我。

猜你喜欢

10000+:肠道细菌 人体上的生命 宝宝与猫狗 梅毒狂想曲 提DNA发Nature 实验分析谁对结果影响大  Cell微生物专刊

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:生信宝典 学术图表 高分文章 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板 Shell  R Perl

生物科普  生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外1700+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存