查看原文
其他

凌波微课|扩增子研究第四讲:微生物群落研究策略

Young 凌波微课 2023-08-18

学生信,做分析,就上凌波微课!



微生物群落研究策略

同学们,大家好,学生信,做分析,就上凌波微课!欢迎大家扫描下方的二维码关注“凌波微课”,加入凌波微课交流群,参与我们的课程和课下交流。
我是主讲人Young,今天我们给大家分享的内容来自公众号“红皇后学术”,主题是:微生物群落研究策略

微生物群落研究之前,有几个问题需要先弄清楚。由于二代测序技术读长的限制,最多只能得到16S rRNA两个可变区的序列,因此通常在研究之前需要选择到底测哪个可变区?测序平台那么多,我应该选择哪个合适?测序数据量要测多少?生物学重复到底该设置几个?这些问题的答案就在今天的凌波微课。

本期凌波微课主要包括三个方面的内容,首先是扩增子研究区域选择问题;第二,扩增子研究具体分析项目;第三,扩增子研究中的常见问题。

上一期我们也讲到过,目前,关于微生物群落研究方法主要有多样性扩增子研究、宏组学包括宏基因组、宏转录组、宏蛋白组、宏代谢组研究等。1991年Pace首次提出环境基因组学的概念,基于核糖体rRNA基因的扩增子测序来反映系统中的微生物多样性的组成(16S、18S、ITS、功能基因等)。常见Marker gene包括细菌16S rRNA,真菌ITS和18S,功能基因包括AOA、AOB、nirK、nifH、McrA等。通过多样性扩增子研究,获得环境中微生物群落组成结构以及功能。

扩增子研究中我们会思考这样的问题:什么样方法能把我样本中的微生物尽可能的测全?什么样的引物适合我的样本研究?9个高变区,V1-V9该选谁?师兄做的V1-V2区,我做的V3-V4区,数据能不能一起分析?什么方法能把我样本中的微生物尽可能测全?能否鉴定到种吗?带着这些问题,我们来看下面的内容。

16s rRNA基因的序列有10个保守区和9个高变区(v1-v9:长度分布范围约30~100bp)。16s rRNA基因可变区考虑因素:a.测序平台的测序读长;b.与sanger测序结果是否具有较强的一致性;c.可变区域对物种分类比对时体现的准确性。

既往研究中,受限于NGS的读长,PE300模式下,也仅能获得600bp以内的片段读取,而16s rRNA全长约1500+bp,因此基于NGS测序只能对其中的个别高变区域开展。细菌16S测序区域的选择中使用最多的是V4区、V3-V4区和V4-V5区,也有少数研究使用V1-V2区的。整体上来说不同可变区最终得到的结果并不会有本质上的差别。不同可变区最终得到的结果在单一物种的注释和丰度上可能会存在极微小的差别,这个差别几乎可以忽略,不会出现使用一个可变区得到某一物种丰度在不同样本中存在差异,而使用另一个可变区测序却没有差异的情况。


接下来,我们来具体看一下16S rRNA测序区域的选择:
  • V4(长度:106bp)被认为是一种较为可靠的细菌多样性引物对。16S rRNA的V4区被广泛运用于多种类型样本的细菌多样性调查;
  • V3-V4 (长度:464bp) 适用于illumina PE300 ,该平台可完整覆盖该区域,对细菌的覆盖度最高,数据库信息全,细菌多样性分析注释全面;

  • V4-V5 (长度:~303bp) 适用于illumina PE250 ,基因组异质性最小;
  • V1-V3 (长度:525bp) 适用于454平台,V7-V9 (长度~300bp) 适用于illumina PE250,与Sanger测序结果最接近;

  • V3 (长度:~200bp) 适用于illumina PE150,结果与16S rRNA基因全长结果接近;

  • V4-V6 (长度:~540bp) 适用于454平台,结果与16S rRNA基因全长结果接近。

关于真核生物方面,18S rRNA基因是编码真核生物核糖体小亚基的DNA序列,其中既有保守区,也有可变区(V1-V9,没有V6区)。保守区域反映了生物物种间的亲缘关系,而可变区则能体现物种间的差异,适用于作种级及以上的分类标准。其中,V4区使用最多、数据库信息最全、分类效果最好,是18S rRNA基因分析注释的最佳选择。

真菌ITS序列是内源转录间隔区(Internally Transcribed Spacer),位于真菌18S、5.8S和28S rRNA基因之间,分别为ITS 1和ITS 2。在真菌中,5.8S、18S和28S rRNA基因具有较高的保守性,而ITS由于承受较小的自然选择压力,在进化过程中能够容忍更多的变异,在绝大多数真核生物中表现出极为广泛的序列多态性。同时,ITS的保守型表现为种内相对一致,种间差异较明显,能够反映出种属间,甚至菌株间的差异。ITS序列片段较小(ITS 1和ITS 2长度分别为350 bp和400 bp),易于分析,目前已被广泛用于真菌不同种属的系统发育分析。

功能微生物是在自然界中由于其功能的重要性而受到广泛关注的一类微生物,如硝化细菌、反硝化菌、氨氧化细菌、硫酸盐还原菌、固氮菌等。每种功能微生物在分类学上可能有很大不同,但却具有相类似的基因使其能够发挥同样的功能,因此使这些功能细菌发挥这种特定功能的基因就称为功能基因,如 nxrA、nirS/nirK、amoA、dsrB、nifH。功能基因测序可有效研究特定环境中的功能微生物物种信息。

对于初入门的研究者而言,另一个经常迷惑的问题就是测序平台,目前市场上针对16S rRNA扩增子测序所使用的二代测序平台主要有三种,都是Illumina公司生产的,分别是MiSeq、HiSeq和NovaSeq平台。目前这3个平台都可以满足两个可变区的16S rRNA扩增子的读长要求,Illumina对MiSeq的定位是聚焦通量(Focused power):快速简约,适合靶向和小型基因组测序;而HiSeq 2500是生产通量(Production power):强大高效,适合大规模基因组学。此外,NovaSeq通量更高,成本更低,是后续测序的首选。

伴随着三代测序技术的发展,16S rRNA全长测序被看作是克服V区(单个和多个)测序物种鉴定局限性的灵丹妙药。三代测序的长读长可以轻而易举地覆盖16s rRNA的9个高变区域,获得的序列更长,信息量也更多!16s rRNA全长测序因此成为多样性研究的新热点技术,最显著的优势就是由于其含涵盖了全部高变区的信息,可以使物种的分辨率更高,实现众多研究者“种水平”分辨率的要求。我们在之前的微课中有专门介绍过16s全长扩增子测序的优势,这里就不一一赘述了,感兴趣的亲们可以通过我们以前的课程(凌波微课|微生物组多样性研究新热门——16s rRDNA全长扩增子测序)了解16s全长扩增子测序的更多优势。

最后一部分,我们来看一下微生物多样性研究中的一些常见问题。

1.测序区域选择

不同物种不同区域多样性不同,选择不同区域测序结果会有不同,可能会造成物种多样性的低估或高估。细菌中使用最多的是V4区、V3-V4区和V4-V5区。如果是延续性的研究,请老师们尽量选择同样的区域引物,以避免引物差异带来的结果偏差。

2.真核生物多样性

ITS测序主要是针对真菌多样性的研究,注释准确度高;18S测序针对的是真核物种,包括微小动植物等等,注释到的范围广,但是就真菌来说精确度相对较低;可根据研究目的合理选择测序方案;

3.测序长度

Illumina PE250平台测序质量较好,但测序总长度为500bp,去掉barcode和部分质量较差的序列之后只剩460bp左右。所以保守起见,扩增子片段长度不能超过460bp,否则双端测序结果将无法进行拼接,在引物选择时应引起注意;如果选择产物太长,不妨试试全长扩增子研究技术;

4.测序量

NGS的扩增子研究单个样品的一般推荐测序量不低于3w条,也有5w条,目的在于将环境中的物种尽可能全部覆盖,所以数据量选择适宜即可。数据量是否合理可以通过稀释性曲线来判断;注意这里的数据量指的是质控后的有效序列,即clean data,而不是下机的raw data。

5.关于生物学重复

消除组内误差,增强结果的可靠性,检测离群样本。对于环境样品推荐3个以上生物学重复,对于医口样品由于个体差异和很多分析方法的原因,推荐10例以上生物学重复;Tips:一般建议多做生物学重复,若是遇到个体之间差别较大的情况可以选择剔除个别样本,避免后期样本数量不够,后期补送重复性不好的情况发生。

6.物种分类学注释中,norank、unclassified、uncultured 等信息,分别代表什么含义?

Uncultured:指该物种不可培养,不知道其具体分类学信息;

Norank:指序列与数据比对上,但数据库也没有具体分类学信息;

Unclassified:指序列与数据比对上,有分类学信息,但不同研究结论不同;

Incertae_Sedis:暂定物种名,如Deltaproteobacteria_Incertae_Sedis,暂定为δ-变形菌纲;

此外,OTU注释时,往往会注释到一些比较奇怪的名称,例如M2PB4-65_termite_group, RBG-13-54-9,这个名称在论文中可以直接使用。

 


今天的分享就介绍到这里~感谢来自“红皇后学术”的内容分享。下一期我们将带大家了解微生物多样性的建库测序流程。玩转科研就来凌波微课,我们下期见!



往期精彩

凌波微课|扩增子研究第三讲:微生物群落研究的目的

凌波微课|测序技术发展史及应用

凌波微课|分子钟学说和现代应用

凌波微课|微生态群落中单个物种的绝对定量?

凌波微课|藻类与陆生植物起源

凌波微课|读播:如何回复审稿意见

凌波微课|如何消除数据的批次效应?选对工具很重要

凌波微课|生物学重复,你有必要知道的那些事儿!

凌波微课|生物学重复,值得你拥有!

凌波微课|微生物组多样性研究新热门——16s rDNA全长扩增子测序





END






红皇后学术以微生物群落研究为核心,重点关注扩增子测序和宏基因组测序,同时辐射转录组、蛋白质组合代谢组。

在分析技术上,主要为基于R语言的组学数据统计、分析和可视化解决方案。


凌波微课,创意于2020年不平凡的春天,由高通量测序及组学研究领域从业近十年的技术团队精心打造。

凌波微课的讲师们,实战经验丰富,旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。凌波微课,用心服务科研用户,打造专业培训品牌,助力科研提升。


关注我

发现更多精彩

关注凌波微课公众号,回复“入群”,即可加入凌波微课课下交流群,更多干货等你呦!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存