涨姿势 |《宏基因组学那些事》之名词解释
宏基因组学研究工作,近年取得了众多令人惊喜的成果,许多重要的,特别是与人类疾病密切相关的宏基因组研究,已多次被国际顶级学术期刊如Nature,Science等重点报道。在科技合作中,我们发现许多刚接触宏基因组学的研究者,常被各种宏基因组学的定义,统计学分析,数据结果所困扰。为此,小编联合宏基因组部门的同事,编写了《宏基因组学那些事》专题,和小伙伴们一起学习宏基因组学相关知识。本期,我们来说说宏基因组学中几个重要的名词。
不会吧?!你还没听过鼎鼎大名的“宏基因组”
不说你也知道,微生物在自然界中占据着重要的地位,它们几乎无处不在,并参与地球上所有的生态系统。然而只有极少数的微生物能够被成功培养(<1%)。为此,研究者开始寻求一些独立于培养的微生物研究方法。
宏基因组学(Metagenomics),正是基于这种思路发展起来的。宏基因组(Metagenome),最初由Handelsman等于1998年提出,强调微生物群落的整体基因组结构和功能,包含了环境微生物群落中所有微生物种类基因组的“总和”。那么,宏基因组学就是一种以环境样品中的微生物群体基因组为研究对象,以测序分析和功能基因筛选为研究手段,以阐释微生物多样性、种群结构、进化关系、功能活性、相互协作关系,以及与环境之间的关系为研究目的一种新的微生物学研究方法。
现今,宏基因组学研究已扩展至各种针对直接来自环境DNA的研究,包括土壤,海洋,动物肠道,甚至一些极端环境,包括冰川,火山口等。更为大家关注的是人体内的微生物,包括肠道,皮肤等,因为其中的微生物往往与疾病密切相关。
现阶段,宏基因组学研究主要关注这几个方向和内容:
1. 微生物群落的多样性分析
微生物群落中物种的多样性依然是目前研究的重点。对群落结构的研究,将有助于了解种群结构的稳定性,进而了解种群内物种间的相互依赖、相互制约的内在联系,为构建功能性种群服务。鉴于微生物群落是一个多物种的集合体.绝大多数的微生物物种无法分离也不能独立培养,拼装出每个独立个体的基因组目前尚无法实现,16S rDNA测序分析是目前微生物群落多样性和多态性分析的首选方案。
2. 微生物群落的成分分析
在物种多样性分析的基础上,一个微生物群落中物种的丰度和密度也是宏基因组学研究者共同关心的问题之一。
3. 微生物群落基因组组装分析
相较于微生物个体的基因组而言,目前主流的高通量测序依然是小片段测序,微生物群落中各个微生物个体的基因组拼装是当前难以完成的工作。研究者正在积极找寻和尝试新的合适方法,以获取更多的微生物基因组信息。
4. 微生物群落中个体的功能性分析
微生物个体在群落中的功能,以及微生物和宿主之间的相互关系研究,是宏基因组学研究者重点研究的方向。
5. 微生物群落的代谢通路分析
将微生物群落作为一个整体进行代谢通路分析是一个引起研究者浓厚兴趣的新研究方向。
其中3至5项研究内容,需要借助宏基因组测序的帮助。
微生物群落多样性分析,首选16S rDNA测序
宏基因组研究策略的出现,使得研究者无需分离培养单个微生物,利用高通量测序技术即可对来自特定环境或人体部位的微生物群落展开全局研究。微生物群落多样性分析是开展宏基因组研究的基础,而基于核糖体rDNA(细菌和古细菌为16S rDNA,真菌则为18S、28S rDNA和ITS)的菌落分类和鉴定已成为群落多样性分析的首选方案。
在原核微生物中,16S rDNA因其序列在物种间的高度多样性,成为细菌分类学研究的“分子钟”。16SrDNA指的是基因组中编码核糖体16S rRNA分子对应的DNA序列,也就是16S rRNA的编码基因。该基因全长约1542 bp,由9个可变区和10个保守区组成(图1,可变区为V1到V9,保守区为白色区段),其中保守区反映了生物物种间的亲缘关系,而可变区则表明物种间的差异,且变异程度与细菌的系统发育密切相关。
16S rDNA测序,即对16S rDNA特定可变区(可选单可变区或是多可变区)进行PCR扩增,再结合高通量测序分析,可帮助研究人员进行大规模鉴定群落组成,表达丰度,以及开展系统进化分析(图2)。
图2 16S rDNA测序流程
为使研究者鉴定菌种更准确更丰富,联川的16SrDNA测序率先采用双可变区鉴定菌种,并且首先将菌群鉴定精细到“种(Species)”。
关注微生物群落基因功能,应选宏基因组测序
宏基因组测序,采用基因组测序策略,对环境样品中全部微生物的基因组片段化后,进行测序,以分析微生物群体的基因组成及功能,解读微生物群体的多样性和丰度,解析微生物与环境及宿主之间的关系,发掘和研究新的具有特定功能的基因(图3)。相比于16S rDNA测序,宏基因组测序更关注于基因功能以及代谢通路的研究。
图3 宏基因组测序流程
OTU是什么?
OTU(Operational Taxonomic Unit),即可操作分类单元,用于物种分类及物种相对丰度分析的基本单元。在微生物群落多样性分析中,通常将序列相似性大于97%的Tags(PE Read拼接后成为Tags)定义为一个OTU,之后在每个OTU中选取代表性的Tag进行物种注释,通俗意义上理解每个OTU对应一个物种信息(图4)。
图4 一个OTU代表一个物种
样本内复杂性,看Alpha多样性
Alpha多样性是一个生态学概念,又称为生境内的多样性(within-habitat diversity),通常用于度量群落生态中物种的丰富度,是反映丰富度和均匀度的综合指标。Alpha多样性是基于OTU数据进行计算和分析,结果可以反映单个样本中物种的丰富度和均匀度。具体分析内容介绍请看下期。
样本间复杂性,看Beta多样性
微生物群落是一个系统,微生物多样性研究除了关注样本内的差异,更加关心多个或多组样本间的差异。最近大家比较关心的肥胖人群与体重正常人群的肠道菌群有什么差异,作物高产区与低产区的土壤微生物组成有什么差异等等。诸如此类的问题统统都可以交由Beta多样性来回答。具体分析内容介绍请看下期。
本期先说到这。更多精彩内容,请关注下期《宏基因组学那些事》。