查看原文
其他

宏组学研究相关名词解释

红皇后学术 红皇后学术 2022-06-07

宏组学基本策略

宏基因组 (Metagenomics):是一种以环境样品中的微生物群体基因组为研究对象,以功能基因筛选和测序分析为研究手段,以微生物多样性、 种群结构、 进化关系、 功能活性、 相互协作关系及与环境之间的关系为研究目的的新的微生物研究方法。

宏转录组学 (Metatranscriptionmics):测定特定环境下微生物群落中活跃菌种的组成以及活性基因表达情况的方法,结合理化因素的检测,宏转录组可研究多样本间由于理化等指标的差异所造成的,在时空上不同微生物群落间活跃成分组成的差异。

宏蛋白质组学 (Metaproteomics):运用蛋白质技术对特定微生物群落所产生的全部蛋白质进行大规模研究与分析的新技术,在极端环境功能基因表达、特殊功能蛋白开发以及生态元素循环等领域显出强大的功能。

宏基因组尺度关联分析 (MWAS):MWAS类似于GWAS,是通过宏基因组尺度的分析,识别与性状相关的宏基因组marker单元,主要的应用方向为通过肠道菌群的挖掘,发现与疾病或者其它宿主表型性状相关的微生物或基因marker,用于诊断宿主的疾病,进一步分析其分子机制,为疾病治疗提供可行性方案。

宏基因组学测序

物种(功能)累积曲线 (Species/Function accumulation curves):随着进行测序样本量的增加,新检测出来的物种和功能基因也会随之增加,通过计算物种或基因功能的累积量,可以判断测序样本量是否充足,是否能够代表总体样本。

混池拼接:假设有5个样品被测序,经过质量控制后,各样品分别单独进行拼接,如每个样品中均存在一种低丰度的物种A,其测序深度只有2X,那么属于该物种的序列很难被组装,将所有样品中未被组装的序列合并在一起,此时物种A的测序深度将达到10X,就有可能拼接得到该物种的序列,此种方法极大的提高了发现低丰度物种的可能性。

Ab Initio Approach:基因识别的一种方法,大概的含义是从头开始识别一个基因所具有的完整结构特征。在原核生物中,基因往往具有特定且容易识别的启动子序列,并且其不含内含子,基因的编码区是一个连续的开放阅读框。除此之外,原核生物的蛋白质编码区还具有其它一些容易判别的统计学特征,这些特性使得原核生物的基因识别特别适合采用Ab Initio方法,该方法的平均准确度能达到90%以上。

基因集:这一概念类似于细菌群落组成谱研究中的OTU,由于宏基因组测序所得到的数据量通常很大,为了降低后续分析成本,在序列拼接和基因识别之后,将所得到的基因按照相似性进行聚类,每个聚类的基因挑选一个代表序列构成非冗余基因集,以降低后续功能注释所需的计算成本。

非培养微生物基因组草图绘制

Binning:将reads或者contigs根据它们的性质分配到不同的OTU中,进而拼接得到单一菌种的基因组序列,宏基因组中获得一个完整合适的单微生物序列,大概需要测序结果中有该微生物全基因组6-8倍的覆盖率。

共丰度基因 (Co-abundance genes, CAG) 聚类:通过基因丰度变化趋势对不同的基因进行聚类的一种方法,来自同一物种的基因,在不同样品中其丰度变化会保持一致的趋势,可以根据这个变化趋势判定基因的物种来源。

寡核苷酸多态性:在不同微生物的DNA中,短的寡核苷酸并不是均一的分布的,其具有物种特异性。相近物种的DNA序列一般都会拥有相似寡核苷酸概率,而不相似的物种则不一样,根据拼接得到序列的寡核苷酸分布模式,即可评估其物种来源。

宏基因组的coverage:测序的数据量可以代表完整群落的百分比。

Binning过程中的coverage:测序得到的属于同一个细菌基因组的Reads的数量,相当于宏基因组中的测序深度。


高通量测序技术基础简介


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存