肠道菌群:宏转录组测序分析
你知道吗?通过16S测序分析 和 宏基因组测序分析,我们只能够知道肠道菌群做好事或坏事的潜力,而并不知道它们此时此刻正在我们体内干神马,通过宏转录组测序分析有助于发现真相。
基因无论是启动还是关闭,菌内的原始DNA拷贝数始终保持恒定,而真正发挥作用的是RNA。
菌群的代谢特征不是来自于恒定的基因序列,而是决定于基因转录出来的RNA数量。
什么是宏转录组学?
宏转录组学是一门在整体水平上研究某一特定环境、特定时期微生物群落中全基因组转录情况以及转录调控规律的学科。
宏转录组测序是可原位研究特定生境、特定时空下微生物群落中活跃菌种的组成以及活性基因的表达情况。
为什么进行宏转录组学研究?
与宏基因组相比,宏转录组具有明显的研究优势,因为在DNA水平上基因的存在,并不意味着该基因具有转录活性并发挥作用,特别在复杂环境例如土壤当中这些微生物很难同时大量分裂增殖而发挥重要功能。
宏转录组能在进行物种鉴定的同时,也能研究特定时空下有活性的微生物群落组成和活性基因的表达情况。
宏转录组RNA样本制备方法
在原核生物中,mRNA 只占全部 RNA 的 1-5%,其余绝大部分是16S 和 23S 核糖体RNA以及tRNA,因此要测序 mRNA 首先必须先将 mRNA 纯化出来。但是,原核生物并不像真核生物 mRNA 具有 poly A 的结构,因此,无法直接利用 oligo T 将 mRNA 纯化出来。
如何提升原核生物 mRNA 的量,这是宏转录组测序的关键问题。
目前,提升原核生物 mRNA 的量,最主要的方式分为两大类,第一类是去除rRNA (图 a 与 b )。
图 a 的方式是利用 rRNA 的探针将 rRNA 去除,这也是最常用的方式,然而,去除 rRNA 的效率会与探针序列的设计、生物物种有关;
图 b 的方式是利用针对 rRNA 作用的酵素将 rRNA 去除,主要是利用原核生物的 mRNA 5’端有三个磷酸,而此酵素无法对有三个磷酸结构的mRNA作用,因此,能够有效去除 rRNA。
这类方法的缺点是需要较高量的起始RNA,并且是直接对RNA操作,容易使得目标mRNA降解。
另外一大类则是将 mRNA 分离纯化出来(图 c 与 d )。
图 c 的方式是利用大肠杆菌的 poly A polymerase 将 mRNA 3’端接上 poly A,再利用 oligo T 将 mRNA 纯化出来;
图 d 的方式是利用 Co-IP 的方式针对 RNA binding protein 进行 IP,最后再将 mRNA 纯化出来。
以上四种方式是目前比较常见的方式,各有其优缺点,主要还是依不同研究的目标和需求,找出最适当的方式。
宏转录组文库构建
宏转录组测序分析流程
宏转录组测序分析流程,一般包括如下步骤:
对测序下机的双端原始数据进行质量控制,获取可用于下游分析的高质量序列;
对高质量序列进行宿主RNA和细菌的核糖体RNA序列剔除,得到mRNA的转录本序列集;
对每个样本分别进行Denovo拼接,构建宏转录组序列集,并进行基因预测,获得非冗余蛋白序列集;
对蛋白序列用多种常用数据库进行功能注释,获得各功能类群丰度图谱,并进行差异比较分析、代谢通路富集分析、聚类分析等;
对序列进行物种注释,获得种以及种以下精细水平的物种组成谱,并进行差异比较分析、聚类分析、物种组成分析和关联网络分析;
基于上述获得的功能丰度谱和物种组成谱,可以进一步对宏转录组样本进行Alpha和Beta多样性分析,进而通过统计学方法筛选得到关键生物标记物;
一款宏转录组测序分析软件包:SAMSA2
SAMSA2: a standalone metatranscriptome analysis pipeline
SAMSA2是SAMSA的升级版本
SAMSA2速度更快,这是由于使用了DIAMOND(详情请见生信入门:序列比对之diamond)
SAMSA2更加灵活,这是由于使用了本地数据库
SAMSA2分析流程如下:
通过SAMSA2的可视化脚本获得的PCA图和热图
物种丰度柱状图
宏转录组学的缺点和挑战
宏转录组研究虽然火热,但是如上所述获得高质量RNA还是一个挑战。
另一个需要考虑的问题是mRNA的半衰期较短,因此可能很难检测到针对环境刺激的快速反应。而且,mRNA和蛋白质并不总是同步出现的。
因此,需要一个整合来自于宏基因组学、宏转录组学、宏代谢组学和宏蛋白质组学数据集的分析流程,这可能有助于多层次的全面了解微生物群的组成和功能。
常见问题
宏转录组与宏基因组差别?
宏基因组是以环境中所有微生物的DNA为研究对象,宏转录组以环境中所有微生物的RNA为研究对象。
宏基因组能够告诉我们环境中所有微生物能够做什么,而宏转录组能够告诉我们环境中所有微生物正在做什么。
宏基因组测序获得的基因为整个环境微生物的基因组,主要侧重于研究基因的结构,预测潜在的代谢功能和基因表达情况,但是在特定的时空下并非所有的基因都会表达,宏转录组测序获得的是具有转录活性的基因。
宏转录组应用范围
宏转录组学,和宏基因组学一样适用范围广泛,其包括:人体微生态、环境、工业、农业等领域。
人和动物样本
不同类型,如胃黏膜、粪便、唾液、肺部灌洗液、生殖道分泌物等;
不同处理,如正常与患病、不同年龄、不同药物处理等。
取样方法
动物组织样本,采用RNase-free水或1×PBS缓冲液(pH7.4)清洗,可用RNAlater保存剂,或液氮速冻,-80℃以下的环境中保存,或干冰运输。
所有宏转录组样本类型,提取出来的RNA总量需至少1 μg,OD260/280值为1.6~2.3,有明显主条带28S/18S≥1,即达到合格。
宏转录组测多少数据量?
普通环境样本,推荐>5G数据量;
肠道微生物或寄生微生物,推荐>10G数据量,由于可能存在宿主RNA的污染需要加大测序量;
建议根据自己的研究目的来选择适宜的数据量。
文章实例
人肠道菌群宏基因组和宏转录组的整合研究
PNAS June 3, 2014 111 (22) E2329-E2338; first published May 19, 2014 https://doi.org/10.1073/pnas.1319284111
研究背景:
本研究利用受试者自己收集的人体多部位样品,进行了第一个结合表型分类学、宏基因组学和宏转录组谱的人类微生物组的研究。
结果详细描述了肠道菌群基因组潜能和基因表达之间的关系,论证了在受试者收集和运输的样品中开展宏转录组研究的可行性。
研究结果:
自采集的方法对组学研究的影响很小,可提供有代表性的宏基因组和宏转录组数据。
以KO数据库为参考,最终得到3,292个DNA和RNA相对丰度,并对DNA和RNA水平进行了关联,结果表明基因和转录本的丰度具有良好的相关性。
尽管不同个体间宏基因组的组成保守性较高,但是其在宏转录组水平却有区别,说明存在特异的宏基因组调控模式。
图. 不同样本处理方法得到物种组成和基因功能分类具有一致性
Nature子刊:老年男性粪便菌群中的宏转录组
Nature Microbiology
Metatranscriptome of human faecal microbial communities in a cohort of adult men.
2018-01-15 DOI: 10.1038/s41564-017-0084-4
① 收集308名老年男性的粪便菌群,分析372份宏转录组样本和929份宏基因组样本;② 鉴定出了“核心”宏转录组,包括核苷酸生物合成通路、糖酵解及碳水化合物代谢通路、氨基酸合成通路、非氧化戊糖磷酸循环通路等;③ 在“核心”转录组之外,还鉴定出了宏转录组中的“可变”部分,包括长链脂肪酸、萜类化合物、多胺等。
Nature子刊:老年男性肠道菌群的稳定性
Nature Microbiology
Stability of the human faecal microbiome in a cohort of adult men
2018-01-15 DOI: 10.1038/s41564-017-0096-0
① 对308名老年男性的粪便菌群进行宏转录组及宏基因组测序分析;② 受试者共提供4份粪便样本,前两份(相隔24-72小时)与后两份(相隔24-72小时)之间间隔6个月;③ 粪便菌群的个体内分类学及功能差异始终低于个体间的差异,但在宏转录组上个体内的差异及个体间差异的程度相似;④ 宏基因组稳定性高于宏转录组,宏基因组不稳定性约占相应宏转录组不稳定性的74%;⑤ 拟杆菌属/链球菌属分别是最稳定/最不稳定的转录组的主要贡献者。
END
感谢您的阅读,欢迎点赞、评论、支持和转发!!
喜欢就点一下"在看"呗~