查看原文
其他

2018发文60篇的大牛,手把手教您绕开微生物组学研究的所有坑!

张义 华大科技BGITech 2019-06-02

编者按

随着微生物测序技术和数据分析的进步,微生物组学相关研究呈爆发式增长,微生物组学文章发表的要求也越来越高。那么我们如何做好微生物组学研究呢?


2018年发文60篇的微生物组学研究大牛Rob Knight, 发表在《Nature review microbiology》(IF31.85)上的一篇综述,从方案设计、研究方法、数据分析以及多组学等方面为,我们讲述了如何做好微生物组学研究。


今天科技君和大家一起,跟着Rob Knight教授学习如何做好微生物组学研究的方案设计。



关于Rob Knight

加州大学圣地亚哥分校微生物组创新中心主任;累计发表文章约600篇;代表软件QIIME引用次数超过10,000次,UniFrac引用次数超过5000次;地球微生物组计划(EMP)、美国肠道计划(American Gut Project)的发起人之一。


 “求同篇”


随着微生物组研究越来越普遍,其分析的重现性也越来越重要。相似的微生物组研究经常会产生相互矛盾的结果。如果没有适当的样本采集,数据处理和分析方法标准,很难重新评估这些数据并校正不同批次数据间的差异。随着微生物组学分析方法的发展,我们有必要采用新的工具对早期实验结果进行重新分析;数据重现性对重新分析的结果是否可行有效也至关重要。


为了保证微生物组分析的重现性,迫切需要在微生物组研究中使用一些通用标准。↓↓↓


1. 在样本采集过程中,应详细记录各项信息,确保尽可能详细的记录实验变量。


表型信息记录应遵循标记基因(MIMARKS)和宏基因组(MIMS)的基因组标准联盟最低信息标准(MIxS)。在无法控制所有样本条件一致的情况下,详细记录实验变量可以保证样本的基因型和表型关联分析、不同分组样本的差异分析、样本菌群组成的机理研究分析的需求。建议宏基因组的元数据中应当包含如下基本信息:


人体样本:个人基本生理信息、生活行为方式、膳食结构、营养状况、既往病史等信息。

环境样本:样本获取过程中的采集地点、大气、水文、温度、压力、运输方法、存储媒介等信息。

详细的元数据记录标准请参考:Yilmaz P et al. Nature biotechnology, 2011, 29(5): 415.


2. 生物信息处理过程中,研究人员应保证运行的所有命令以及使用的所有软件版本可追溯,并将其原始数据存储在公共数据库中。


建议使用Jupyter Notebooks或R Markdown等工具来实现此目的,然后将代码存储在GitHub等版本控制管理系统中。一些软件包,如QIIME 2(REF.59)和Galaxy,可通过集成的数据来源跟踪系统自动跟踪研究人员的这些信息。


Qiita和EBI分别是强大的元分析和数据归档工具,这两个工具联合应用,可以使研究人员在成千上万其他样本的背景下,分析自己的微生物组数据,未来的研究人员也可以通过这两个工具重复使用这些数据。


 

“存异篇”


微生物组数据分析方法广泛适用于多数样品类型和环境,但不同样品类型在实验设计和方法选择上各有差异。↓↓↓


1. 样品组成不同,处理方法不同。


对于非微生物DNA污染严重的样品,如果不预先去除非微生物DNA干扰直接进行宏基因组测序将极大地增加测序成本(人唾液样本中宿主DNA含量在80%以上,血液/动植物组织样本宿主DNA占比高达90-99%);16S测序虽然能特异性扩增微生物保守序列,如果宿主DNA含量过高也会因为目标DNA浓度太低导致扩增失败。


所以对于非微生物DNA含量较高的样本,需要根据情况在样本采集或DNA提取前进行特殊处理,以降低非微生物DNA含量。如对于宿主含量较多的样本(如唾液),可采用商业试剂盒进行去宿主DNA处理(NEB, Qiagen公司都有对应的试剂盒);死亡微生物DNA含量较高的微生物样本(如土壤样本),可在DNA提取前通过单砷化丙啶法或其他方法物理去除死亡微生物的DNA。


2. 样本类型不同,取样量要求不同。


不同样本类型微生物含量是不一样的。如粪便样品微生物含量较高,用拭子取少量样本即可满足微生物组研究需求;海洋样本微生物含量较低,为了满足宏基因组研究需求,可能需要取上百升海水进行过滤浓缩。


宏基因组研究对样本量要求较高,一些微生物含量较低无法满足宏基因组起始量要求的样本(如血液、脊液或极端环境等),可选择16S rDNA测序。16S rDNA测序可用于环境中微量微生物的研究,由于扩增灵敏度较高,这些低微生物含量的样本在16S rDNA测序中也更容易引入环境微生物污染(如血液、脊液或者洁净环境)。


3. 研究目的不同,样品保存方法不同。


微生物组样本要求尽可能-80℃保存,在样本室温保存期间,微生物群落结构可能会受到某些微生物过度增殖影响;对于野外研究或其他无法冷冻的情况,可以使用缓冲液存储,如储存在95%乙醇或商业产品如MGIEasy粪便样本采集套装或OMNIgene Gut试剂盒中。宏转录组样本保存中需要RNase抑制剂,代谢组学研究要求样品保存不会干扰代谢物提取或代谢数据收集。


4. 方案设计及考虑因素。


不同样本类型在方案设计过程中需要考虑的因素不同(详见“方案篇”)。虽然不同样本的采样方法和需要收集的信息各不相同,在任何情况下,同一研究中所有样品的收集、保存和处理方法应保持一致。

 

“方案篇”


精细的方案设计对于从微生物组研究中获得准确而有意义的结果至关重要。微生物组学研究会受到很多复杂因素的干扰。认真记录并检查样本信息,设计合理的对照样本(包括提取物、试剂空白对照),详细记录总体和个体变量等都是至关重要的。


1. 研究方法。


目前常见的宏基因组研究方法是以疾病/对照为代表的横向研究(cross-sectional studies)。横向研究可以用于发现不同人群(如疾病/对照,不同区域个体)的微生物群落差异,然而由于宏基因组研究影响因素较多,横向研究发现的差异,除了跟我们所感兴趣的疾病或区域因素相关,还可能与饮食、生活习惯以及药物等因素相关,例如有研究表明,糖尿病患者微生物组变化可能与二甲双胍等药物作用相关。


这就要求在横向研究中尽量排除一些非相关因素干扰。年龄和性别是大家通常会注意到的因素,但对于人体微生物组研究来说,不同性别人群身体各部位微生物群落差异较小,而其他一些因素,如药物和饮食影响相对较大,需要重点控制;还有一些变量对微生物组研究的影响尚不清楚。所以尽可能收集全面的临床数据,对于识别无法控制的复杂因素而言至关重要(如何全面收集临床数据,请参考Rob Knight大牛2015年发在《Microbiome》上的综述《Context and the human microbiome》)。

图1  在疾病/对照实验中,应尽量排除非疾病因素干扰(如年龄,性别,饮食,生活方式和药物因素等)。


案例参考:

青少年肥胖与人体微生物(Liu R, et al. Nature medicine, 2017.)

冠状动脉粥样硬化与人体微生物(Jie Z, et al. 2017.)

类风湿性关节炎与人体微生物(Zhang X, et al. Nature medicine, 2015.)

结直肠癌与人体微生物(Feng Q, et al. Nature communications, 2015.)

糖尿病与人体微生物(Qin J, et al. Nature, 2012.)

 



纵向研究(longitudinal studies),特别是在疾病发作前收集基线样本(baseline samples),有助于解决微生物组研究中的干扰因素的问题,不过该方法需要跟踪时间较长且成本较高,在目前研究中占比较少。为了方便后续统计分析,纵向研究应该仔细规划样品采集的时间安排:对人群研究而言,需要每个被试者在相同的时间点进行样品采集。

图2  纵向研究可以控制干扰因素,并评估群体的稳定性。


案例参考:
婴儿从出生到一岁期间的肠道菌群变化(Bäckhed F, et al. Cell host & microbe, 2015, 17(5): 690-703.)。



随着越来越多的疾病发现与人体微生物相关联,介入性(interventional)研究也常用于研究治疗过程的微生物组和疾病状态关系。


案例参考:
二甲双胍治疗中二型糖尿病患者人体微生物的变化(Forslund K, et al. Nature, 2015.)。




2. 动物实验。


一些动物模型如啮齿动物(大鼠、小鼠)、鱿鱼、昆虫或斑马鱼微生物复杂性各不相同,常被用于宿主和微生物互作研究(如研究宿主遗传因素和微生物组的相互作用)。啮齿类动物由于其较好的代表性以及和人类生理上的相似性,通常是微生物组学研究的首选。啮齿动物在实验设计过程中需要根据动物本身的特点进行合理的方案设计(以下内容也适用于其他共同饲养的模式生物,如斑马鱼等):


1) 食粪性。啮齿动物的食粪性会导致实验动物经过一段时间的同笼饲养,个体间微生物组变得均一化。因此需要将同一组动物分散在不同的笼中饲养,以控制同笼效应(cage effects)对实验结果的影响。


2) 母体效应。母体效应也会影响微生物组的结果,因此需要将同一窝小鼠随机分在不同笼子以随机化母体效应。


3) 单间胁迫(single housing stresses)。单独培养会对老鼠造成心理压力,在技术上或道德上通常是不可行的。


4) 环境因素。遗传上相同的啮齿动物的微生物组也可能因环境因素不同而不同,如饮食,垃圾,供应商,运输和设施都会影响动物的微生物组,同一研究中尽量保持这些因素的一致。


5) 早期微生物组暴露。早期微生物暴露对个体后期稳定的微生物群有很大影响,并影响免疫系统的发育。

图3  动物实验过程中需要尽可能控制影响动物微生物组的因素。如需要考虑食粪性、母体效应、单间胁迫、环境因素、早期微生物组暴露等因素对实验动物微生物组的影响。


3. 实验条件控制。


在微生物组研究中,不同实验方法(从DNA提取到测序)会导致测序结果有很大的差异。这就要求:


1) 研究过程中的所有样本必须使用相同的试剂盒,并收集多个基线样本用来评估纵向研究中不同时间点微生物组的内在变异。


2) 在取样,DNA提取,PCR和测序过程中设置空白对照来检测实验过程中引入的杂菌污染。


3) 样品应尽可能在-80°C保存,以避免保存和运输过程中某些微生物的过度生长。对于野外研究或其他无法冷冻的情况,可以使用缓冲液存储,如储存在95%乙醇或商业产品如MGIEasy粪便样本采集套装或OMNIgene Gut试剂盒中。


4) 可在每个测序run中加入相同的模拟微生物群落(成分已知的参考样本),用于对不同run测序结果进行均一化。目前对不同方法得到的微生物组数据进行均一化分析仍然是微生物组学分析的一大挑战。

图4  对于所有研究,标准化的实验流程对于控制实验过程中(试剂盒试剂,引物,样品储存和其他因素)引入的变异至关重要。数据采集过程中需要详细记录每个样本从临床变量到样本处理处理过程中的所有原始数据,否则最终很难从测序数据中得出有意义的结论。



怎样,看完大牛的建议

大家对微生物组学研究

是否有了更清晰的认识?

科技君祝大家在新的一年

研究圆满,发文顺利!



参考文献:

1. Knight R, Vrbanac A, Taylor B C, et al. Best practices for analysing microbiomes[J]. Nature Reviews Microbiology, 2018: 1.


撰稿:张   义

编辑:市场部


往期回顾

成绩单!自主平台BGISEQ累计发文135篇

换届!尹烨先生当选市标准化协会会长

对抗棉花“癌症”,这篇文章提供了新思路

西藏农牧科学院与华大基因发文揭示青稞起源与进化 |《Nature 》子刊

无偿公开 | 提速831倍!miRNA靶基因预测利器qTar

施季森教授团队联合华大基因全球首次破译鹅掌楸基因组 | 《Nature》子刊




请继续关注“华大科技BGITech”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存