基于此,意大利特伦托大学研究团队整合1950个新测序和583个公开可用的食物微生物组,开发了可开放获取的curated Food Metagenomic Data(cFMD)资源,生成了10899个宏基因组组装基因组(MAGs),涵盖1036个原核生物和108个真核生物物种水平基因组箱(SGBs),其中包括320个未知物种。将这些MAGs与19833个人类宏基因组数据进行比较,揭示了食物和人类在微生物物种和菌株水平上的重叠。该项研究以“Unexplored microbial diversity from 2,500 foodmetagenomes and links with the human microbiome”为题发表在Cell上。文章发表在Cell上为了更好地研究食物中存在的微生物种群,研究团队获取了1950个食物微生物组(MASTER EU联盟),对其进行宏基因组测序,并与583个公开发表的食物宏基因组数据进行整合,获得了来自50个国家、涵盖59个数据集的2533个食物宏基因组数据集,即cFMD。总的来说,该宏基因组数据包括了从乳制品到发酵肉、发酵饮料、发酵种子以及非发酵鱼和肉的食物。随后,研究团队利用cFMD数据集生成了27,123个MAGs,经质量筛选,得到了10,112个原核生物MAGs。将这些MAGs与超过百万个基因组序列整合,聚类成1,036个SGBs,为MetaPhlAn v4确定了SGB特异性标记基因,以实现低丰度下对宏基因组中的所有SGBs进行分析。此外,研究团队重建了数百个真核生物MAGs,并聚类成108个真核生物SGBs,生成的数据集用于下游分析并扩展到19,833个人类宏基因组以探索食物和人类微生物组之间的联系(图 1)。图1. cFMD提供超过2500个带有标准化元数据和处理后数据的食物宏基因组分析显示,原核生物MAGs聚类形成的1036个SGBs分属于13个不同的细菌门,研究团队对其进行了分析以评估食物微生物的系统发育多样性(图 2A)。来自四个门六个纲的微生物对系统发育多样性贡献大,芽孢杆菌门是食物MAGs的主要组成部分,尤其是乳酸菌科和链球菌科;20%的食物MAGs与放线菌门相关,包括一些与健康相关的物种;醋杆菌科是第三大常被重建的科,代表了假单胞菌门的很大一部分;只有少量MAGs被分配到与肠道相关的拟杆菌门。因此,cFMD提供了食物微生物的扩展遗传和微生物多样性,包括传统上与食品相关的较少细菌科。接下来,研究团队探究了不包含任何参考基因组的食物SGBs(即uSGBs)。uSGBs的多样性非常高,当加入kSGB系统发育时,总分支长度增加了95%。这些uSGBs包含2127个食物MAGs,占总数21%(图2B和2C),其中46%的uSGBs在属水平上尚无法确定。最后,研究聚焦于仅在食物来源中检测到且在其他环境的MAGs中无匹配的未知uSGBs(即ufSGBs)(图2D),超过一半的uSGBs被标记为ufSGBs,包含来自327个样本的534个MAGs,主要与杆菌门、假单胞菌门、放线菌门和拟杆菌门相关,涵盖各类食品,在发酵鱼、水果和蔬菜及发酵种子中较突出。总体而言,食物中存在大量尚未被充分研究的独特微生物。图2.食物宏基因组中检测到的1036个原核生物SGBs的系统发育树在食物SGBs中,有一半至少包含一个参考基因组,因此可以在物种水平上进行分类学分配。已知的SGBs(即kSGBs)中,67%的MAGs来自乳制品;非乳制品样本共产生了2651个MAGs和331个kSGBs,占总kSGBs的62%;非乳制品中也有一些普遍存在的SGBs(图 3)。总的来说,对于在食物宏基因组中发现的有分离代表菌株的细菌物种,MAGs整合提供了更大的菌株多样性,从而能够进行更高分辨率的研究。图3.原核生物MAGs在食物类别中的分布进一步地,研究团队通过MetaPhlAn 4进行了更敏感和定量的分类学分析,在低至0.1X的覆盖率下,可全面检测到29969个SGBs,其中3622个SGBs在至少一个食物宏基因组中被鉴定。研究发现,样本内的α多样性在不同宏基因组和食品类别中差异很大,非发酵食品总体比发酵食品有更高的微生物多样性,反映了发酵过程的选择性压力。通过机器学习预测模型,研究团队能够根据分类学档案预测样本类别,且预测准确性很高。研究团队将分析扩展到人类宏基因组,以测定食物相关细菌与人类微生物组中常见定植菌的关联。通过对来自39个国家的19833份人类肠道和口腔样本进行分析,发现有1409个SGBs在食物和人类中都至少被检测到一次(图4)。该分析确定了816个在食物样本中普遍存在的SGBs,其中409个也在人类样本中被检测到,表明这些细菌可能在人类微生物组中占有一席之地。人类微生物组中食物相关微生物的数量受到宿主条件的影响,与口腔微生物组相比,食物微生物组与粪便微生物组的重叠度更高。食物来源SGBs数量在相同身体部位、不同年龄和生活方式的人群中分布相对稳定,但进行标准化及考虑累积相对丰度时,食物来源SGBs在新生儿和儿童中的贡献更为显著。研究团队最终确定了43种在食物和人类中普遍存在的SGBs,其中21种属于乳酸菌,在乳制品中起重要作用且常见于人类肠道。因此,许多在食物中发现的微生物物种也存在于人类微生物组中,这些重叠物种在婴儿微生物组中占比大,在成年人中相对丰度较低。图4.食物和人类微生物组中普遍存在的SGBs重叠研究团队对食物中的潜在病原体也进行了分析,在77份食物样本中检测出ESKAPEE物种E. hormaechei,相对丰度为0.02%,这需要进一步调查以确保食品安全。Streptococcus gallolyticusis在食物中广泛存在,且可能与疾病相关(如结直肠癌)。虽然这些细菌在食物中被发现,但它们与人类样本中的菌株在遗传上有所不同,表明其可能不是通过食物摄入进入人体的。因此,食物宏基因组分析对研究具有致病潜力的人类微生物组物种的起源有重要意义。图5.关原核生物SGBs的系统发育树突出了食物和人类来源之间的菌株水平重叠最后,研究团队对食物微生物组中的真核生物进行了表征,重建了787个真核来源的MAGs用于下游分析。这些基因组来自乳制品、发酵饮料等类别,被聚类为108个SGBs,均属于真菌分支,包括78个kSGBs和30个uSGBs。真核生物的SGBs在约45%的食物样本中被检测到,尤其是具有大量MAGs的食物类别,如酒精饮料、发酵饮料和发酵肉类中,在发酵鱼、水果和蔬菜以及肉类中也检测到了真核生物。图6.真菌普遍存在于食物微生物组中并跨越多种食物类别综上所述,该研究开发了开放获取食物微生物组序列资源——cFMD,分析了超过超过10000种原核和真核微生物MAGs,揭示了食物微生物的显著多样性。平均而言,人类肠道微生物群中约有3%的微生物来自食物,尤其是某些微生物物种和菌株,这一比例在婴儿的宏基因组微生物组中跃升至56%。
爱尔兰农业与食品发展部食品研究中心Paul D. Cotter教授则表示:“在未来,我们可探索这些食品微生物组在不同食物、文化、生活方式和人群方面的多样性。”
论文原文:Carlino N, Blanco-Míguez A, Punčochář M, et al. Unexplored microbial diversity from 2,500 food metagenomes and links with the human microbiome. Cell. 2024. doi: 10.1016/j.cell.2024.07.039.