微生物预测年龄,皮肤比肠道更准确
The following article is from 菌探Momics Author 三明治
58
文献速递
众所周知,人类肠道微生物群会随着年龄而变化,但是人体微生物群作为年龄的预测因子的相对价值以及在人群的预测稳健性尚不清楚。本研究用多个公共数据进行了随机森林回归,测试了口腔,肠道和皮肤(手和前额)微生物群落预测成年人年龄的能力,并分别评估了每个队列的模型。结果发现,皮肤微生物组(3.8 ± 0.45岁)相较于口腔微生物组(4.5 ± 0.14岁)和肠道微生物组(11.5 ± 0.12岁)预测效果更佳。多个队列研究均表明肠道微生物组与实际年龄有关;手微生物组年龄预测模型可应用到前额微生物组年龄预测,反之亦然;与老年人富集的细菌相比,年轻人富集的细菌,丰度更高,且在多个群体中普遍存在。
Keywords: age prediction, gut microbiota, oral microbiota, random forests, skin
Title: Human Skin, Oral, and Gut Microbiomes Predict Chronological Age
DOI: 10.1128/mSystems.00630-19
Journal: mSystems [IF 6.519]
First Authors: Shi Huang
Correspondence: Rob Knight,Zhenjiang Xu
Affiliation: Center for Microbiome Innovation, Jacobs School of Engineering, University of California, San Diego, La Jolla, California, USA
Published: 2020-02-12
研究背景
人体微生物群在生命最初 3 年中变化迅速并成熟,成年之后变化微小;最近研究表明肠道微生物可以区分不同年龄分组,且因性别有差异。此外,由于微生物在个体死亡几天内继续变化,因此已经被应用于预测小鼠和人类的死亡时间,与预期相反的是皮肤微生物组预测死亡时间比肠道和周围的土壤微生物组更好。
研究结果
01
样品收集和模型构建
本研究收集 10 个先前报道的研究项目,一共 8959 个样本,其中,
4,434 份粪便样本(美国,n = 1,887;英国,n = 685;中国,n = 1,609;其他, n = 253);
2,550 份唾液样本(美国,n = 1,666;英国,n = 48;坦桑尼亚,n = 254; 其他, n = 582);
1975 个皮肤样品(美国,n = 1723;英国,n = 27; n = 225)。
16S-V4 rRNA 扩增子数据在 Qiita 分析获得 100 bp 扩增子序列变体(ASV )数据,用 QIIME 2 进一步分析了 ASV 数据。本研究收集的样品包含了自我报告的年龄(18 - 90)、BMI(18.5 - 30),没有炎症性肠病或糖尿病和取样前 1 个月不服用抗生素,同时也排除了怀孕,住院,残疾或重症患者。
对于肠道样品,大部分采集的样品来自两个项目:(i)美国肠道项目(AGP)和(ii)广东肠道微生物组计划(GGMP)。口腔和皮肤样品则是纳入在 Qiita 数据库中匹配符合上述排除标准的样品。用 QIIME 2 进一步分析了 ASV 数据。
使用随机森林(RF)对健康个体不同的身体部位(肠道,口腔,皮肤菌群)微生物群的 ASV 的相对丰度数据进行年龄预测建模。
为了评估混杂因素(例如性别)是否影响建模,首先在混杂因素分层的子数据集中训练了年龄模型,然后将其应用于所有其他子数据集。对于训练和测试模型,都使用平均绝对误差(mean absolute error (MAE))评估了回归性能。在微生物群年龄和实际年龄之间拟合平滑样条函数,以计算相对微生物群年龄。使用了 Wilcoxon 秩和检验以比较每个数据集中宿主组之间的相对微生物群落年龄。对于国家和身体部位的混杂因素也用同样方法评估。
02
模型预测效果
RF 回归结果显示,肠道微生物组与年龄相关(图1A),并且这种相关在整个队列中均成立,但口腔(图1B)和皮肤(图1B)微生物组与年龄的相关更强。皮肤微生物组预测年龄的误差平均在 4 岁以内。对于每个身体部位的高精度模型,需要相对较少的 ASV 微生物特征(图1D至F)。
原文图例
▼
FIG 1 The distinct capability for age prediction from gut (A), oral (B), and skin (C) microbiomes. Spline fit to the data is also shown (blue curve). Although the skewed age distribution in the skin or oral microbiota data set may decrease the accuracy of age prediction for the older adults, it will not affect the conclusions about the relative abilities of different human microbiomes to predict age. Prediction performances at increasing numbers of microbial species were obtained by retraining the random forest classifier on the top-ranking features (ASVs), shown in terms of mean absolute error (MAE) from gut (D), oral (E), and skin (F) microbiota identified with previous random forest models trained in different cohorts. Data are from Qiita studies 11757, 10317, 550, 1841, 1774, 2010, 2024, 2202, 11052, and 10052.
接下来,测试这些模型是否性别有别。因为先前的研究中,肠道微生物信号有性别区分,但是在口腔或皮肤微生物组中未发现性别特异性信号。因此在本研究,肠道模型中进行男性到女性交叉模型训练,预测准确性有小幅下降,但在其他身体部位未观察到有这结果,这表明这模型没有性别之分,不需要按照性别建立模型。
对于皮肤模型,本研究有足够的前额和手掌数据来测试在一个身体部位的模型是否也适用于另一部位。已知前额与手在生理学和微生物学上显著差异。头和手的模型的交叉训练结果显示额头和手掌的年龄预测模型可通用(图2)。这提示我们,未来研究皮肤衰老的决定性因素时可以将这些部位结合起来,尤其鉴于观察到人体微生物组和代谢庞大的多样性。
原文图例
▼
FIG 2 The skin microbiota age prediction model can be applied across forehead and hand microbiota. (A) The microbiota age of hand (orange) or forehead (blue) as calculated by a random forest model trained on the hand (upper scatterplots) or forehead (lower scatterplots) subsets; lines indicate spline fit. (B) The prediction accuracy of age regression models dependent on skin body sites and their cross-applications compared to random permutations. The vertical lines indicate the prediction accuracy (mean absolute error) of age models trained in forehead (orange) or hand (blue) sites and their testing on the other site, while the gray histograms show the MAE distribution in 1,000 permutations of age values in either training or testing data. (C) Cross-prediction matrix reporting prediction performances as MAE values obtained using a random forest model on ASV relative abundances. Matrix values refer to the MAE values obtained by training the regressor on the data set of the corresponding row and applying it to the data set of the corresponding column. The prediction accuracies between sexes are higher than those between body sites.
03
年龄预测模型的重要分类单元
在肠道模型中,在人群内或间都有特征重要性分数较高的物种有 Bifidobacterium 、 Blautia 属和Lachnospiraceae、Ruminococcaceae,、Clostridiaceae 科。但有些高分特征在不同国家差异甚大。例如:Bifidobacterium 在中国队列中是最重要的特征值,但是美国队列中无法检测到。
在口腔模型中,发现在女性和男性队列中属于Lactobacillales、Gemellaceae、Bacteroides 和 Fusobacterium 的 ASV 丰度都随着年龄降低而降低。
在皮肤模型中,用四个亚组(女性前额,男性前额,女性手掌和男性手掌)识别与年龄相关的标记,确定了几个厌氧菌科属(Mycoplasma、 Enterobacteriaceae 和 Pasteurellaceae)与年龄负相关。这反映了由于衰老而引起的这些生理变化。
这些结果与特定城市对预测临床状态的模型的影响一致。但本研究跨人群普适性成功的已调整的 RF 模型可能更加稳健和预测变量的普适性。有趣的结果还有,年轻人群的肠道和口腔细菌的丰度和出现率均比年老人群的丰富和普遍存在。年老富集的 ASV 则不那么普遍,也不是普遍存在,这提示年老富集的 ASV 是老相关的微生物迁移的良好标记物。
结果与讨论
本研究通过机器学习找到了预测年龄的准确又普适的皮肤年龄标记物。基于这些结果,未来可以研发基于微生物无创检测,以研究衰老和慢性疾病的过程。
M菌笔记
Data availability. The data and code for this study are available at https://github.com/shihuang047/age-prediction.
参考文献
Huang S, Haiminen N, Carrieri A P, et al. Human Skin, Oral, and Gut Microbiomes Predict Chronological Age[J]. Msystems, 2020, 5(1).
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
文献阅读 热心肠 SemanticScholar Geenmedical
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”