BMC:幼年特发性关节炎患儿肠道菌群的特征、生物标记的识别及其在临床预测中的作用
论文题目:Gut microbiota in children with juvenile idiopathic arthritis: characteristics, biomarker identification, and usefulness in clinical prediction
原文链接:https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-020-6703-0
杂志名称:BMC Genomics [3.5]
DOI: https://doi.org/10.1186/s12864-020-6703-0
第一作者:钱旭波[1]、刘永鑫[2]
通讯作者:卢美萍、张咸宁;
其他作者:叶小红、郑雯洁、吕邵霞、莫妙军、林金晶、王文琴、王未寒
作者单位:1、浙江大学医学院附属儿童医院风湿免疫-变态反应科;2、中科院遗传发育所
主编推荐语
以前已经有研究显示幼年特发性关节炎患儿(病例组)肠道菌群存在紊乱,但是这些研究结果不是很一致,而且病例组和对照组的性别、年龄均不匹配。然而,性别、年龄等恰恰是很肯定的混淆因素。本研究技术上有以下亮点:一是病例组和对照组进行了性别、年龄、BMI(体重指数)“频率匹配”;二是用人工智能的技术进行了生物标记识别;三是用“决策曲线分析”技术验证了模型的可靠性。结果发现病例组产短链脂肪酸细菌明显降低,且与临床风湿指标呈负相关;12个属可作为生物标记用于临床预测。
摘要
背景和目的:近年来的研究发现幼年特发性关节炎(juvenile idiopathic arthritis,JIA)患儿肠道菌群有紊乱的情况,但是前面这些研究均未匹配年龄、性别、BMI等因素,结果不是很一致。我们进行了一个性别、年龄、BMI频率匹配的横断面研究(cross-sectional study),分析了JIA患儿肠道菌群的特征,评估了其在临床预测中的作用。
方法:JIA患儿40例,对照组42例,年龄1~16岁,采用16S rDNA测序。用随机森林的方法进行生物标记识别,用受试者工作曲线(ROC)和决策曲线分析(decision curve analysis,DCA)方法评估模型效果。
结果:病例组α多样性下降;两组间β多样性指标Bray-Curtis dissimilarity有显著差异;病例组有4个属的细菌下降,这些菌与常用风湿指标呈负相关,而且这些菌均为产短链脂肪酸细菌;用随机森林方法筛选出12个属具有作为生物标记的潜力,用12个属构建的随机森林模型用于识别患者和非患者的ROC下面积是0.7975,DCA显示这个模型具有临床使用价值。
结论:JIA患儿存在肠道菌群改变,以4个产短链脂肪酸属细菌下降为特征;这4个属下降与更严重的风湿指标相关;12个属构建的模型可用于临床预测。
主要结果及图片解读
1、肠道菌群多样性改变情况
⑴α多样性改变:JIA组Chao 1和香农指数下降,两组差异显著。但是辛普森指数无显著差异。
⑵β多样性情况:经PERMANOVA检验,两组Bray-Curtis dissimilarity有显著差异。用Dirichlet-Multinomial Model进行了检验效能(power)分析,检验效能是0.89。
图1:两组多样性比较。
图A分别是Chao 1和香农指数箱线图,两组差异显著。图B是韦恩图,显示了两组有83个属是相同的,但是JIA组有3个属是独有的,对照组有8个属是独有的。图C为PCoA图,每个点代表一个样本,可见两种颜色的点聚集情况有不同,提示β多样性有差异。图D为发育树,显示了丰度>0.3%的OTU,不同的“门”用颜色区分。
2、肠道菌群具体改变及与临床指标的关系
两组在“门”的水平并无差异。病例组Anaerostipes, Dialister, Lachnospira和Roseburia这4个“属”显著下降。差异分析方法用了ALDEx2,P值校正方法用了Benjamini–Hochberg。4个属与11个临床指标相关,主要呈负相关关系,相关系数绝对值在0.319~0.544之间。
图2:肠道菌群构成差异及其4个属与临床指标的相关性。
图A展示了两组在门和属水平的主要菌种构成。图B展示了4个属与每个临床指标的相关关系。图C是OTU的火山图,为两组OTU层面的构成差异分析情况,显示7个OTU丰度下降,效应值小于0.5。
3、生物标记识别及随机森林模型效果评价
在门、纲、目、科、属和OTU层面,发现用“属”构建的随机森林模型预测能力最强,其预测精度是67.9%,即袋外错误率是32.1%。用10倍巢氏验证法发现12个属是最合适的生物标记数量。按照变量重要性从大到小提取出这12个属,再用这12个属再次构建随机新的森林模型。新模型的预测精度是66.7%,AUC是0.7975,DCA分析显示其具有临床实用性。
图3:用12个属构建的随机森林模型可用作疾病分类器。
图A为巢氏验证法发现12个属是最合适的生物标记数量。图B为按照变量重要性排序图。图C为这12个属的相对丰度箱线图,这12个属包含了用ALDEx2分析发现的两组有显著差异的4个属。图D是用12个“属”构建的新模型的ROC分析图,灰色部分是95%可信区间。图E是DCA分析,红色的线就是新模型的净效益走势,可发现这条红色线一直在绿色和蓝色线上方,提示临床使用这个新模型用于临床后可获得净效益,有临床实用价值。
讨论
年龄是影响菌群构成的重要因素之一,特别是16岁以下儿童肠道菌群受年龄影响更加大。其他影响因素还包括性别、BMI、种族等。如果两组这些因素未匹配,则研究结果的可靠性低。这是本研究匹配了这些混淆因素的原因。由于完全的一对一匹配在临床实际中很难操作,本研究采用了频率匹配法。
在计算Chao 1和香农指数时,丰度低的物种有较大权重,辛普森指数则对普通物种权重大。本研究显示前2个指标有差异,而辛普森指数无差异,提示造成两组差异的主要原因是低丰度菌改变导致的。
Bray-Curtis dissimilarity差异检验的R2是0.02132,提示两组β多样性的差异有2.13%的原因是由JIA因素导致的。
单变量分析显示,JIA组4个属的细菌下降,它们在以前的研究中被证明是产短链脂肪酸细菌。短链脂肪酸包括乙酸、丙酸、丁酸和戊酸,它们具有显著的免疫调节活性,比如诱导Treg细胞分化,增加IL-10的产生,抑制Th17细胞等。而且给予丁酸盐的小鼠可抑制细胞因子产生,缓解关节炎症状。这些提示短链脂肪酸在JIA的发病中可能有重要作用。
本研究显示4个属的下降,而且下降越厉害,风湿指标越严重。这进一步验证了这几个属的细菌在JIA发生发展中的作用。
JIA的诊断是一件困难的事,多数情况下只能依靠病史、体检及排除其他疾病。我们发现12个属构建的随机森林模型可有效区分患者和非患者,但是以往评价模型都是使用ROC。但是ROC有个显著的缺点,即无法知道模型能否改善临床决策。2006年发明的DCA方法可有效解决这个问题。我们首次将DCA引入肠道菌群模型的评价,这尚属首次。DCA分析显示模型具有临床实用价值,可提高临床决策能力。
Reference
Xubo Qian, Yong-Xin Liu, Xiaohong Ye, Wenjie Zheng, Shaoxia Lv, Miaojun Mo, Jinjing Lin, Wenqin Wang, Weihan Wang, Xianning Zhang & Meiping Lu. Gut microbiota in children with juvenile idiopathic arthritis: characteristics, biomarker identification, and usefulness in clinical prediction. BMC Genomics 21, 286, doi:10.1186/s12864-020-6703-0 (2020).
文中统计分析使用代码:https://github.com/qianxubo/microbiota-stage-1
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
文献阅读 热心肠 SemanticScholar Geenmedical
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”