牛!王军等喜提NBT:用AI在肠道超高效“挖”抗菌肽(附独家专访) | 热心肠日报
今天是第2102期日报。
肠道微生物组是一座巨大的宝库,包含了海量的微生物基因。如何有效挖掘这座宝库,是微生物组研究中的热点问题。今天日报的头条,我们特别报道中国科学院微生物研究所王军团队与陈义华团队合作在国际著名学术期刊Nature Biotechnology最新发表的题为Identification of antimicrobial peptides from the human gut microbiome using deep learning的研究论文。该研究建立了能从人肠道微生物组中大规模挖掘新型抗微生物肽的人工智能方法。我们特别附上对共同通讯作者王军教授的专访,以飨读者。
王军+陈义华NBT突破:用人工智能大规模挖掘人肠道菌群中的抗菌肽
Nature Biotechnology[IF:54.908]
① 结合3种自然语言处理神经网络模型(LSTM、Attention和BERT),建立一个从序列数据中挖掘抗微生物肽(AMP)的流程,准确率>90%;② 将该方法用于人肠道宏基因组数据,结合宏蛋白质组数据过滤,以及与肠菌的相关性网络分析,鉴定出241个候选AMP;③ 通过化学合成得到216个新型肽,证实其中181个(83.8%)有抗菌作用,这些AMP与已知AMP同源性低;④ 进一步筛选出其中的强效AMP,能通过不同机制有效抑制多重耐药革兰氏阴性致病菌,并在细菌性肺感染小鼠模型中验证了3种AMP的有效性。
Identification of antimicrobial peptides from the human gut microbiome using deep learning
03-03, doi: 10.1038/s41587-022-01226-0
【主编评语】抗生素耐药菌(特别是多重耐药菌)对人类健康造成严重威胁,亟需开发新的抗菌药物。生物体(包括肠道微生物)产生的抗微生物肽(AMP)是研发新型抗菌药物的弹药储备库,但受限于已有技术,仍有大量AMP尚未被挖掘出来,人工智能(AI)算法在该领域中有很大的应用潜力。中国科学院微生物研究所王军团队与陈义华团队合作在Nature Biotechnology发表最新研究,结合多种自然语言处理神经网络模型,建立了能自主学习AMP序列特征从而挖掘鉴定新型AMP的AI方法,并用该方法从人肠道微生物组数据中挖掘出181个新型AMP,包括能在体内外有效抑制多重耐药菌的强效AMP。总之,这项概念验证研究不仅为研发抗菌药物提供了大量的候选AMP,也为利用AI从宏基因组数据中挖掘功能肽提供了一个优秀的范例。(@mildbreeze)
王军
中国科学院微生物研究所研究员,博士生导师,国家高层次海外人才项目入选者,德国马普学会合作伙伴小组负责人,北京市科技新星。主要从事生物数据的深度挖掘和分析工作,利用统计学、生物信息学结合的方法,研究肠道菌群在动物和人类生态、基因组进化和疾病中的作用。至今,在Science、Nature、Nature Genetics、Nature Biotechnology等国际一流科技刊物发表SCI论文60余篇,承担重大基金项目5项,申请专利5项。
问
祝贺王老师团队在NBT发表重要成果!机器学习(尤其深度学习)是前沿也特别“酷”的一个领域。您和团队的这项研究采用了深度学习的方法挖掘肠道菌群的功能分子,是基于怎样的背景和出发点?
答
在与临床的一系列合作,尤其在自身免疫病菌群研究中,我们逐渐意识到肠道菌群除了代谢产生的一系列小分子以外,高度复杂的基因组也编码大量的多肽/小蛋白等大分子,能够作为模拟表位诱导自身免疫反应,或者作为免疫调节分子影响宿主的免疫。
微生物产生的小分子需要代谢组或者化学方法研究,但是大分子可以更直接地从大规模测序所积累的基因组数据中预测和进行功能实验。当然,这个过程的关键是建立准确的预测方法,降低假阳性所带来的实验成本。此外,具有同样功能的多肽可能在序列上没有显著的相似性,传统的生信方法作用有限。
因此,我们转向自然语言分析中发展的神经网络模型,建立了高准确度的预测方法,并且在大量的宏基因组数据中以抗菌肽为第一个实例进行了挖掘。
同时,我们有微生物所陈义华团队的大力支持,在所挖掘出的抗菌肽的结构和作用机制方向做了深入的工作。结果表明我们的方法没有局限于一类特定的抗菌肽,而是确实发现了很多序列、结构和机制都很新的抗菌肽。
问
目前用AI挖掘微生物组功能分子的研究现状如何?这项研究的主要亮点、创新点或突破何在?
答
现阶段,微生物组功能分子的挖掘集中于代谢组、生物化学分析上的小分子研究,整体的数据量和标准化程度对AI方法都有一定的限制,尤其是神经网络模型等方法更依赖于数据量,才能达到比较精准的判断。另一个方面,针对小分子的AI模型主要依赖于转化为图像分析的方法,基本不适用于基因组编码的生物大分子。
这项研究的特点有四个:
首先,我们的研究思路是,从序列数据出发直接挖掘具有功能的生物大分子,并应用于生物大数据的转化以及最终的临床治疗,可被看作新的“从硬盘到药物”的研究范式。
同时,我们应用的深度学习神经网络模型来源于自然语言学习,更适合分析基因组数据、蛋白数据等文本信息,区别于之前医学影像分析、小分子学习的图像分析方法。
再者,可挖掘的分子空间非常巨大,对于特定长度的DNA和蛋白,其分子理论多样性堪比天文数字级别,即使具有特定功能的分子比例极低,仍然会有大量高活性的大分子。
最后,我们的工作不仅实现了高通量筛选和验证,还寻找到了可用于动物体内实验的候选分子,将药物前期筛选的流程极大压缩,对降低药物筛选、设计的成本和时间具有积极作用。
问
这项研究有哪些后续规划?在转化应用方面有什么考虑?
答
我们正在对于现有活性好、安全性高的抗菌肽进行化学改性,进一步提高药代性能。我们也希望感兴趣的生物医药公司和我们合作公关,开发用于耐药菌治疗的新型抗菌药物。
利用同样的流程,我们还发现了具有调节免疫或者改善代谢功能的多肽,正在做机制研究和动物实验。
发掘其他类型的生物分子例如RNA,进一步延伸到设计分子,一系列工作都在紧锣密鼓地进行中。这些工作也具有可观的转化价值,我们也希望能与生物医药产业开展更多合作研发与转化。
问
在2021中国肠道大会开幕式报告中,您系统讲解了数据和方法驱动的微生物组研究的现状和未来(点此查看),那么AI对肠道微生物组研究和功能分子挖掘的应用和前景如何呢?
答
除了挖掘生物大分子,在更多微生物组数据和表型的基础上,AI方法的进步与应用可以实现多个层面的研究质变。它可以挖掘与疾病相关的微生物类群、基因、通路或毒力因子,结合代谢组学数据发现新的代谢通路、催化途径,结合合成生物学设计新的通路,以及更高效协助疾病的诊断、预测、干预或治疗,但仍然需要依赖大量标准化数据的积累和方法学进步。
问
可否介绍一下您课题组的其他研究方向?
答
人工智能挖掘功能分子是我们研究组下游方向的代表性工作。
在上游,研究组主要利用新的测序技术,尤其牛津纳米孔技术(ONT)进行微生物组学分析的新方法研究,例如利用ONT建立了针对病原组学的快速分析方法(mtTGS,发表于2021年Advanced Science),以及之前研究较少的微生物组学的分支病毒组学(virome,2021年Gut Microbes)、真菌组学(Molecular Ecology,minor revision)等。
在中游,我们和临床机构开展了一系列合作,在自身免疫性疾病例如系统性红斑狼疮(发表于Arthritis & Rheumatology 2021年封面)、类风湿关节炎、代谢性疾病的中医治疗(GBP 2020),以及对多种肿瘤深入阐述微生物组的作用和分子机制。
问
能否分享一下您的求学和科研经验?给博士/博士后提供一些做好科研的建议?
答
我于2008年本科毕业于中国海洋大学生物技术专业、国家生命科学基地班,而后在比利时根特、西班牙奥维耶多、德国不来梅大学三个学校完成了欧盟Erasmus Mundus硕士项目。2010年进入德国马普进化生物所做博士研究,主要利用野生家鼠模型研究肠道菌群的地缘生物学(2013年,Molecular Ecology)、遗传学(2014年,PNAS)和进化(2015年,Nature Communications),2014年以最高成绩毕业。随后进入比利时鲁文大学、弗拉芒生物研究所,主要从事大人群的肠道菌群分析和基因关联研究。2016年,先后发表Science封面和Nature Genetics封面文章。2017年回国后在中科院微生物所,在中科院病原微生物与免疫重点实验室建立课题组。
我的硕士、博士和博后科研经历得益于德国马普所、鲁汶大学等科研机构的宽松科研环境和氛围,对自由探索相对宽容,并鼓励新的思路和方法。我建议正在进行科研的基础训练的博士和博士后,主动学习新的知识,了解领域的发展方向,积极开拓新的研究领域,不局限于自身的擅长部分,而是要更加主动去挑战不擅长、融入新研究。
(专访内容结束,以下是日报的其他内容)
Science:用机器学习指导抗生素个体化使用,减少耐药性出现
Science[IF:47.728]
① 分析14万多例尿路感染和7365例伤口感染的抗生素治疗和复发数据,发现正确的抗生素治疗能总体上减少复发率,但会增加有耐药性的感染复发;② 结合1113个治疗前/后的分离菌的全基因组测序发现,复发时出现的耐药性并非是因为原菌株获得了耐药性,而是由患者菌群中本就有耐药性的其他菌株的替代所致;③ 建立可提供个体化抗生素使用建议的机器学习模型,能减少因治疗引起的耐药性出现。
Minimizing treatment-induced emergence of antibiotic resistance in bacterial infections
02-24, doi: 10.1126/science.abg9868
【主编评语】Science发表的这项研究,结合1113个治疗前/后的分离菌全基因组测序以及14万多例尿路感染和7365例伤口感染的机器学习分析,发现可以在患者个体层面,预测并减少因治疗引起的抗生素耐药性的出现。(@mildbreeze)
肠道菌群如何影响多重耐药菌定植(综述)
Trends in Microbiology[IF:17.079]
① 抗生素的使用、药物、健康状况和生活方式因素可改变肠道菌群组成,导致多重耐药微生物(MDRO)的扩张,这与不良临床结局有关;② 多组学方法有助于识别肠道生态系统中与对MDRO的定植抗性相关的微生物和代谢特征;③ 微生物特征可作为潜在的诊断和治疗工具的生物标志物,包括用于识别MDRO定植风险和治疗预期疗效的预测模型;④ 益生菌、粪菌移植、基于微生物组的疗法、噬菌体疗法、菌群编辑等或有助于清除肠道中定植的MDRO。
Gut microbiome signatures and host colonization with multidrug-resistant bacteria
02-18, doi: 10.1016/j.tim.2022.01.013
【主编评语】肠道菌群可帮助宿主抵抗多重耐药的定植,Trends in Microbiology发表的这篇综述对这一话题进行了深入探讨,推荐专业人士关注。(@mildbreeze)
Nature子刊:抗生素用药史影响菌群-疾病关联
Nature Communications[IF:14.919]
① 分析2509人的深度粪便宏基因组测序数据和表型数据;② 确定了50种疾病、47种药物、20种饮食因素、5种内在因素、4种医疗程序和14种其他因素对肠道菌群的影响,解释了10.14%的肠道菌群组成的个体间变异和10.48%的菌群功能变异;③ 电子健康数据扩展了人们对菌群-宿主互作的认识,并表明长期(10年内)的抗生素使用情况对肠道菌群组成有显著影响,部分解释了疾病之间共同的菌群失调,校正抗生素使用史使得鉴定出的菌群-疾病关联大幅减少。
Gut metagenome associations with extensive digital health data in a volunteer-based Estonian microbiome cohort
02-15, doi: 10.1038/s41467-022-28464-9
【主编评语】Nature Communications近期发表来自爱沙尼亚微生物组队列的研究,结合宏基因组和电子健康数据分析,扩展了人们对于菌群-宿主互作的认知,特别是抗生素使用史对于肠道菌群与疾病关联的影响,强调了纵向的长期健康数据记录对研究菌群-疾病关联的重要性。(@mildbreeze)
四川大学:腹泻恒河猴的肠道微生物组及耐药组与人类有何不同?
Microbiome[IF:14.65]
① 慢性腹泻恒河猴 (RM) 肠道乳酸杆菌属丰度显著减少,该类细菌具备肠上皮细胞粘附和细菌素生产功能;② 腹泻RM肠道中粘蛋白降解菌、条件致病菌丰度增加,相关代谢通路中气杆菌素生物合成富集,而无症状RM菌群代谢富含短链脂肪酸产生;③ 腹泻RM肠道中抗生素耐药基因丰度增加,粪便和组织液中分离株对多数抗生素耐药率高,除了头孢霉素和碳青霉烯类药物;④ 与无症状RM相比,慢性腹泻RM肠道微生物组与农村腹泻患者和非西方饮食患者惊人相似。
The gut microbiome and antibiotic resistome of chronic diarrhea rhesus macaques (Macaca mulatta) and its similarity to the human gut microbiome
02-09, doi: 10.1186/s40168-021-01218-3
【主编评语】人类和圈养恒河猴都存在慢性顽固腹泻,在幼年个体中有着较高的发病率和死亡率。四川大学生命科学学院李静、范振鑫及团队近期在Microbiome上发表文章,筛选出11只长期慢性腹泻恒河猴与无症状个体相比较,通过粪便宏基因组测序,结合肠道微生物的耐药性分析,揭示了慢性腹泻相关机制。(@solo)
吴清平院士团队:幽门螺杆菌抗生素耐药分子机制
Helicobacter[IF:5.753]
① 从314份胃黏膜样本中分离幽门螺杆菌共54株,抗菌谱显示耐药率最高的抗生素为甲硝唑(77.78%),其次为克拉霉素(CLR, 50.00%)和左氧氟沙星(33.33%);② 其中,55.56%的菌株具多重耐药,由单药耐药基因累积造成;③ 耐药相关抗性基因突变:克拉霉素(23S rRNA和infB突变),左氧氟沙星(gyrA/gyrB突变),甲硝唑(rdxA, rpsU, 和sodB的突变);④ 菌株抗生素耐药性的表型和基因型具一致性,可监测抗生素抗性基因突变预测菌株耐药表型。
Exploration of the molecular mechanisms underlying the antibiotic resistance of Helicobacter pylori: A whole-genome sequencing-based study in Southern China
02-06, doi: 10.1111/hel.12879
【主编评语】广东省科学院吴清平院士团队研究成果。幽门螺杆菌抗生素耐药性与人体健康密切相关,但机制并不清楚。本文基于在中国南部分离的54株幽门螺杆菌,测定了其对5种抗生素的敏感性,并基于全基因组测序技术,测定了幽门螺杆菌分离株耐药性相关突变基因,从分子水平分析了其耐药性机制。(@Bingbing)
运动-菌群互作干预衰老相关肌少症
Journal of Cachexia, Sarcopenia and Muscle[IF:12.91]
① 运动能有效对抗与衰老相关的肌肉减少症;② 运动的类型和强度可以引发肠道菌群组成和功能变化,增加肠道菌群多样性,为宿主带来健康益处;③ 完整肠道菌群的存在保障正常的肌肉适应运动,促进膳食蛋白质消化和氨基酸吸收,减少肌肉减少症;④ 线粒体受肠道菌群的调节,运动训练可以改善肌肉线粒体功能,进而调节骨骼肌和肠道菌群功能;⑤ 对抗肌肉减少症的策略要考虑锻炼计划和饮食干预(蛋白质和纤维的均衡膳食摄入)对肠道菌群的影响。
Exercise-microbiota interactions in aging-related sarcopenia
02-10, doi: 10.1002/jcsm.12942
【主编评语】肌肉减少症是因衰老而引发的肌肉量的减少和功能的下降,会引发骨折等健康风险。而运动可能是缓解该现象的方式之一。同时,肠道菌群也参与衰老过程。因此,通过运动和膳食改变肠道菌群,可能是干预衰老引发肌少症的有效措施。但是,相关研究并不多,本文也就此讨论了运动-菌群互作对于肌少症的潜在干预作用以及现有证据。(@Bingbing)
江南大学:开发异麦芽糊精需要考量糖苷键和分子量
Carbohydrate Polymers[IF:9.381]
① 通过对单一菌株的纯培养和人源粪菌体外混合发酵,研究不同分子量的α-1,6线性和α-1,2/3分支连接的异麦芽糊精(IMD)对人类肠道细菌的益生元效应;② 纯培养和混合发酵中,α-1,6线性IMDs显著促进双歧杆菌和乳酸杆菌的生长,α-1,3分支具有类似的选择性,但在纯培养中产生更多丁酸;③ 含有α-1,2分支的IMD仅在混合发酵期间被有效利用,或与代谢交叉喂养有关;④ 分子量较低的IMDs在纯培养中表现出更好的益生元效果,在混合培养中没有差异。
Diverse prebiotic effects of isomaltodextrins with different glycosidic linkages and molecular weights on human gut bacteria in vitro
2021-12-07, doi: 10.1016/j.carbpol.2021.118986
【主编评语】异麦芽糊精(IMD)是一种通过糖基转移酶重建淀粉分子链结构的新型膳食纤维。江南大学的吴敬团队在Carbohydrate Polymers上发表文章,比较了不同分子量的α-1,6线性和α-1,2/3分支连接的IMD对人类肠道细菌的益生元效应。研究发现糖苷键的差异导致IMD对肠道细菌的益生元效应存在差异,为针对不同人群开发功能性食品的应用提供了理论基础。(@章台柳)
iMeta:从肠道菌群看待人类对高原饮食的适应性
iMeta[IF:N/A]
① 作者对先前发表的来自西藏、蒙古高原和哈萨克草原的游牧地区,以及欧洲、美国和中国的低海拔中1000多个人群的宏基因组结果进行了整合分析;② 游牧地区人群具有高比例的Prevotella 肠型;③ 游牧地区人群的Prevotella 肠型具有较高的微生物多样性;④ 在季节交替中,游牧地区人群的Prevotella 肠型相对稳定;⑤ Prevotella 肠型可能有助于游牧人群对高原环境的适应。
Gut microbiota insights into human adaption to high-plateau diet
02-24, doi: 10.1002/imt2.6
【主编评语】美国贝勒医学院吴青龙、深圳大学王明福、南京农业大学刘金鑫与团队的研究成果近期在iMeta发表。饮食等方面是人类适应高海拔环境的重要因素,但在游牧人群中还需进一步证实,先前的研究表明,在低海拔人群的西方饮食中,宿主-饮食-肠道菌群间相互作用对健康具有重要作用。因此,本研究对高原游牧民族的饮食与肠道菌群的相互作用进行了剖析,肠道菌群的研究可能为与游牧饮食相关的人类适应高原环境提供新思路。本研究指出在高原人群中开展肠道菌群研究面临着一些挑战,在此作者提出了这些挑战和解决策略。(@刘永鑫-中科院-宏基因组)
感谢本期日报的创作者:mildbreeze,阿当,大力,九卿臣,王玲玲,Sophia,xinyan,刘永鑫-中科院-宏基因组
点击阅读过去10天的日报:
0303 | Science等2篇高分综述详解:T细胞与菌群的休戚与共
0302 | 《自然·医学》发力!三文聚焦菌群与肿瘤免疫治疗
0225 | 今日Science:感染赋予肠道更强免疫力?新机制揭晓
0224 | 今日Nature:肺部菌群影响大脑+肠菌毒素唤醒噬菌体
0223 | 间歇性禁食如何用于减肥?《自然·综述》一图读懂
0222 | 肠屏障“失守”:与啥有关/促啥疾病/如何改善?19页综述详解
点击阅读原文,查看更多热心肠日报的内容