赵立平:从基础研究走向市场的科学路径
如视频号播放失效,可点击链接观看:https://www.mr-gut.cn/articles/ss/841a23aa27b04484a3269e2c816cce8a
编者按
5 月 29 日,第十八个“世界肠道健康日”,GUT 2022系列活动迎来“第四届中国肠道产业大会主论坛”,特别邀请了人工智能、生物科学、全球十强乳业、微生态、科学营养等领域十位专家学者和企业代表,分享领域进展与行业新知。
本次特别整理发布热心肠智库专家、美国罗格斯大学应用微生物学冠名讲席教授赵立平的演讲视频及图文实录,以飨读者。
因为今天灿辉给我出的作业题目是《科学家如何从基础研究走向市场》,我想就结合我自己的一点经历和体会给大家谈一谈,希望能够有所启发。
本演讲的幻灯片 .pdf 版将在热心肠菌群微信群分享,感兴趣的读者请按以下方法申请入群:
首先我要公布一个利益冲突,我是Notitia 生物科技公司的联合创始人。因为演讲里边会讲到公司的工作,所以要把这个关系披露一下。
Q1
基础研究到市场应用的路径?
从基础研究到市场应用,或者从实验台到病床到底应该怎么做?这个问题我已经思考了很多年了,这里有一篇文章为证。
2000年10月在《科技导报》上,我曾经发表过和科研管理有关的论文,题目就是《基础理论研究在企业技术创新活动中的地位和作用——攻克“低度竹叶青酒褪色难题”的启迪》。在这篇文章里其实提到了,基础研究、技术创新和生产营销之间的关系应该怎么处理。
一般来说的话有三种模式。
第一种模式是从事基础研究、技术创新和生产营销的人,相互之间老死不相往来,各做各的,这是一种非常传统的模式。
第二种模式是以技术创新的人为核心。他们一方面向上游,去和做基础研究的人接触、沟通和合作,把最新的理论突破迅速地转变成新的技术,然后再和做生产营销的人合作把这个技术产业化。这个模式可以说是现在的一个主流模式。
第三个模式,我认为应该是未来占优势的一个模式。它是让从事基础理论研究的人,他的活动贯穿整个过程,就是从理论突破到技术创新到生产营销的全过程。
只不过他的主要精力,也许80%是在做基础理论研究,但他可能还有15%左右的精力是参与或领导技术创新,最后他可能还有5%左右的精力甚至会和做市场的人进行接触,主要是通过科普来与促进生产营销。
这个应该说是未来最有生命力的一种模式。
Q2
肠道菌群最基本的组成零部件是什么?
我做菌群已经有30多年的时间,我的主要精力一直在基础研究方面。
所谓基础研究就是说,你要时刻思考和想办法回答一些非常基本的科学问题,比如说什么是健康的菌群?健康的菌群应该具有什么样的结构和特征?
如果我们把肠道菌群看作是人体的一个器官的话,这个器官的最基本的解剖结构应该是什么?再具体地问,就是肠道菌群最基本的组成零部件是什么?这些零部件之间最基本的连接方式是什么?
也就是说在成千上万的不同类型的微生物中,哪些是我们维持健康离不了的,那这些微生物应该就可以被称为是我们人体菌群的核心成员。很显然,这个问题我们现在都还没有回答得特别清楚。
第一个问题要问的是,到底组成菌群的最基本的零部件是什么?
现在看来不是基因、不是物种、不是属、不是科、不是目以及一直到门,也不是通路,而是基因组。
因为微生物基本上是单细胞的,每个细胞里边都有一个染色体,这个染色体编码了所有的基因,就是它的基因组。所以基因组的种类和数目,其实就是微生物的种类和数目;基因组的拷贝数,就是微生物的丰度,就是它的种群数量的多少。
现在的宏基因组测序技术和数据分析技术,已经允许我们可以从每个样本的测序数据里把高质量的基因组拼接出来。我们应该以基因组作为最基本的变量,去研究肠道菌群和健康的关系。这是第一个我们要强调的。
第二个,以基因组为代表的微生物,它们相互之间不会是孤立的,而应该通过一定的互作关系,要么合作,要么竞争,形成一个一个的生态功能群,叫Guild。功能群之间可以是竞争,也可以是合作。但同一个功能群内的菌,它们应该是合作的。
所以我们应该用基因组作为最基本的变量,去看哪些菌相互之间合作形成生态功能群,然后两个生态功能群之间,谁和谁合作,谁和谁竞争。
这是第二个我们试图回答这些基础理论问题所做的思考。
Q3
零部件之间最基本的连接方式是什么?
这是2015年在EBioMedicine发表的,儿童遗传性肥胖用高膳食纤维干预得到的一个结果。这是第一次在人的肠道看到了所谓的生态功能群结构。也就是说当你用高膳食纤维进行干预的时候,菌和菌之间的关系不是随机的。它们会首先通过合作形成一个一个的功能群,功能群和功能群之间可以是合作,也可以是竞争。
有的功能群是在高膳食纤维干预下升高,有的降低,有的不变。这可能意味着,不同的功能群,有的和疾病正相关,有的和疾病负相关,有的和疾病不相关。
我们以基因组作为最基本的变量进行功能群分析,就可以把肠道主要成员相互之间的生态学关系,它们与宿主的关系定义得比较清楚,整个全过程不需要参考任何已有的数据库。
2018年,我们做了一个随机对照研究(RCT)。大家都知道,通过随机对照研究可以更好地探讨和证明因果关系。
我们把糖尿病病人随机分成两组,一组是高膳食纤维干预,一组是普通饮食干预。
高膳食纤维干预之后,获得了比对照更多的临床收益。因为是RCT,所以这种临床收益只能归因于它比对照多吃了30克左右的可发酵型膳食纤维。
我们再通过菌群移植,把同一个人干预前的菌群和干预后的菌群移植给无菌动物。然后看到干预前的菌群会引起无菌动物血糖异常、胰岛素抵抗,干预后就没有这样的作用。
这说明干预前的菌群有致病作用,干预后的菌群没有这个作用,甚至还有改善血糖代谢的作用。也就证明,菌群失调是和疾病有因果关系的,而通过高膳食纤维改变菌群结构以后,它和疾病的改善也有因果关系。
但我们不能停留在整个菌群和疾病的因果关系上,我们一定要深入到具体什么菌在这里承担了这种因果关系的机制。
Q4
哪些是维系健康离不了的核心微生物?
通过把普遍存在的优势菌的高质量基因组序列拼接的办法,我们发现在这100多个基因组,只有不到10%可以被高膳食纤维饮食促进生长并变成优势菌,能产生乙酸和丁酸。
另外有一组菌,它们主要携带一些能够产生吲哚、硫化氢和内毒素等产有害物质的基因,引起炎症等的基因。这些菌,它的数量是下降的。
我们可以看到,它们之间的生态学竞争形成了“你升我降”的一种关系。
可被高膳食纤维饮食选择性升高的这些菌,它们的丰度和多样性越高,病人在干预3个月后,他们的糖化血红蛋白就降得越低。
我们利用这样的关系,甚至可以进行临床效果预测。而且这样的关系,不单单是在小规模临床试验可以观察到,我们在200多人的临床试验也能够验证出来。
现在的关键问题是,我们用高膳食纤维饮食干预后发现的菌和菌之间的这种生态学关系、这种生态功能群,只在糖尿病会这样?而且只是在高膳食纤维干预的情况才会形成和出现这种生态学关系?这就是要看,它到底有没有普遍意义。
我们有一个假定,什么是重要的菌?重要的菌一定是在我们人类进化的过程中,长期和我们人类共存的,因为离了它你就不健康,你可能甚至都不能够传宗接代。它的重要性是所谓的essential(必需)。
如果是这样的话,这些菌就应该世世代代通过某种方式不断地往下传递,而这些菌相互之间不应该是随机的,应该存在着生态学的关系。这种生态学关系也应该是非常稳定的,不应该是稍微有风吹草动,就会破裂、变化。
按照这样的指导思想,我们就想看看什么样的菌,它们之间存在着颠扑不破的、非常稳定的生态学关系。
比如说,如果它们两个正相关,你不管怎么去折腾,它都是正相关;如果它们是负相关的话,你不管怎么折腾,它们两个只要在一起就是负相关。我们能不能找到这样的菌?
Q5
哪些菌存在颠扑不破的生态学关系?
这是最近几年做的,还没有发表但是预印本已经公开了,我给大家简单地介绍一下。
我们上次文章发表的两个临床试验里,第二个规模比较大的临床试验做了3个月的高膳食纤维干预,发现菌群发生变化,糖尿病的指标也有显著的改善。
在这个基础上,临床试验3个月结束后过了1年,我们把大部分病人请回来,又做了菌群和临床指标测定。所有的样本都对3个时间点做了深度测序,进行了高质量基因组的拼接。从所有的样本中,拼接出1845个高质量的基因组。
我们可以看到:吃高膳食纤维饮食的前3个月,菌群改变了;干预停止后过了1年,菌群就回去了;膳食纤维干预3个月,糖化血红蛋白降下来;停止干预1年后,糖化血红蛋白也反弹回去了。
由此说明,膳食纤维干预改变菌群是临床指标改善的原因,而不是临床指标改善的结果。
而且,通过这3个时间点菌和菌之间的关系,它们在如此剧烈的环境扰动的情况下,还能够保持生态学关系不变。这就说明它们不是一般的菌,有可能是长期共进化形成的,应该是比较重要的。
按照这样的假定,我们就把每个时间点都做了一个生态互作网络,用了477个基因组。这477个基因组在75%的样品里面都出现,属于普遍存在的优势菌。
477个基因组可以有11万种成对的组合,其中92%以上的组合没有生态学关系。这说明两个菌出现在人的肠道,绝大多数情况下没有生态学关系,甚至临时产生的生态学关系都没有,大家只是随机碰在一起了。
但是我们看到,有大概0.56%,大概五六百个组合,要么三个时间点,大家都是正相关,要么两个菌在三个时间点都是稳定的负相关,这就说明它们的关系不一般。
这些菌一共有多少,有141个。这141个菌,我们把生态网络关系画出来以后,你会发现其中50个构成一个生态功能群,剩下的构成另外一个生态功能群。它们相互之间是竞争关系,而同一个生态功能群的菌是合作关系。
这两个生态功能群,把它放在整个的生态网络里,你就会发现:
第一,它们相互之间的关系是非常稳定的。在3个时间点,外界如此剧烈扰动下,它都不会变化。
第二,在1800多个基因组中,占到了总基因组的数目实际上不到10%,但是它们之间、它们和其他成员之间形成的生态学关系占到了总量的85%。假如说你从这个生态网络把这141个菌去掉的话,整个生态网络就不成立了。
虽然还有1700多个菌,但它们相互之间几乎没有联系。说明我们找到的这两个生态功能群之间的生态学关系,不仅是最稳定的,也是最多的,它是整个生态网络的核心。
很有意思的是,如果看功能群1的基因组,基本上没有有害基因。比如说只有一个基因组有一个抗药性基因,只有两三个基因组有一个抗内噬或者毒力有关的基因。
功能群2的很多基因组都有抗药性基因、毒力因子基因,而且几乎所有抗药性基因、毒力因子基因的类型,在功能群2全部能看到。这说明从基因的角度,功能群1应该是有益的,功能群2应该是有害的。
而功能群1利用阿拉伯木聚糖、半纤维素、菊粉等等这些植物来源的膳食纤维碳水化合物的能力,相关基因是非常多的。同时它们产生乙酸和丁酸的能力很强,基因数目也很多。这些正好能够响应了高膳食纤维饮食。
你可以看到这两个功能群,在高膳食纤维的饮食干预下,一个升上来,另一个下去。去掉高膳食纤维饮食,功能群1下来,功能群2就上来了。
Q6
菌群基因组关联临床指标可否被复制?
这样的关系是只存在于我们做的糖尿病病人的数据集,还是别人做的糖尿病的数据集,已经发表的数据集里也有?
我们把别人已经发表的健康菌群、糖尿病菌群对照研究的宏基因组测序的原始数据拿来,看这141个基因组在他们的数据里边有没有?有的话,丰度是多少?
把这个数据提取出来之后,我们可以看到,无论是在健康对照,还是糖尿病病人,别人发表的数据里,这样的跷跷板结构实际上都是存在的。
我们再建一个机器学习分类模型的话,是可以去预报某个具体的样本是病人,还是健康人,准确率可以超过70%。
在其他的疾病有没有这种关系?我们选了冠状动脉粥样硬化、肝硬化和强直性脊柱炎。
第一,无论是健康对照还是病人,都有跷跷板关系的两个功能群;
第二,用141个菌的变量做的机器学习模型,都可区别健康和对照。
我们又做了帕金森病、精神分裂症、结肠癌、炎症性肠病、高血压病等多种疾病,都是病例对照研究,而且是来自澳大利亚、美国、荷兰和中国的不同民族、不同地域、不同实验室数据。
实际上是一样的,也就是说这141个菌,在他们的数据集都能找到相应的类似基因组,相互关系都是你升我降,形成两个功能群的互相竞争。而且,利用这些变量都能把病人和健康人区别开。
这个工作给我们一个启发,就是这样的关系不是偶然形成的。
而是在古人类高膳食纤维饮食的长期作用下选出来这两组菌,一组是有益的,适应高膳食纤维饮食;另一组是有害的,被有益菌给压制着。
我们的健康离不了这两组菌,一组是给我们提供膳食纤维产生的短链脂肪酸,对我们的免疫、代谢、营养等都有非常好的调节和支持作用。
另一组,虽然是有害菌,也是人类长期和它共同进化的。它在我们的肠道里,在有控制的条件下、在它不能随意泛滥的情况下,去训练和教育免疫系统。这一组有害菌是我们专门用来训练免疫系统的,我们也离不了。
这两组菌,必须是有益菌的生态功能群占优势,要压制着有害菌,否则可能就会引起各种各样的疾病。这个就是我们在基础理论方面的一个新认识和进展。
Q7
如何靶向基石生态功能群做转化应用?
这一组就是所谓的能够把有害菌压住的,能够被膳食纤维或者益生元扶持起来的菌,相当于森林里的大树,我们就把它俗称“大树细菌”。它也是基石物种,又是一个功能群,所以我们也把它叫做“基石生态功能群”。
这个功能群,以它为靶点,可以进行生态修复。
比如说,炎症性肠病(IBD)的病人。这个试验里边的病人,他的跷跷板结构都在,这意味着什么?你如果用益生元复合制剂把这一组菌扶持起来,另一组菌就会被压下去,疾病可能就会改善。
但是在另外一些IBD的病人,我们可以看到,两者之间的对抗关系几乎没有了。这个时候,吃膳食纤维把剩下的菌扶起来也没有用,这组有害菌也不会被压下去。
那么你怎么办?
你只能把这组菌分离出来,作为活菌药物(LBP)也就是益生菌药物,补充这组菌,再通过营养把它扶持起来并占生态优势,你才能够真正地恢复健康的菌群。
我们现在有一个产品拿到了美国FDA的试验新药批号(IND)。过去大家都是做添加剂、健康食品,这应该说是全球第一个FDA批准作为药物使用进行临床试验的复合益生元制剂,已经有多个Ⅱ期临床试验正在进行中。
最近我们也发现,这个制剂对于具有严重胃肠道症状的新冠后遗症有非常好的效果,其中一个病例研究已经发表。
我们现在正在准备做300人规模的Ⅲ期临床试验。
除了作为药物管理的益生元制剂,我们肯定还要把相应的基石生态功能群的菌分离出来,把它做成LBP,再加上可以支持它生长的益生元制剂,形成一个能够让肠道菌群恢复的生态干预措施。
最后,感谢所有的老师、同学和我们的合作者、资助机构。
谢谢大家!