查看原文
其他

西湖欧米完成数亿元Pre-A轮融资,打造蛋白质组学AlphaFold

智药邦 2022-06-15

The following article is from 高榕资本 Author 郭天南

2021年7月,DeepMind团队和欧洲生物信息研究所(EMBL-EBI)合作,发布由AlphaFold预测的蛋白结构数据库,完成了人类蛋白质组98.5%的蛋白质结构预测。这被认为是本世纪最重要的科学突破之一。
蛋白质是生命活动的齿轮,但只知道齿轮的形状还不能组装成一台可以运行的生命机器。我们还需要了解生命体中不同齿轮的类型和数量;更重要的,这些齿轮还在永不停歇地动态变化与相互作用着。这就是蛋白质组学想要去破译的密码。
2022年1月13日,西湖欧米(杭州)生物科技有限公司完成Pre-A轮数亿元融资,本轮融资由倚锋资本和老股东高瓴创投共同领投,幂方资本、老股东高榕资本和西湖科创投跟投。融资款将继续推进蛋白质谱驱动的体外辅助诊断(IVD)产品和AI制药产品的研发。
西湖欧米成立于2020年7月,致力于开发和应用以蛋白质谱为主的多组学技术,基于蛋白质组大数据,发现可定量的生物规律,助力精准医学和药物研发。

高榕资本对蛋白质组学领域知名专家——西湖大学生命科学学院特聘研究员、西湖实验室imarker Lab主任、西湖欧米创始人郭天南博士进行专访。 



大家一提到生命科学,可能会想到基因。基因是生命的蓝图,是一维的线性序列;基因通过转录组,表达为蛋白质,组成三维世界的生命体。
 
看过科幻小说《三体》会知道,在一维空间,似乎永远无法理解三维空间的复杂性。相比较基因,蛋白质的复杂性要高出许多维度。首先,一种基因可以表达成多种蛋白质;其次,蛋白质会像“变形金刚”一样不断在时空上发生变化;此外,蛋白质还有翻译后修饰,有复杂的复合物,蛋白质还在不断地生成和降解。
 
目前人类已经基本解锁基因组,但还没有任何科学家能够告诉我们,一个红细胞里有多少蛋白质。它的复杂程度比当今地球上人类的关系网更高。


与此同时,人类的健康和疾病同蛋白质息息相关,疾病治疗的效果也取决于蛋白质机器的调控。
 
大家还记得电影《我不是药神》中的神药“格列卫”。格列卫的适应症是慢性髓性白血病,原本是不治之症。十几年前,我在武汉协和医院血液科学习工作,当时格列卫刚刚进入中国,我记得非常清楚,一盒药30万。很多病人无法负担,医院的科室会买下来,一颗一颗地卖给病人。后来我们知道,这个药物的靶点就是一个融合蛋白,通过药物小分子去抑制融合蛋白,就可以控制疾病的发展。
 

未来我们希望让更多“不治之症”可以被治愈,必须建立在对蛋白质有更多认知的基础上。

 

我们致力研究的蛋白质组学,不仅要看蛋白质的结构。还要在此基础上,看到一个临床样品,一个肿瘤细胞中,到底有哪些蛋白质,每种蛋白质有多少数量,以及蛋白质动态变化的数据。这些数据对于药物发现、健康理解、疾病治疗都可能会产生颠覆性的作用。
 
今年的诺贝尔奖第一次颁发给气象学家,回答了为什么气候模型在天气多变且混乱的情况下依旧可靠的问题。

▲ 人类可以预测天气,为什么不能预测疾病的进展?▲ 物理学、化学、经济学中都有很多公式和规律可循,为什么蛋白质微观世界没有公式?▲ 新冠突如其来,为什么有些人是轻症、有些是重症?▲ 为什么某种靶向药,对于一部分肿瘤病人有效、另一部分无效,有些人开始有效、后来又出现了耐药性?

这些为什么,都是因为我们缺乏对于蛋白质机器的理解。我认为,这个不能理解的背后,是因为我们缺乏对蛋白质进行定量数据积累的过程,以及没有一个合适的算法。
 
我们希望尽可能收集关于蛋白质组的动态数据,利用AI技术去打造一个可以预测蛋白质动态变化的新型引擎。这个引擎的复杂程度要比AlphaFold复杂很多倍,也需要积累足够量的数据作为基础。
 
过往我们没有蛋白质组的数据,是因为没有合适的技术和工具。就像以前我们没有望远镜,看不到那么多星星;没有显微镜,看不到细胞的存在。
 

幸运的是,今天我们有了前沿蛋白质组技术,带领我们推开一扇新的大门。

 

近几年来,人们在质谱方面取得很大的进步,从一个全新的层面去检测蛋白。质谱技术是非常复杂的综合性工程,需要结合化学、物理学、生物学、数据分析等学科,也需要依赖非常昂贵的设备,并且设备还在经常更新,因此主要集中在高校或实验室里。
 
但进入临床之后,对蛋白质组的鉴定和定量成为一个全新的命题。因为临床样品和实验室中的动物样品相比更加复杂。
 
我们的技术基础是PCT-SWATH/DIA,它是压力循环技术、连续窗口采集所有理论碎片离子和数据独立采集的缩写。这是我曾在瑞士Ruedi Aebersold教授(蛋白质组学领域的开拓者之一)领导的蛋白质组学研究组开发的高通量蛋白质组技术,实现了对小量临床样本的高重复性、高通量的质谱分析,科研成果发表于Cell、Nature Medicine等杂志。
 
这种技术可以分析处理极其微量的组织,任何含有蛋白质的样品都可以进行有效的蛋白质组分析,包括血液、尿液、头发、指甲、骨骼、肠道微生物等;此外我们可以处理石蜡组织,因此临床大量的石蜡样品我们都可以去做鉴定,相当于打开了一个尘封的宝库。
 
实现这些目标的一个独特关键在于压力循环技术(Pressure Cycling Technology),可以利用多次常压和超高(液)压之间的快速循环,实现生物分子的精确提取。想象一下,将样品放在一个150微升的管子中,增加3000个大气压,然后释放压力,然后再施压,不断循环,从而将极其微量组织中的蛋白质有效提取出来。


另一方面,我们还在开发计算资源,以实现快速、低成本的蛋白质组大数据集的数据分析。西湖欧米团队还很年轻,但目前已经拥有了世界上领先的临床蛋白质组技术。目前全球范围内,我们分析过的临床样品和积累的蛋白质组数据,无论是从种类还是数量上看,应该是最多的之一。

在蛋白质组大数据基础上,我们也在结合领先的人工智能算法,去建立可以预测蛋白质组动态变化的智能引擎。目前没有任何已知的成熟人工智能算法,可以直接用于蛋白质组大数据的分析,因为这是一个新的数据类型,新的数据格式,也是新的科学问题。我们相信,中国的人工智能技术,无论在理论还是实践上,在全世界都是非常领先的,也有非常多优秀的AI人才。AlphaFold横空出世之后,也有很多AI人才希望进入生命科学领域,我认为这是非常好的势头。

 

有了上述数据和技术,我们希望未来可以真正助力精准医疗。
 
对于精准医疗的理解,有广义、狭义。总得来说主要是两个方面——诊断,尽可能实现疾病的早诊;治疗,用最合适的药物进行治疗。在这两个方向,西湖欧米已经有了阶段性的成果与尝试。
 
在诊断方面,我们首创的甲状腺结节良恶性诊断的AI赋能的蛋白质组LDT产品计划将于2022年第一季度问世。甲状腺结节非常常见,50%的成年人会有甲状腺结节。对于甲状腺结节的诊断不是问题,通过B超就可以看到;问题在于不知道结节的良恶性,目前有30%的甲状腺结节,通过细胞学穿刺的方式无法判断良恶性。
 
对于病人来说,是否切除?甲状腺是非常重要的器官,是连通大脑和全身其他器官的桥梁,有人把甲状腺比喻成公司的CEO,摘除甲状腺就需要终身服用激素药物。有人说用基因测序诊断,但基因测序敏感性虽高、特异性却差,特异性只有10%到50%,也就是说50%-90%的病例被诊断是恶性,实际上是良性。通过西湖欧米开发的诊断LDT产品,可以将结节良恶性诊断的准确率提升到90%左右。目前我们的产品正在多中心、多国家进行验证和优化。
 
这是蛋白质组结合AI技术在诊断上非常好的应用,也是全世界范围内第一次做如此大量、多中心的蛋白质组数据,目前已经收集了超过3000例样品的蛋白组学分析数据。除了甲状腺癌,未来我们还将进一步推动包括甲状腺癌、前列腺癌、乳腺癌、直肠癌在内的多项体外辅助诊断产品研发及上市。
 
另一个诊断方面的应用,是进行糖尿病、高血压这类慢性病的早期诊断。慢性病的发生,是一个综合复杂的过程,有基因的因素,也受环境、生活习惯的影响。我们有一个研究队列,对糖尿病、高血压的慢性病人进行十几年的追踪,每隔一段时间收集血液、尿液等样品,对其中的蛋白质组进行分析,从而开发出多模态的模型,预测哪些人是高风险人群。
 
过往我们对于疾病的诊断,一般是静态的;但实际上,所有疾病都是动态的,每天的情况都在发生变化。除了观察病人的体温、红细胞与白细胞数量等信息,我们相信在这些症状出现之前,在微观世界一定发生了很多的变化。目前我们正在与多家医院合作,建立辅助精准医疗平台,希望通过对病人从入院到治疗、康复、出院一系列过程中蛋白质组的监测,对疾病进行更细致、更底层的监控。


在治疗方面,也有实际的案例。我们知道,几乎所有药物都是针对靶点蛋白质来设计的;还有个别尽管不是直接针对蛋白质,也通过蛋白质起作用。因此药物成功,离不开对蛋白质的检测。蛋白质组数据应用于药物研发,也是近一两年才真正在实际场景中应用。
 
我们有一个项目,是进行卵巢癌的临床治疗。卵巢癌是非常恶性的一种女性疾病,在实际临床中,我们会发现某种药物对于有些病人的疗效很显著,但有些病患则对药物抵抗。我们与几家医院合作开发了模型,去预测药物会对哪些患者更有效。
 

未来,我们会在AI制药领域有更多的布局,让新药研发人员,可以使用以前不敢想象或者太过昂贵的蛋白质组分析结果。

 

蛋白质组学很多人想去做,但是为什么难?
 
因为涉及的学科太多,涉及化学、物理、生物、医学、人工智能、药物研发等领域。这些学科一定要融合,而不只是把油和水放在一起。
 
这就要求团队的带头人,一定要懂得各个学科的知识。我本身是学医,后来掌握了质谱的运行原理及实操,也写过程序,也学习过机器学习的基本概念。所以我在团队中很大的作用是做翻译。
 
有时候同样一个单词,在不同学科人的理解中是不一样的。我要用不同的语言去切换,让不同学科团队的人可以协作。所谓语言就是一个学科的术语,包括理论框架和实践细节。


当然,仅仅依靠一个人去说多种语言是不够的,我们也希望能够培养一批这样的人才。目前,西湖欧米已组建一支近80人的团队,覆盖生物技术、人工智能和药物研发等领域。
 
未来,我无比期待,邀请更多跨学科的人才加入我们,一起解密生命的密码。

西湖欧米

西湖欧米成立于2020年7月,致力于开发和应用以蛋白质谱为主的多组学技术,助力人类健康事业。目前,公司已组建一支拥有交叉学科背景的专业团队,其中囊括生物技术、人工智能和药物研发等领域的高精尖人才。同时,西湖欧米已拥有多项专利技术,成立全资子公司杭州欧米医学检验实验室有限公司及杭州欧米智造生物技术有限公司,与Sciex、Thermo Fisher、Bruker等质谱厂家签署战略合作备忘录,成为Pressure BioSciences Inc 在中国的独家代理和服务商。西湖欧米已与海内外70多家顶尖医院、科研单位、药厂构建密切合作关系,荣登2021年Venture 50 新芽榜单,入选量子位生物计算类2021年度企业,荣获“浙江省中小科技企业”称号。


--------- End ---------




感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或

姓名-学校-职务/研究方向




- 历史文章推荐 -

西湖欧米

郭天南|人工智能+蛋白质组学:药物研发的生物学底层变革

AlphaFold

迈入世界领先梯队!天壤自研蛋白质结构预测平台 TRFold,单张 GPU 16 秒实现精准预测

对标AlphaFold2!深势科技发布Uni-Fold蛋白结构预测工具,并开源训练代码

Nature|人工智能助力蛋白质折叠预测

Science|AI揭示了蛋白质复合物的结构

●BioRxiv|利用AlphaFold-Multitimer进行蛋白质复合物预测

●谷歌母公司推出AI驱动的药物发现初创公司Isomorphic Labs

Nat Rev Drug Discov|AlphaFold对药物发现意味着什么?

●Nature社论|结构生物学中的人工智能将会继续


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存