查看原文
其他

医药研发领域大数据和人工智能的应用探讨

孙翔宇 火石创造 2019-04-08

声明:本文为火石创造原创文章,欢迎个人转发分享,网站、公众号等转载需经授权。



人工智能(AI)技术应用的重要场景之一是助力药物研发,相比传统的药物研发耗时耗力、成功率低,AI技术的应用可大大缩短药物研发时间、提高研发效率并控制研发成本。

近年来,人工智能技术(AI)与医疗健康领域的融合不断加深。AI在医疗领域主要应用场景包括语音录入病历、医疗影像辅助诊断、药物研发、医疗机器人和个人健康大数据的智能分析等。随着语音交互、文本识别、图像识别和大数据分析,以及智能终端等技术的逐渐成熟,AI的应用场景越发多样。


图1  人工智能在医疗领域的应用


药物研发是AI技术应用的重要场景之一。药物研发要经历靶点的发现与验证、先导化合物的发现与优化、候选化合物的挑选及开发和临床研究等多个阶段。传统的药物研发耗时耗力,且成功率低。AI助力药物研发,可大大缩短药物研发时间、提高研发效率并控制研发成本。


图2  新药开发流程图

 

一、AI助力新药研发的六大应用场景


目前制药企业纷纷布局AI领域,主要应用在新药发现和临床试验阶段,主要有以下六大应用场景:


1.海量文献信息分析整合


对于药物研发工作者来说,最让他们头疼的事如何去甄别每天产生的海量科研信息。而人工智能技术恰恰可以从这些散乱无章的海量信息中提取出能够推动药物研发的知识,提出新的可以被验证的假说,从而加速药物研发的过程。


英国生物科技公司Benevolent Bio(隶属于 Benevolent AI),利用技术平台JACS(Judgment Augmented Cognition System),从全球范围内海量的学术论文、专利、临床试验结果、患者记录等数据中,提取出有用的信息,发现新药研发的蛛丝马迹。


2017年,借助JACS的分析能力,Benevolent Bio 标记了100个可用于治疗肌萎缩性侧索硬化症(ALS)的潜在化合物,从中筛选出5个化合物。经过英国谢菲尔德神经转化研究所的小鼠试验,证实4个化合物在治愈运动神经衰退方面确有疗效。4/5的有效筛选率,这是研究人员之前从未想过的。


位于英国伦敦的BenevolentAI成立于2013年,是一家致力于AI技术开发和应用的公司,是欧洲大的AI初创公司。他们的目标是建立人们期盼已久的“制药企业2.0”,利用AI助力新药开发,降低临床试验的失败率。自2013年以来,Benevolent AI已经开发出24个候选药物,且已经有药物进入临床IIb期试验阶段。


国际制药巨头之一的强生公司已经与Benevolent AI达成合作协议,强生将一些已经进入临床阶段的试验药物连带一起特许给Benevolent AI,而Benevolent AI将利用人工智能系统来指导临床试验的进行和数据的收集。


2.化合物高通量筛选


化合物筛选,是指通过规范化的实验手段,从大量化合物或者新化合物中选择对某一特定作用靶点具有较高活性的化合物的过程。而要从数以万计的化合物分子中筛选出符合活性指标的化合物,往往需要较长的时间和成本。


AI 技术可以通过对现有化合物数据库信息的整合和数据提取、机器学习,提取大量化合物与毒性、有效性的关键信息,既避免了盲人摸象般的试错路径,还可以大幅提高筛选的成功率。


典型代表是硅谷公司Atomwise。Atomwise公司成立于2012年,其核心产品为AtomNet是一种基于深度学习神经网络的虚拟药物发现平台。AtomNet就像一位人类化学家,使用强大的深度学习算法和计算能力,来分析数以百万计的潜在新药数据。目前,AtomNet已经学会识别重要的化学基团,如氢键、芳香度和单键碳,同时该系统可以分析化合物的构效关系,识别医药化学中的基础模块,用于新药发现和评估新药风险。


图2  AtomNet通过训练能够识别抗生素中常见的化合物结构——磺酰基

 

AtomNet在抗肿瘤药物、神经系统疾病药物、抗病毒药物、抗寄生虫药和抗生素药物的药物筛选方面表现出色。例如,2015年AtomNet仅用一周模拟出2种有潜力用于埃博拉病毒治疗的化合物。Atomwise正与全球知名药企和大学院校进行合作,其中包括辉瑞、默克、abbvie和哈佛大学等。


类似于Atomwise ,现在有一系列人工智能公司专注于药物分子筛选,包括Recursion Pharmaceuticals、BenevolentAI、TwoXAR、Cyclica和Reverie Labs等。


3.发掘药物靶点


现代新药研究与开发的关键是寻找、确定和制备药物靶点。靶点是指药物在体内的作用结合位点,包括基因位点、受体、酶、离子通道和核酸等生物大分子。


典型代表是Exscientia公司,Exscientia与葛兰素史克(GSK)在药物研发达成战略合作。Exscientia 通过AI药物研发平台为GSK的10个疾病靶点开发创新小分子药物。


Exscientia开发的AI系统可以从每个设计周期里的现有数据资源中学习,其原理与人类的学习方式相似,但AI在识别多种微妙变化以平衡药效、选择性和药代动力学方面要更加高效。其AI系统完成新药候选的时间和资金成本只需传统方法的1/4。目前该公司与国际多家知名药企形成战略合作,包括强生、默克和赛诺菲等。


图3  Exscientia 药物研发流程图示

 

4.预测药物分子动力学指标(ADMET)


ADMET包括药物的吸收、分配、代谢、排泄和毒性。预测ADMET是当代药物设计和药物筛选中十分重要的方法。过去药物ADMET性质研究以体外研究技术与计算机模拟等方法相结合,研究药物在生物体内的动力学表现。目前市场中有数十种计算机模拟软件,包括ADMET Predicator、MOE、Discovery Studio和Shrodinger等。该类软件现已在国内外的药品监管部门、制药企业和研究院所得到了广泛应用。


典型的代表包括晶泰科技(XtalPi)、Numerate等。为了进一步提升ADMET性质预测的准确度,已有生物科技企业探索通过深度神经网络算法有效提取结构特征,加速药物的早期发现和筛选过程。其中晶泰科技通过应用人工智能高效地动态配置药物晶型,能完整预测一个小分子药物的所有可能的晶型,大大缩短晶型开发周期,更有效地挑选出合适的药物晶型,减少成本。


图4  晶泰科技提供的晶型筛选服务


5.病理生物学研究


病理生物学(pathophysiology)是一门研究疾病发生、发展、转归的规律和机制的科学。病理生物学研究是医药研发的基础,至今许多疾病尚无治疗方法,是由于在病理生物学研究方面没有取得进展。


肌萎缩侧索硬化(ALS)是一种破坏性的神经退行性疾病,发病机制至今不明。ALS的一个突出病理特征是,一些RNA结合蛋白(RNA binding proteins, RBPs)在ALS中发生突变或异常表达/分布。人类基因组中至少有1 542种RBPs,目前已发现17种RBPs与ALS相关,除此以外,其他RBPs是否与ALS相关呢?


图6  IBM Watson鉴定RBPs


典型案例是IBM公司开发的Watson系统,通过阅读了2 500万篇文献摘要,100万篇完整论文和400万专利文献,并基于相关文献的大量学习,建立了模型预测RBPsALS相关性。有研究者为了测试其模型的预测能力,首先将IBM Watson的知识库限制在2013年之前的学术出版物上,并要求Watson使用这些可用的信息来预测与ALS相关的其他RBPs。在2013—2017年期间,Watson4个导致突变的RBPs给出了高度评价,证明了模型的有效性。而后,Watson对基因组中所有的RBPs进行筛选,并成功鉴定在ALS中改变的5种新型RBPs


6.发掘药物新适应症


利用深入学习技术,将临床药物与新的适应症相匹配。这样可以绕过动物实验和安全性实验。


例如,沙利度胺曾用来治疗麻风病,后来研究人员发现其对多发性骨髓瘤具有疗效。由于该药物已经积累了大量的安全性与剂量数据,研究人员能够绕过第一阶段的安全性和剂量试验。


根据实验结果,FDA在2012年批准沙利度胺治疗多发性骨髓瘤。据彭博预测,这个过程总共花费了4 000~8 000 万美元。如果从零开始,一个新药所需的平均费用为20 亿美元。


图7  药物再利用与新药研发的成本对比


典型代表为Lam Therapeutics、NuMedii、Healx和Insilico Medicine等人工智能公司,他们已经在“老药新用”这个领域进行了深度探索。


二、AI新药研发公司


中国在AI领域的论文发表数量位居全球第一。在医学领域,我们在放射影像、病理、自然语言处理和智能语音录入等领域的研究与欧美并驾齐驱,但在AI+新药研发领域,却差距较大。部分AI新药研发公司名单见表1。


表1 部分人工智能药物研发公司名单


2014年,晶泰科技创立于麻省理工学院校园。其核心总部位于深圳,并在北京、波士顿设有分部。晶泰科技目前已与多家世界顶级药企与科研机构建立深度合作,其药物固相筛选与设计平台是行业最先进的解决方案。凭借团队的技术优势与项目广阔的市场空间,晶泰科技已获得腾讯、真格基金、峰瑞资本数千万元的A轮投资,以及来自红杉、Google、腾讯的数千万美金B轮融资,成为全球AI+制药领域获得融资最高的创业公司之一。


2018年12月,天津国际生物医药联合研究院与北京天云大数据签署战略合作协议,双方将在人工智能医药研发平台建设领域联手,为京津冀乃至全国提供服务。根据协议,双方将共同建设人工智能医药研发平台,立足京津地区,为药物研发等大健康行业创新发展赋能,致力于人工智能与大数据技术在医药行业内的推广和应用。同时,双方各自发挥优势,共同开展人工智能医药研发平台的推广工作,推动建立京津冀医药智能技术创新联盟。


三、AI药物研发领域的关键要素


中国在AI药物开发领域已经开始起步,但远未成熟,还有非常大发展空间。在笔者看来,我国进行AI药物研发需要在人才培养、数据共享和商业模式创新等方面进行发力。


1.培养高端人工智能人才,探索跨学科人才合作机制。

创业的竞争归根结底是人才的竞争,这在人工智能领域表现得愈加明显。在全球范围内,大约有2.2万名具有博士以上学历的人工智能从业人员和研究人员,中国仅600名左右。国内人工智能人才几乎被几大头部企业垄断,比如商汤有150多名人工智能博士,占比全国人工智能博士总数1/4。


数据显示,未来中国人工智能人才缺口高达500万,唯一的解决办法就是成体系地培养人工智能人才。


2018华为全联接大会上,华为云推出了“沃土AI开发者计划”,投入10亿人民币培养高校和研究所的AI人才,并与清华大学、中科院、中国科学技术大学、浙江大学等达成AI合作。


2018年8月,商汤科技携手香港中文大学、亚马逊、南洋理工大学、悉尼大学联合举办的首届WIDER Face and Pedestrian Challenge 2018(简称:WIDER Challenge)挑战赛,包括中科院计算所、微软亚洲研究院、北京大学、卡耐基梅隆大学、香港大学以及雅虎、京东、旷视、科大讯飞、滴滴等科技公司参赛。


此外,AI应用于药物研发需要若干个垂直领域的专家共同参与才能有所突破。既需要物理学家、化学专家、药物学家、药企研发高管,又需要人工智能科学家、云计算工程师等跨学科人才。通过在多个领域人才和经验的积累,整个团队需要紧密合作,这样才更容易获得突破性的思路和好的成果。

点击下滑查看更多内容


2.建立研发数据标准体系,完善数据共享机制。


AI药物研发需要高质量数据支持。国内创新药研发起步较晚,与国外相比,对于优质数据的积累还有一定差距。


制药产业的专业门槛高、链条长,加之国内长期以来的“多头管理”体制,造成了国内的药品数据极度割裂,标准不统一、数据孤岛现象严重;另外,医药领域的监管政策与机构改革频繁,造成历史药品数据衔接难度较大。这些都会导致医药数据统计在完整度和精准度上的不足,从而影响相关决策。


当前国内企业“大数据化”采取的一个路径,便是以“专业人工+机器辅助”方式建立数据标准词典(包括药品、企业、靶点、疾病等),持续进行数据清洗、识别、匹配和挖掘算法,将市场上分散的数据全面重构,形成一系统标准数据模块仓库,根据用户场景对数据模块进行组合。比如国内的医药魔方、米内数据、药渡等医药大数据服务公司。


3.定位产业链角色,创新商业模式。


目前人工智能医药研发领域存在三种商业模式:


(1)开放和反馈模式。晶泰科技一开始就明确了初期主要客户群,在地域设置上形成国内研发,国际业务拓展的模式。在有效控制研发成本的同时,起步阶段就努力在国际范围内寻求合作者。


基于药物研发流程的复杂性,人工智能在药物研发中的大规模应用依赖于整个产业链的共同努力。晶泰科技主导开放和反馈模式,其长处是为传统研发人员提供最先进的计算软硬件工具,帮助他们更好更快地完成科研任务。


(2)虚拟筛选团队外包验证模式。虚拟筛选团队外包的主要方式有是与利益相关者或非利益相关者合作。


与入利益相关者合作,比如一个更大的医药公司,公司将受益颇多,比如激励一致、与已有临床生产线的整合、致力于特定疾病团队带来的专业知识等。虽然公司需要割舍部分控制力或所有权, 但是有利于项目研发成功率的提升。


与非利益相关者合作(例如CRO),公司保留完全的知识产权,执行速度快但是成本高。而且在实验设计上有可能面对控制权的损失,所以为了保证高质量的结果必须给予特殊的关注。


这个模式的好处是成本低,速度快,特别是工业界的合作伙伴在新化合物后期验证和临床研发中具有巨大机会。合作伙伴能够理解这些验证实验的动机和设计是至关重要的,因为他们在后续的临床研发中充当重要角色。Nimbus Therapeutics,TwoXAR,Atomwise等公司就采用这种模式。


(3)独立的药物研发团队和虚拟筛选团队的合作模式。在这个模式中,公司团队专注于计算机虚拟筛选,而其他团队给予实验药物研发的支持。和通常专注于特定的配体\受体、生物现象或者疾病领域的团队的良好合作,使项目研发团队有独特的专业性。


虽然配合程度没有一个完全整合团队那么强,但这种模式的优势在于,提供的处理结构的可变性和合作者的可选择性。具有广泛应用平台的虚拟筛选团队可以考虑用这个结构,在使资本成本最小化的同时处理很多研发项目。

点击下滑查看更多内容


四、小结


1.新药研发存在环节多、研发费用高、研发周期长和研发成功率低等问题


新药研发从上游到下游的几个环节包括药物靶标的确定,先导化合物的筛选,先导化合物的优化和最终的临床实验。研发费用高、研发周期长、研发成功率低一直是压在制药企业身上的“三座大山”。


塔夫茨药物开发研究中心(Tufts Center for The Study of DrugDevelopment)的数据显示:开发一种新药的平均成本为 26 亿美元;一种新药上市的平均时间约为12 年;大约只有 10% 的候选药物能从第一阶段测试走向市场。德勤的数据显示:2017 年,美国最大的生物制药公司的投资回报率下降至3.2%。


2.AI技术的崛起,为新药研发带来了新方向。


过去 20 年,计算机处理能力的持续快速增长,大量数据集的可用性和先进算法的开发,大大推动了机器学习的发展。新药研发领域数据密集,这让人工智能有了用武之地。AI 不仅能够挖掘出不易被发现的隐性关系,构建药物、疾病和基因之间的深层次关系。同时,可对候选化合物进行虚拟筛选,更快地筛选出具有较高活性的化合物,为后期临床试验做准备。


目前,AI 在新药研发领域主要应用于靶点发现、化合物合成、化合物筛选、晶型预测、患者招募、优化临床试验设计和药物适应症开拓等场景。来自 Tech Emergence 的一份报告研究了所有行业的人工智能应用,结果表明:人工智能可以将新药研发的成功率从 12%提高到 14%,可以为生物制药行业节省数十亿美元。


自2017年以来,AI在制药领域的应用可谓如火如荼,国际制药巨头纷纷入局AI开发,用于提高新药的研发效率。据统计,有100 多家初创企业在探索用 AI 发现药物,传统的大型制药企业更倾向于与采用合作的方式,如阿斯利康与 Berg,强生与 Benevolent AI,默沙东与 Atomwise,武田制药与 Numerate,赛诺菲和葛兰素史克与 Exscientia,辉瑞与 IBM Watson 等。同时,AI应用于新药研发仍需面对人才短缺、数据标准化与共享机制、商业模式创新等诸多问题。


在制药和生命科学中,数据是AI的关键。AI被应用于药物研发的各个阶段,但若是数据质量不高,即便使用非常可靠的算法,也不会取得好结果,反而会浪费大量的资源和时间。鉴于此,IBM 曾在2016年斥资26亿美元收购医疗数据公司Truven;罗氏曾在2018年以19亿美金收购肿瘤大数据公司Flatiron Health的全部股份。也有专家表示,通过知识共享开展合作和提高已有数据的质量比积累数据更为重要,关键是建立一套切实可行的数据标准,与风险利益共担的数据分享机制。


3.AI和药物开发的模式,主要包括AI研发外包、企业内部组建AI研发部门,但每种模式都有各自的优缺点。


AI研发外包。由制药公司提供特定的研究数据和生物靶点信息,然后由AI驱动的药物发现初创公司依靠这些数据建立模型。一旦成功筛选出候选药物,制药公司会根据协议进行授权或自行拥有这种药物。这种策略灵活性高且成本较低,但AI公司做为服务方需要获取制药公司整个药物开发流程中最“隐私”的情报,因此,选择合适的合作伙伴是重中之重。


在企业内部组建AI研发部门。在与外部积极合作的同时,制药公司也在培养内部AI专业技能,并建立数字基础设施,以提高数据使用效率。这种方式的挑战在于如何建立内部专业的AI算法和自动化流程,以及高效的运算平台。


无论哪种模式,AI和药物开发的结合,与其说是对IT技术人员的挑战,不如说更是对药学人员的挑战。一个运营良好的AI药物发现团队,应该是能够让IT技术人员和药学科学家保持沟通无障碍,彼此交流更明晰,清楚对方的意图。


(责任编辑:老姜)


—END—

文 | 孙翔宇

微信 | huoshi201523

添加时请注明:姓名-公司-职位

欢迎个人转发分享,网站、公众号等转载请联系授权

投稿请发邮件至jiangaq@hsmap.com

Audio

音频版


【 扫码聆听 】


点击文末“阅读原文”,提前观看大健康产业大脑视频,了解更多产业创新解决方案。(温馨提示:请在WiFi环境下观看。)


【往期回顾】


觉得好看,请点这里 ↓↓↓

文章已于修改

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存