查看原文
其他

鲁兴华:机器学习与肿瘤精准医学大数据 | 大咖论健54期

2017-09-27 芒果 基因慧Pro



基因慧

GeneClub

基因大数据 · 医学人工智能

新媒体/行业研究/FA咨询


关键词:  生物医学大数据   人工智能

共2317字  建议用时5分钟




访者 | 鲁兴华

采访 | Liang

责编 | 芒果

校对 | shirley





生物医学、精准医疗、人工智能的跨界


Part 1. 


【基因慧】鲁教授,您好,很高兴您抽出宝贵时间接受此次采访,也非常感谢南京医科大学戴一凡教授和誉衡基因的引荐。  您作为美国匹兹堡大学的生物医学信息系终身教授,横跨生物医学大数据、癌症精准医疗和人工智能方面的研究。您当时怀着怎样的初心进入这样一个跨界的领域?请您向基因慧读者和国内同行介绍下您的科研和工作经历。

    

【鲁教授】谢谢!我从1984年开始在山东省做了7年的内科和急诊科医生,后来为了在基础医学方面做更深的造诣,去了康涅狄克大学攻读博士并在匹兹堡大学做药理学博士后研究。我在读国内读硕士研究生时开始接触计算机起,一直起对计算机很感兴趣。博士毕业后,刚好人类基因组计划完成,让我更加感受到生物医学和大数据结合的趋势和潜能,于是我在匹兹堡大学继续读了生物信息学的博士后。最近几年主要研究方向是开发机器学习和生物医学信息学方法,应用到生物医学大数据和精准医疗,以癌症精准医疗为主。我曾主持了数个国家(NIH)和宾夕法尼亚州自主的科研项目,还有国立国家大数据中心(Center forCausal Discovery)的癌症研究课题组。癌症是一个复杂的疾病,每个肿瘤往往拥有多个驱动基因和复杂的信号传导通路异常, 通过人工智能(机器学习)方法来研究癌症大数据并理解癌症的发病机制是非常必要的,也是一条必由之路。我们通过对肿瘤大数据进行因果分析,寻找每一个肿瘤特异性的致病基因和信号传导通路。我们的研究覆盖较广的领域,从discovery(理论发现)到therapy(临床治疗)。以前常讲的是从大数据到知识(big data to knowledge,BD2K),现在应该开始讲是到从大数据到病床(big data to bedside,BD2B)。期望我们的研究能在三到五年内为临床肿瘤医生建立辅助决策系统。由于癌症数据量很大,我认为人工智能辅助癌症治疗是可行的,而且是必须的。


主持癌症研究课题的成果和发现


Part 2. 



【基因慧】您曾主持国立国家大数据中心的癌症研究课题,开发出算法来识别个体肿瘤的新的致病基因和癌症信号传导通路,可否分享其中的主要成果和发现?

    

【鲁教授】匹兹堡大学和卡耐基梅隆大学有很久的将人工智能方法应用于医学研究的历史。匹兹堡地区集中了几位世界顶尖的因果分析方法学的专家,例如Clark Glymor和Gregory Cooper博士。 因果分析是科学研究中最重要的问题之一。由Dr.GregoryCooper的带领下,我们的团队申请到了NIH国立大数据中心的资助(约1200万美元)。其中有一个分团队着重用因果分析方法研究癌症发病机制和信号传导通路。我们在这些方面取得了一些重要的进展。比如说,我们用因果分析的方法发现P53信号协同其他几个蛋白来发挥作用[1],从而提出一些治疗p53突变的策略。我们也开发了新算法去寻找每一个肿瘤的致病基因,并确定它们所影响的信号通路。我们认为这些研究可能会显著地促进癌症的基础研究和指导临床。



生物医学中真正落地的大数据应用


Part 3. 



【基因慧】那么在应用这些生物医学大数据时,您认为目前可以真正落地应用的大数据有哪些呢?

    

【鲁教授】从数据类型上,转录组、蛋白组和代谢组和生命活动联系更密切相关。但现有的蛋白组数据采集和分析方法离广泛临床应用还有一段距离。其他一些组学,比如表观基因组,也是通过调节转录组而起作用的。因为基因表达是受细胞内的信号通路控制的,转录组数据较接近地反影细胞的信号传导系统的状态,所以它们可能在将来精准医疗中有较大的作用。比如说,在某些细胞里,一个有靶向药物的蛋白质可能在没有突变情况下被其他通路异常地激活,这种情况应该是良好精准治疗机会,但传统的基因标志并不难探测到这种状况。我们的经验是转录组数据含有比较丰富的信息。比如说,我们最近结合转录组数据和深度学习的方法去推测近千个细胞株对上百种抗癌药物的敏感性,其结果胜过单独用基因组来推断的结果。



(左:鲁兴华教授;右:基因慧汪亮)



人工智能在新药研发的应用


Part 4. 



【基因慧】您另一个研究课题是结合药理学和机器学习来评估癌细胞株和PDX的药物反应。目前人工智能、药物研发和基因大数据逐渐融合,包括Berg、AtomeWise等公司利用AI模型药物研发中化合物虚拟筛选等。您怎么看待这方面的人工智能应用呢?谢谢!


    

【鲁教授】人工智能应用到新药研发是可能的,但目前我们还没深入研究。比如说,当一位科学家用我们开发算法找到肿瘤致病基因(又称驱动基因)后,她可以用现有的一套比较完整的结构化学计算方法来搜索影响相应蛋白的小分子,设计衍生物等等。这方面的成套平台的建设还有待开发,这个方向还是有前景的。



无监督学习在临床上的应用


Part 5. 



【基因慧】目前大多数机器学习是监督学习,对于无监督学习的,比如遗传算法,您怎么看待它的应用?


    

【鲁教授】非监督学习在研究癌症和其他疾病中有重要的作用。 人工智能的本质是解决“what to do next”:。也就是:利用现有的信息决定当前自己处于什么状态并依此决定下一步该采取什么行动。 无论是无人驾驶汽车还是下棋,都是要解决同样的问题。 AlphaGo之所以能够赢,是因为它能准确地分析出棋盘现在的状态,然后通过运算来推算各种行动预期状态,然后权衡各种行动的利弊再做决策。其实我们说治疗癌症和下棋有类似之处,医生(或计算机)应该根据癌细胞内信号通路的状态来决定用药,目标是使癌细胞内的状态尽量恢复或接近正常。如果有足够的数据,计算机应该能学会这种决策。难处在于我们不知道癌细胞内的状态,这就需要用各种非监督学习的方法根据观测到的数据(例如转录组数据)来推测细胞的状态;然后学习在每一个特定的状态下,每一个行动(药物)会导致什么样的状态变化;然后决定最佳行动。所以说,非监督学习在研究生物学和疾病过程中有重要的作用。



从基因组学数据到多组学数据


Part 6. 



【基因慧】在目前的生物医学大数据,特别是基因大数据,一般是单基因角度研究为主,但是对于复杂疾病、肿瘤等是多基因疾病,从单基因到多基因的研究,从基因组学数据到多组学数据(包括免疫数据,比如您作为顾问的誉衡基因启动10000例免疫精准诊断计划),您怎么看待这两个维度的拓展?


    

【鲁教授】目前癌症往往是按发病部位分类,而没有按照发病机制(例如按肿瘤的致病基因和异常信号通路)进行分类。正确理解每个肿瘤的发病机制,尤其是多个异常信号通路的组合可能会对联合治疗(combination therapy)有指导作用。根据这个假设我们正在做相关的研究,希望有更多的机会和同道们合作。


很高兴誉衡基因准备做10000例免疫计划,第一次听到一个初创公司能做这样一个大规模的免疫计划时,很欣慰。结合免疫大数据和因果分析能够帮助我们理解肿瘤逃逸免疫监测的机制,以及预测免疫抑制剂疗效。同时结合基因大数据,病人随访数据和免疫组库等数据,科学家们应该能够建立较复杂的数据模型用于指导精准免疫治疗。我个人认为AI技术的发展已达到对临床有指导价值的程度,但数据匮乏是瓶颈。 相信誉衡基因会把握好这个契机,好好设计,认真实施,收集一套完整的有关癌症免疫的大数据。这些数据本身会有很高的价值。我期待能和他们更多合作和碰撞。



您可能还会感兴趣的



 北京基因组所方向东教授

 复旦大学附属儿科医院黄国英院长

 哈佛医学院沈亦平谈精准医学与大数据

 魏于全院士:生物治疗为癌症治疗带来希望



数字健康行业信息数据库


www.yourmap.net.cn 

扫码限时免注册试用


行业编辑/市场/BD/运营

info@genonet.cn

400-088-7466





点击“阅读原文",查看更多行业资讯。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存