查看原文
其他

对话生物计算:从基因大数据到精准医学

导 读

12月初,计算引领、健康前行——“科创中国”超算健康科技创新应用大会在广州隆重举行,其中,“生物医药计算”分论坛吸引了参会者广泛关注。近年来,高性能计算、大数据和人工智能成为推动精准医疗的新引擎,加速了基因表达、药物设计、靶点发现、精准诊断、数字医疗等精准生命科学技术的研发,赋能人类健康事业发展。让我们一起回顾一下分论坛有哪些精彩内容。


“生物医药计算”分论坛由国家超算广州中心陈志广副教授和张献伟副教授担任主持,论坛邀请多位来自高校、科研机构和企业的专家学者,共同探讨生物医药计算的新思路和新方法,以及超算、AI、大数据在基因表达、药物研发、精准医疗产业的创新应用。

生物计算新方法 攻克基因表达难题

生命科学的发展离不开计算的支撑,生物计算的新方法可以帮助研究人员更加高效地攻克医疗难题。

时间序列基因表达谱是解析相关复杂生物学过程的主要信息来源,而现有的聚类、DREM等方法对时序信息的解读能力依旧有限。国家蛋白质科学中心朱云平研究员做了分论坛开场报告,介绍了团队研发的新框架TSMiner,该框架利用时间序列表达谱建模,基于新型训练方法得到的结果模型鉴定出各时间点激活或抑制的转录因子(TFs),预测与以上TFs相互作用的通路,并构建时间特异性TF-pathway相互作用网络。将TSMiner应用到小鼠肝再生(LR)相关的时序RNA-seq数据中,鉴定结果揭示了包括细胞增殖、代谢、免疫反应在内的多个与LR时间动态相关的关键生物学过程。对比现有方法,TSMiner具有更高的灵敏度和准确性,能够提供高可信的预测并增进对快速积累的时序组学数据的理解,该框架目前已可以在“天河二号”上使用。

遗传相关是遗传学核心概念之一,用于衡量表型之间由基因决定的相关性,其本质是全基因组DNA变异的联合作用机制。为此大量学者花费十数年致力于全基因组关联分析(GWAS),归纳出海量与复杂性状或疾病相关的变异位点,然而现有遗传相关估计方法在应对海量高维低权重特征时存在局限性。中山大学生命科学学院沈侠教授介绍了一种基于GWAS概括统计量进行遗传相关估计的高精度似然函数(HDL)方法。该方法不仅极大地降低了计算量,且估计准确性有质的提高,基于“天河二号”测试发现,在对相同数据进行分析时,与现有方法相比减少了约60%的遗传相关估计值方差。实证表明该方法能有效挖掘概括统计量的潜藏信息,为人类复杂性状的遗传相关性提供更多有力的证据。


利用AI加速药物研发

随着人工智能技术发展,AI助力新药研发备受青睐,为相关研究领域带来新的突破。

蛋白质间相互作用(PPI)预测作为计算生物学两大核心问题之一,是从系统层次研究生物学过程的重要基础。对接方法是用于PPI预测的常用方法,受限于不全面的评分标准及灵活多变难以模拟的蛋白质结合过程,相关研究在预测精度上已到达瓶颈,而深度学习的引入带来了重大突破。华中科技大学物理学院黄胜友教授在报告中介绍了一种基于深度学习模型预测蛋白质间接触位置的方法,利用蛋白质序列、亲疏水性、对接矩阵、耦合信息等特征,预测同源蛋白复合物的接触位置,并利用预测的接触结果指导对接预测显著提升了成功率。黄教授提出的蛋白质分子对接算法和打分函数模型在被称为国际蛋白质相互作用预测的“奥林匹克竞赛”CAPRI中多次排名第一。

伴随着以机器学习、深度学习为核心的人工智能技术发展,相关技术在健康领域的融合与应用在业界逐步推进。广东省生物岛实验室陈红明研究员主要介绍了深度学习在药物研发中包括基于生成模型的全新药物设计、化合物性质预测、反应预测及虚拟筛选等四个方向上的进展,以及一系列典型应用实例。他在报告中还提到以上典型人工智能技术多为数据驱动型,而在药物研发中的数据成本高昂,实际可获得的数据量不多,如何应对小数据量仍是一个难题。最后他指出,目前药物开发的瓶颈还在于化学合成,把AI和机器人技术相结合以实现药物开发DMTA循环的自动化可以大大提高研发效率,将是未来药物研发行业的发展方向。


基因技术发展 推动精准医疗落地

除了为药物寻找“靶点”,计算模拟、人工智能和基因测序技术还运用到另一个重要的领域——个性化精准治疗。

宫颈癌是全世界女性第三大肿瘤,随着HPV疫苗的问世,越来越多人关注HPV感染的精准预防和治疗。中山大学附属第一医院胡争教授的报告介绍了借助超算在HPV研究领域取得的新进展,主要讨论了导致HPV和宫颈癌发生持续存在的关键因素、新兴的癌症干预新概念和技术,以及这些技术如何指导临床精准医学,为患者提供预测、预防和早期治疗。报告还分享了目前宫颈癌预防治疗的新进展,一是通过归纳HPV定点整合规律及整合机制,发现宫颈癌临床预警标志物,在宫颈癌早期筛查中对病人进行风险分层,力争做到精准预防;二是开发HPV感染及宫颈癌前病变靶向治疗手段,促进精准治疗。

长读长测序可以得到比短读长测序超过100倍以上长度的序列信息,在基因组组装、基因组结构变异检测、串联冲突检测、碱基修饰检测、全长转录组、宏基因组组装、直接RNA测序和快速病原检测等方面都具有显著优势,但是存在错误率高、成本高、通量不够、相关技术体系不够完善等问题,需要大量的技术开发和临床探索。北京希望组生物科技有限公司CEO汪德鹏在报告中主要介绍了三代测序技术的发展和遗传病分子诊断的挑战,希望组基于“天河二号”超级计算机,在三代测序错误模式的算法与软件开发方面做了大量的探索,致力于推进三代测序在精准诊断上的应用。







分论坛的专题讨论环节由中山大学孙逸仙纪念医院副研究员赵慧英主持,以“数据整合”为核心话题,从如何整合数据,整合过程中超算发挥的作用,再展望未来大数据驱动的生物医学研究和临床研究的发展,专家们各抒己见。专家们认为,当前数据整合应该以问题驱动为主,利用好粤港澳大湾区的优势,降低研究成果转化到临床的门槛,建立数据共享平台,推进产业化转化。数据整合过程中应关注法规与数据隐私性问题,需有公立第三方维护访问权限。

与会专家们认为,数据与计算应该结合协作而不是各自独立,期盼有真正意义上的大数据与高效处理技术相结合的大型平台,这也是超算中心应当承担的角色和未来发展的方向。当下技术变革周期缩短,专家们相信,未来医疗领域必将涌现更多创新突破。



热门文章推荐

保护地球环境,超算与您共同守护生态健康

科技赋能,推动智能健康产业创新

风雷宣布开源!“星光”+国产自主开源软件,助力CFD创新

超算— — NSCC-GZ — —撰稿:王莹、翁灵玲、卢慧中微信编辑:霍志昕初审:王栋审核:万园园核发布:李奈青

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存