Nature子刊|多癌症集成的图表示网络规约算法预测药物应答
The following article is from GenomicAI Author 米玉涛
癌症细胞的基因谱对基因变异提供了宝贵的信息。由于癌症复杂的作用机制,仅基于遗传信息预测药物治疗对特定的细胞系的影响是有问题的。
作者设计了将多种异质数据(包括生物网络,基因组学,抑制剂分析和基因疾病关联)整合到统一图结构的流程中。
开发了一种新颖的graph reduction algorithm的癌症特异性网络。该系统融合了拓扑信息、生物学知识,graph reduction 增加了特征熵,同时保留了有价值的图特征信息。癌症特异性数据的非欧几里得表示提高了机器学习的性能,以预测癌症对药物治疗的反应。
生物医学知识图谱的全网络分析
首先,所有的实例分享一样的图拓扑,仅仅在节点特征数据不同,比如基因表达,适应症关联,以及pIC50值,使机器学习模型难以收集有效学习所需的信息。第二,全图是非常稀疏的,浪费计算资源。第三,图中的大多数(98%)节点是无抑制数据的非激酶蛋白质,大多数蛋白质通常根据差异基因表达进行调节,导致重要特征显著稀疏。
基于特定癌症网络的缩减
作者开发了一种基于知识的边缘收缩算法,利用连通性和生物特征信息来满足以下条件:两个事件节点都需要是非激酶蛋白,共享相同的差异基因表达,并且在相同的生物过程聚类中。
最后一个条件非常重要,可以确保缩减只合并属于同一信号通路的节点,从而支持生物学知识。肿瘤特异性网络中的生物过程由聚类节点根据其基因本体(GO)术语的相似性确定。
对生物医学图谱的全网络和缩减网络分析
图缩减方法极大的增加了所有359个癌细胞系的图拓扑和特征的多样性,同时保留了每个图中的中重要信息和生物学知识。
知识图谱癌症药物应答预测方法效果比较
基于图的算法(缩减的数据建模)与其他两种基于矩阵的方法(全网络数据建模)比较,图算法得到了最好的效果。
数据地址
--------- End ---------
感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或
姓名-学校-职务/研究方向。
- 历史文章推荐 -
【产业进展】
●Drug Discov Today|赛诺菲:机器学习引导的早期小分子药物发现
●老药新用,AI制药公司BioXCel的Igalmi获FDA批准
●GSK和Cerebras的合作|高性能AI计算如何加速药物发现
●药物治疗方式的爆炸性增长:小分子药物、生物制剂以及介于两者之间的多种方式