查看原文
其他

Anton3问世|分子动力学模拟的新一代“屠龙宝刀“

智药邦 2022-06-15

The following article is from GoDesign Author PKUMDL

—— 背景 ——

分子动力学(MD)模拟是研究蛋白质、DNA等生物大分子动态行为的有力工具。它能够通过模拟生物大分子在三维空间的运动状态,在生物分子发挥生理功能的作用机制,小分子与潜在靶点的识别等科学问题上提供帮助。然而,受限于目前的计算能力限制,目前主流硬件通常在数十万个原子、数百纳秒的尺度内进行MD模拟。若需要在更大的时空尺度考察生物大分子动态行为,则需要依赖高算力的超级计算机或云计算平台。在这一方面,来自纽约的D. E. Shaw Research公司多年来一直致力于开发专用于MD模拟的超级计算机,名为Anton系列。其分别于2008年和2013年推出的Anton和Anton 2处理长时间MD模拟任务的性能比当时先行最优的硬件还要高2-3个数量级。最近,他们发表了题为《Anton 3: twentymicroseconds of molecular dynamics simulation before lunch》的论文,标志着Anton3的问世。相比于Anton 2,Anton 3的计算性能再次提升了一个数量级,在512个节点并行处理下,能够对达100万个原子的大体系,每天进行超过100微秒量级的MD模拟[1]。


—— Anton 3 特点 ——

Anton超级计算机的硬件设计上与传统计算机不同,它是为了针对MD模拟而特化设计的。MD模拟主要任务是记录每个原子的位置、运动状态等,然后基于位置计算原子间的相互作用,主要耗时在非键相互作用的更新和计算上。这类并行计算是通讯密集型问题,需要高频率进行数据传输。在这里,每个节点承担的运算并不复杂,所以单个计算单元的计算能力提升并不明显,同时也没有大量数据需要存储,因此也不是计算密集型和访存密集型任务。
Anton 3相比前代,对节点内的芯片间通讯的物理延迟进行了一定的优化,而节点之间的物理封装限制,采取了专属于MD的压缩算法。原本通过链路传输最新的原子位置,此时在缓存中就预测好原子在下一个时刻的位置,而链路传输的仅仅是预测位置和实际位置的差异。通过这一方法,对传输的数据进行更为紧凑的编码,提高了传输效率。
除此以外,Anton 3在计算相互作用时,也沿用了之前的Pairwise Point Interaction Piplines (PPIP)的算法,但它进一步以距离5Å为界按照短程、较大的力(Big PPIPs)和长程、较小的力(Small PPIPs)分开计算(图1)。因为小PPIPs只计算常见相互作用,更易于专门化,因此使用了更少的逻辑单元,因而节省了芯片面积,能够将原来两个大型PPIPs的空间用于计算一个大PPIPs和三个小PPIPs,进一步提高了计算效率。
图1  参与相互作用计算的成对相互作用分区示意图

除此以外,Anton 3还针对成键和非键相互作用的具体算法进行了优化,降低数据传输的带宽需求,从而提高并行运算的效率,这些针对MD独有的优化帮助Anton 3超越前代,成为新一代处理MD模拟的“屠龙刀”。


—— 性能比较 ——
将各个生物大分子的模拟体系作为benchmark,表1展示了Anton 3和其他同时期的高性能计算机在各benchmark上的模拟性能,从表中可指,Anton 3动力学模拟的性能远超包括Anton 2在内的其他机器。即便是64节点的Anton 3,性能也成百倍的强于其他非Anton机器,能够模拟最多可达2百万个原子的体系,并达到每天25微秒的运行速度。
表1  Anton 3, Anton 2和目前最快的非Anton机器在benchmark体系的模拟性能
作者指出,随着时间尺度的增加,生物大分子能够发生更多样的状态转变,MD模拟采样也将更加充分,因而MD模拟没有通用的时间限制。而生物大分子发生和药物发现相关的构象动态变化通常在微秒量级,在作者使用Anton2的前期实践中,大分子的构象变化通常需要在20微秒量级左右(从亚微秒到亚毫秒级)才能观察到。如图2所示,对于现有的蛋白的benchmark要完成大约20微秒的动力学模拟,非Anton机器通常要持续运行1周以上,而Anton 3在千万级原子以下的体系能够在一周内完成20微秒的动力学模拟(绿色及以上区域)。对于一些较大的体系,Anton 3相比通用功能的超算体现了较明显的优势,例如它能在5小时左右完成总原子数达到200万原子的核糖体体系,而在非Anton机器上则需要长达100天。总体而言,在计算效率上达到了现有的通用超级计算机的100倍以上。而相比之前开发的Anton 2,64节点的Anton 3 就也已经优于512节点并行的Anton 2,同样取得了较大的突破。
图2  对于不同benchmark,各机器进行动力学模拟的性能和20ns模拟所需的时间
此外,在能耗上,Anton 3在每微秒模拟所消耗的能源也比目前最快的GPU低10倍以上,如图3所示。通过处理小任务时分配较少的节点用于运算,能避免多节点时的能源浪费问题。以上的结果表明,Anton 3比目前的通用计算机在MD问题上具有更快的处理速度、更高的数据吞吐和能源利用效率。

图3  每微秒动力学模拟的能耗


—— 小结 ——

总之,Anton3进一步扩展了MD模拟可及的空间和时间尺度,一方面能够去模拟更大的生化体系短时间内的运动状态,另一方面可以从更长的时间探索现有体系。相比于现代的通用计算机,特化MD模拟的设计使它具有远超当代其他机器的性能,是MD模拟界的新一代“屠龙宝刀”。笔者在此更加期待的是Anton3在药物虚拟筛选中的作用。目前的高通量虚拟筛选主要还是采用近似对接方式进行大量的虚拟筛选,但对在特定位点强结合分子捕捉的准确度较低。如果能利用Anton在MD模拟的高性能,结合基于对接的虚拟筛选和候选分子的MD模拟,有望进一步提高药物发现过程的速度和质量。

参考文献:

Shaw, David E., et al. "Anton 3: twenty microseconds of molecular dynamics simulation before lunch." Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis. 2021. Doi:10.1145/3458817.3487397

----------- End -----------




感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或

姓名-学校-职务/研究方向





- 历史文章推荐 -


药物设计

●Drug Discov Today|人工智能增强的药物设计和开发:迈向计算型精准医学

●Drug Discov Today|用于从头药物设计的图神经网络GNN

●Nat Commun|AI结合基因表达特征,从头生成类苗头化合物

●BioRxiv|基于表型和化学结构预测化合物活性

●Drug Discov Today综述|分子从头设计和生成模型

●Nat Comput Sci综述|生物分子建模在技术时代蓬勃发展

靶点发现

●Nature Outlook|借助算法和模拟将蛋白质折叠的瞬时结构转变为药物靶点

●AI+临床数据助力新药靶点发现,天坛医院院长王拥军谈【神农计划】

临床试验

●NPJ Digit Med|多种数字健康技术在去中心化的世界中赋能临床研究

●Nature:如何使用AI分析真实世界数据,简化肿瘤临床试验入组标准

产业进展

●如何管理人工智能和数据科学:来自诺华的实践经验和教训

●20家顶尖制药公司如何将AI应用于药物研发:近年来主要合作活动

●Drug Discov Today|药物研发风险地图

算法开发】 

●NPJ Digit Med|数字医学和维度诅咒

机器学习质量

Nat Comput Sci|迈向可重复的机器学习

Science|让机器学习值得信赖 

隐私计算

●曾亥年|AI药物发现实践与隐私安全计算

●Science China|用增强的联邦学习应对药物发现数据小和偏的困境

●Nature:优于联邦学习的医疗数据共享技术Swarm Learning及应用案例

AI药物发现的数据共享模式探索:以十大顶尖药企参加的MELLODDY项目为例

AlphaFold

Science|AI揭示了蛋白质复合物的结构

●BioRxiv|利用AlphaFold-Multitimer进行蛋白质复合物预测

●谷歌母公司推出AI驱动的药物发现初创公司Isomorphic Labs

Nat Rev Drug Discov|AlphaFold对药物发现意味着什么?

●Nature社论|结构生物学中的人工智能将会继续

量子计算

●Drug Discov Today|量子计算在药物发现中的潜力:早期的行业动态

●利用量子理论加速药物发现的18家初创企业

机器人实验室

●远程机器人实验室在AI药物发现中的应用价值与前景

监管

Nat Mach Intell|美国和欧洲如何监管医学领域的人工智能

●Drug Discov Today|FDA童伟达:基于AI的语言模型为药物发现和开发提供动力


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存