AI for Science又一里程碑:原子间势函数预训练模型DPA-1正式发布
见微知著,
解放科学家
揭示微观世界的基本原理、精确模拟微观粒子的状态,不仅是人类一直以来的梦想,也是药物、材料、化工等产业走向理性设计的必由之路。分子动力学模拟是人们研究微观世界的基本方法之一。其中,对原子间势函数的精确建模,是其中最核心的问题。
早在2020年,北京科学智能研究院与深势科技团队通过将机器学习与高性能计算相结合,实现了1亿原子第一性原理精度的分子动力学模拟,获当年全球高性能计算领域最高奖项“戈登·贝尔”奖。此次发布的 DPA-1,在原有基础上进一步优化高性能算法,将模拟上限提升至100亿原子数量级。
研究人员还通过可视化模型元素信息,发现其在空间呈螺旋状分布,并且巧妙地和元素周期表中位置一一对应,元素周期表中同周期元素沿着螺旋下降方向排列,而垂直螺旋方向则对应着同一主族元素分布,这也证明了此预训练模型具有良好的可解释性。
打造AI应用基础设施,
赋能新工业
工欲善其事,必先利其器。人工智能在语言、图像等领域的成功已经表明预训练模型已被普遍认为是未来趋势,已成为AI应用的基础设施。它的出现使得模型的训练可以被复用,避免开发人员重复进行大规模的训练,大幅度降低了训练的成本。预训练模型通过微调的方式具备很强的扩展性,可以提升在新场景的应用效率。同时可显著降低人工智能应用的门槛,对机器学习人员的要求大大降低,让算法人员及普通用户均可方便地使用平台。
近些年来,随着科学界对AI for Science 研究范式的认可和实践,微观科学计算领域实现了大量的数据积累和模型探索,这为领域预训练模型构建提供了诞生基础。DPA-1利用注意力机制等构造,大幅提高了模型迁移能力和元素容量,使用少量数据即可获得高精度模型,显著减少建模开销。就像Bert的出现彻底改变了自然语言处理领域,这一预训练大模型的诞生意味着势能函数的生产也真正进入“预训练+少量数据微调”的新范式。
此成果已经贡献在 DeepModeling 开源社区,并在科学智能广场正式公开(科学智能广场网址:https://www.aissquare.com/),北京科学智能研究院与深势科技希望基于此和全球各界人士推动建立更加开源开放的科研生态,加速领域内原始创新的速度。
相信在不久的将来,DPA-1将作为重要的基础设施,在医药、材料、能源这些与每个人息息相关的领域,诞生出新的应用,驱动自主研发新一代工业软件,形成从学术界的前沿研究逐步落地到工业界的技术创新和应用。
关于深势科技