比翱观察丨机器学习算法真的“理解”了它们试图解决的科学问题吗?
机器学习在科学界越来越流行,但这些算法真的“理解”了它们试图解决的科学问题吗?在本文中,我们解释了基于物理的神经网络,这是将物理原理融入机器学习的一种强大方式。
科学领域的机器学习革命
机器学习已经引起了科学方法的根本转变。传统上,科学研究围绕着理论和实验展开:一方面设计一个定义明确的理论,然后使用实验数据不断完善它并对其进行分析以做出新的预测。
但是今天,随着机器学习领域的快速发展和科学数据量的急剧增加,数据驱动的方法变得越来越流行。这里不需要现有的理论,而是可以使用机器学习算法仅使用数据来分析科学问题。
学习模拟实验数据
让我们看看机器学习可用于科学研究的一种方式。想象一下,我们得到了一些来自一些未知物理现象的实验数据点,例如下面动画中的橙色点。
一项常见的科学任务是找到一个模型,该模型能够在给定这些数据的情况下准确预测新的实验测量值。
使用机器学习来做到这一点的一种流行方法是使用神经网络。给定数据点的位置作为输入(用x表示),可以使用神经网络输出对其值(用u表示)的预测,如下图所示:
为了学习模型,我们尝试调整网络的自由参数(由上图中的θ表示),以便网络的预测与可用的实验数据紧密匹配。这通常是通过最小化其预测和训练点之间的均方误差来完成的;
使用上述实验数据训练这种神经网络的结果如动画所示。
纯数据驱动方法的“天真”
问题是,使用像这样的纯数据驱动的方法可能有很大的缺点。看看上面动画中用于生成实验数据的未知物理过程的实际值(灰线)。
您可以看到,虽然神经网络准确地模拟了实验数据附近的物理过程,但它无法从这些训练数据中进行泛化。仅仅依靠数据,人们可能会争辩说它并没有真正“理解”科学问题。
科学机器学习(SciML)的兴起
如果我告诉你我们已经知道了这个过程的一些物理知识呢?具体而言,数据点实际上是阻尼谐振子位置的测量值:
这是一个经典的物理问题,我们知道基本物理可以用以下微分方程来描述:
其中m是振荡器的质量,μ是摩擦系数,k是弹簧常数。
鉴于上述“幼稚”机器学习方法的局限性,研究人员现在正在寻找方法,在蓬勃发展的科学机器学习 (SciML) 领域中,将这种类型的先验科学知识纳入我们的机器学习工作流程中。
那么,什么是物理信息神经网络?
解决我们问题的一种方法是使用物理信息神经网络[1,2]。思路很简单:在训练神经网络时,将已知的微分方程直接加入损失函数中。
这是通过对一组输入训练位置 ({xj})进行采样并将它们传递到网络来完成的。在这些位置计算网络输出相对于其输入的下一个梯度(这些位置通常可用于大多数神经网络的分析,并且可以使用自微分轻松计算)。最后,使用这些梯度计算基本微分方程的残差,并将其作为额外项添加到损失函数中。
让我们来解决上面的问题。这相当于使用以下损耗函数来训练网络:
我们可以看到,损耗函数中的附加“物理损耗”试图确保网络学习到的解与已知物理一致。
下面是我们训练物理信息网络的结果:
评论
基于物理知识的神经网络能够在远离实验数据点的地方进行预测,因而比基本神经网络具有更好的性能。有人可能会说,这个网络确实对我们先前的物理原理有一些概念。
“天真”的网络表现不佳,因为我们正在“抛弃”我们现有的科学知识;手头只有这些数据,这就像没有上过物理课就试图理解粒子对撞机生成的所有数据一样!
虽然我们在这里关注的是一个特定的物理问题,但基于物理的神经网络也可以很容易地应用于许多其他类型的微分方程,并且是将物理融入机器学习的通用工具。
总结
我们已经看到,机器学习提供了一种进行科学研究的新方法,强调从数据中学习。通过将现有的物理原理融入机器学习,我们能够创建更强大的模型,从数据中学习并建立在我们现有的科学知识之上。
参考文献
1. Lagaris, I. E., Likas, A., &Fotiadis, D. I. (1998). Artificial neural networks for solving ordinary and partial differential equations. IEEE Transactions on Neural Networks. 2. Raissi, M., Perdikaris, P., & Karniadakis, G. E. (2019). Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partialdifferential equations. Journal of Computational Physics.文章来源于BEN MOSELEY,作者目前是牛津大学自主智能机器和系统中心的物理和机器学习博士生,也是NASA前沿开发实验室的机器学习负责人。
● IoM3 网络研讨会丨有机材料中的机器学习:从分子到设备● 比翱工程实验室丨通过机器学习方法减小原位吸声测量时有限尺寸效应所造成的误差
● 比翱工程实验室丨基于人工智能预测纤维材料比翱(BIOT)特性参数的方法
● 比翱观察丨人工智能加速拓扑优化超材料的设计● 普信科技受邀出席中国仿真学会人工智能仿真技术专业委员会成立大会
● ProAcoustics | 利用人工智能实时消除电话会议中的背景噪音● ProAcoustics丨裸行“人工智能”世界,如何保护您的私人数据和信息
免责声明:部分资料来源网络,转载目的在于传递信息及分享,并不意味赞同其观点或其真实性,也不构成其他建议。仅提供交流平台,不为其版权负责。如涉及侵权,请联系我们及时删除。