没有假设就无法构建预测模型,因此,如果没有适当的偏差,机器学习模型就无法预期泛化性能。目前有三种可以通过嵌入物理信息来加速训练和增强 ML 模型泛化的途径:引入适当的观察偏差、归纳偏差、学习偏差。 图示:物理知识嵌入机器学习的原则。(来源:论文) 观察偏差可以通过直接引入体现基础物理原理的数据,在此类数据上训练 ML 系统能够学习到数据的物理结构的函数、向量场和运算符。这类方法较为简单,但也十分昂贵。 归纳偏差对应于通过对 ML 模型架构的干预,保证所寻求的预测隐含地满足一组给定的物理原理,通常以数学约束的形式表示。有人认为,这是让机器学习拥有物理信息的最有依据的方法,因为它严格满足潜在的物理约束。但是,这样的方法可能仅限于解决先验已知相对简单的,并且可能会经常导致实现过于复杂而难以扩展。 学习偏差可以基于先验物理知识,通过损失函数对预测进行软约束,产生近似满足给定物理约束集的预测。通过使用和调整这种软约束,虽然只能近似满足潜在的物理定律,但却提供了一个非常灵活的平台,可以引入以积分、微分方程为表现形式的基于物理的偏差。 这些让机器学习算法掌握物理知识的不同方案并不是相互排斥的,而是可以有效地结合起来,以混合方法来构建基于物理信息的学习机器。