

潘佳栋 集智俱乐部 2022-04-08


因复杂物理系统的分析取决于从众多其他自由度中提取相关自由度的能力。尽管人们对机器学习寄予厚望,但它也带来了可解释性的挑战。研究人员通常不清楚学习到的“相关”特征与物理理论的对应关系。在最近发表在 Physics Review Letters 的一篇文章中,研究人员报告了有助于解决这个问题的理论结果:他们建立了重整化群的场论相关性与信息瓶颈(information bottleneck,IB)理论定义的相关性概念之间的等价性。他们的分析表明,对于由场论描述的统计物理系统,使用IB理论发现的自由度确实对应于具有最低标度维数的算子。他们以数值方式证实了他们的场论预测。研究人员研究了IB算法对物理对称性的依赖性。他们的发现提供了一个连接两个不同理论的方法,以及一个在物理的深度学习应用中能够给出物理可解释性的例子。


潘佳栋 | 作者

邓一雪 | 编辑


Relevance in the Renormalization Group and in Information Theory



研究理论模型是物理研究的一个重要方向。然而,对于复杂的系统,确定正确的自由度是什么,并根据这些自由度构建模型,本身就是一个挑战。这个过程是由实验或数值观察驱动的,但在实践中,物理直觉和先验知识对于构建一个足够简单的模型来描述现象的“本质”至关重要[1]。尽管如此,数据本身应该包含完成这项任务的足够信息。一个方案是使用现代计算方法,特别是深度学习(deep learning)[2-4]。使用该算法的一个基本障碍是物理学概念(主要以场论语言表述)与深度学习的理论和实践之间的不匹配,这就是可解释性问题[5]。为了解决这个问题,需要一个能够兼容这两者的框架。与物理学和计算机科学[6-8]密切相关的信息论(information theory)是一个候选者。


1. 研究背景

压缩数据以有效地保留隐式定义的相关内容被视为拉格朗日优化问题,该问题最近引入了深度学习算法[12]。然而,在物理学中,已经存在一个基本的和先验的独立相关概念,它基于在重整化群(renormalization group,RG)流中体现的尺度变换下的算子属性 [13-15]。RG相关性是人们所拥有的最精确的定义,可以确定系统宏观物理特性的可观察量。RG直接连接到共形场论(conformal field theories,CFT)的概念中,彻底改变了人们对临界现象的理解 [16-22]。
这些结果和深度学习 [32,33] 被用来构建一种有效的算法,即基于神经网络的实空间互信息估计器(real-space mutual information neural estimator,RSMI-NE)[34,35] ],从更大的输入中提取物理上相关的算子,并表征空间相关性、相变(phase transitions)和序参量(order parameters)。研究人员证明RSMI是IB问题的一种情况,这为该数值方法提供了理论基础。

2. 信息瓶颈理论和实空间互信息估计器







3. 结论




