量子纠缠,复杂网络与机器学习在集智融合 | 记2017集智-凯风研读营
2017年5月份的时候@甘文聪来我们南方科技大学访问两个月,探讨引力与量子信息的交叉,我们在知乎上看到集智俱乐部的招募,就一起提交了材料,去年参加研读营有凝聚态,统计物理,机器学习和社会科学的大牛,今年也只计划新招两个名额,只是本科生的我提交材料时心里没什么底,心想就碰碰运气,没想到却和@甘文聪一起收到了集智俱乐部的邀请,感到很惊喜。
我之前只会一些量子信息和量子计算的皮毛,在甘同学的访问期间学了一点广义相对论和量子场论,考虑纠缠是怎么在黑洞视界附近受到影响。另外我们课题组有师兄研究过把机器学习应用到Bell不等式,所以也想多了解一下机器学习和量子信息的交叉。在参加研读营之前听过尤亦庄老师的讲的报告,用random tensor network来学习空间的geometry,非常佩服。这次来研读营有两个期望,一是希望多了解一些机器学习背后的数学结构,二是和尤老师多讨论一下凝聚态和量子信息的结合。
纠缠与几何
正式开始的前一天晚上我是最晚一个到的,错过了大家的各自介绍,有点可惜。不过一来就感受到讨论的氛围非常热烈,尤老师跟我们讨论了一下他的思路,根据boundary entanglement的feature来学习出bulk的geometry。去年尤老师考虑固定张量网络的结构,使用随机张量网络,只训练耦合常数J,今年希望能够通过学习自动找到合适的网络结构。
其实基本思想很简单,quantum many-body state可以用random tensor network的boundary tensor来表示,每一个many-body state出现的概率由这个系统的hamiltonian决定,也就是boundary的pinning field(外磁场)。神奇的是由这个hamiltonian决定的一个many-body state的free energy算出来正好近似等于这个state的entanglement entropy(2nd Renyi entropy)。当我们根据这个概率分布来生成大量的boundary states(不同的spin configuration)后,我们就有了unlabeled data,用这些unlabeled data我们可以做unsupervised learning,最小化KL Divergence,使得模型的概率分布尽可能接近data的概率分布。如果我们使用Boltzmann machine,boundary states看做visible layer,bulk states看做invisible layer,training过后我们就得到层与层之间的weight,也就是这个网络的几何性质。如果不使用Boltzmann machine,考虑全连接图或者planar graph,再加上update的规则,我们就能在不固定网络结构前提下训练出它偏好的构型。
对于planar graph,可以使用三角剖分的三种基本规则来update:(1)找到所有的度数为3的顶点,随机去掉一个;(2)随机找一个三角形,在内部添加一个点,并与三个顶点相连;(3)随机切换一个四边形的对角线。可以证明,这三种update的规则能够覆盖所有可能的planar graph。问题的核心在于如何在given hamiltonian的条件下计算free energy(2nd Renyi Entropy)。
进一步,如果加上物质场,也就是beyond planar graph,以及给boundary tensor加上各种symmetry,比如U1,SU2 symmetry,我们甚至能得到各种基本粒子,像电磁场中的光子,或者是各种费米子,这样我们就把物理学中的各种基本粒子的产生理解为自然界在unsupervised learning不同的纠缠结构,和文小刚教(da)授(lao)的思想遥相呼应。没想到纠缠,几何和学习能够以这样一种奇妙又紧密的方式结合起来,在传统物理学的训练中从来没有过这样思想的冲击和颠覆。
计算社会科学
几天的会议讨论后,在物理以外的领域有三点比较大的收获,一是殷裔安同学通过美国NIH申请基金的近30年的记录,来分析哪些科学家会在重复的失败后成功地申请到基金,结果发现对于成功者而言,在申请成功之前的大概十次失败的申请中,他们申请的时间间隔是按power law减少的,而对于失败者而言,他们的时间间隔的分布大概是均匀的。社会科学的研究原来是基于大量数据的分析或者通过控制变量的实验来分析社会行为背后的机制。二是computational social science和virtual lab这两个概念,传统的社会科学做实验没有计算机,只能通过调查问卷等方式来分析研究,有很多实际受限,消耗大量的人力物力也不能做太大,现在可以借助网络在线上建立虚拟社会科学实验室,在三个维度scale,complexity和endure都能极大地扩张,在传统的社会科学的基础上进行了质的飞跃。三是补充了一些人工智能和机器学习的基础知识,比如RNN中的Recurrent是怎么实现的,LSTM是怎么在RNN的基础上加入三个gate实现长短时记忆,把神经网络的每一层按一定比例drop out一些神经元来训练多个随机森林,概率图模型是怎么和张量网络,神经网络建立一一对应关系,最近新出来的三种Gan到底有什么区别。
通过将近一周的热烈讨论,不仅把我自己的研究领域扩展到凝聚态,还学习到了很多其他领域的知识,这些知识在平时学校里普通的学习过程中几乎没有办法接触到,特别感谢集智俱乐部创建起这样一个组织,以及基金会资助举办这样学术交流的活动,把不同领域感兴趣的学者聚集在一起,在不同维度思想的碰撞中产生新的火花。
黄金龙 南方科技大学大四本科生
研究方向:量子信息与相对论和凝聚态的交叉。大三时分析过纠缠在黑洞附近如何变化,也做过波色抽样(quantum supremacy的一种方案)的理论分析及经典模拟。对deep Boltzmann machine以及机器学习的理论模型比较感兴趣。
推荐阅读
What can we know from the given data?
集智QQ群|292641157
商务合作|zhangqian@swarma.org
投稿转载|wangting@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!