复杂网络,机器学习与全息原理 | 记2017集智-凯风研读营
这是我第一次参加集智研读营,被这里的氛围所吸引。这里集合了计算社会学,计算机科学,理论物理学,生物物理学等等各个方向的学者。在我们来到的第一天晚上就展开了激烈的讨论。Kevin的社会学实验,尤亦庄的限制玻尔兹曼机与统计物理和全息引力,苑明理的机器学习与微分方程,董磊的数据分析等等,每个人都带着深刻的工作和思想,相互之间思想的碰撞,头脑风暴刷新着我的知识。白天的集中学习,晚上的自由讨论充实着我的每一天。明年的研读营我希望能继续参加。
复杂网络与全息原理
量子引力的全息理论是近二十年才兴起的方向。它将时空内部(bulk)的量子引力理论与时空边界(boundary)上的非引力的量子场论对偶起来。这个理论吸引人的地方在于,我们可以认为引力现象并不是基本的,而是可以从非引力的场论自由度演生(emerge)出来。具体的说,场论各个自由度之间的纠缠与关联实际上代表了更高维度的时空几何。这个美妙的想法被神经网络优雅的描述了。隐藏层连接着显层,表征着显层单元之间的关联与纠缠。而更高维度的几何就自然地出现在演生的隐藏层中。
在这些天与大家的交流中,我看到复杂网络在各个领域中都有应用,而上面的想法也启示我,在引力理论中,共形场论(Conformal Field Theory)的复杂网络正是反德西特时空(Anti-de Sitter Space-time,双曲几何)。进一步的说,复杂系统(例如CFT)之所以复杂,是由于存在复杂的内部关联(隐藏的内部关联),这些关联由隐层描述,而形成加入了隐层的复杂网络,这个复杂网络会有不同的几何(例如双曲几何)以及简洁的规律(例如Einstein场方程)。
特别是尤亦庄师兄的使用DBM通过数据学习得到复杂网络连边的coupling constant,从而boundary state通过机器学习得到bulk几何的相关思想更是深深的冲击着我。我们宇宙也许就是这样由边界系统的自主机器学习过程而演生出来的复杂网络结构。
临界系统
傅渥成的关于自组织临界(self-organized criticality)系统的讨论再一次刷新了我的三观。许多系统都可以用自组织临界理论进行描述。
自然界中很多重要的系统都不是处在热平衡态,比如生命本身。热平衡意味着没有变化,意味着熵极大,极度混乱的系统也就意味着没有生命。而有生命意味着有序,即负熵。生命就是由生命体内部相互作用导致的自组织规律系统。不仅如此,生物系统还在临界点附近。临界点意味着特殊敏感,小的局部破坏可能导致整体的坍塌。傅渥成用著名的沙堆模型(sandpile model)进行说明:落下的沙子由于沙子内部的相互作用会形成沙堆。这是自组织的过程。但是当沙堆增高到一定程度之后,落下一粒沙会导致整个沙堆的坍塌。这是临界状态,对小的扰动很敏感。这是因为临界的系统具有长程关联,相距遥远的部分之间有强关联,也就导致了一个部分的破坏引起大部分的破坏。不仅如此,长程关联还意味着标度不变。这是由于体系内部的关联长度发散,没有特征长度(characteristic length)也就说明系统的各个物理量与尺度无关,即标度不变。甚至自组织临界系统的几何一定是双曲(hyperbolic)几何。因为双曲几何是唯一具有标度不变性的几何。
进一步,自组织临界系统的各个量显示出幂律关系。不仅如此,就连成功学都具有幂律。西北大学的殷裔安分析NIH三十多年来的基金申请记录,发现最终成功申请的科研工作者成功之前失败的申请中连续两次的申请时间间隔满足幂律衰减。幂律,或者说临界状态是各个自组织系统的关键。它将不同学科神奇的联系了起来。
机器学习与程序生长
机器学习是近两年非常火的课题,特别是是Google的AlphaGo打败了人类的围棋冠军之后。机器学习也是这次研读营的核心课题之一。我们围绕着机器学习进行了各方面的讨论:
尤亦庄师兄介绍了tensorflow graph,罗秀哲介绍了pytorch以及机器学习和量子多体问题的关联, 程嵩介绍了Restricted Boltzmann machine和tensor network之间的关系。彩云天气的CEO 袁行远展示了机器学习在天气预测,语音翻译和智能作曲等方面强大的功能。以及肖达介绍了序列学习模型RNN/LSTM。肖达的“将世界的普适规律“硬编码”到网络结构中”,苑明理的程序代码的生长机制都将世界以及生物与机器学习深刻的联系了起来。他们让我相信,世界的本质规律也许就是机器自我学习的过程,我们的宇宙是一台量子计算机,包括生命本身。这些都冲击着我的世界观。我们正朝着这个方向不断的探索。
大数据与计算社会学
这次的研读营,社会学家们也带给我太多惊讶与惊喜。Kevin的线上社会学实验,将社会学实验融合进小游戏中,使得线上的网友们都可以参与进来,且由于破除了地域和时间的限制,使得实验规模宏大,样本数量和数据量都非常多。还有上面提到的殷裔安对成功和失败的分析,平常无法分辨的通向成功的失败与通向失败的失败在这里都能从数据上体现出来,甚至满足幂律分布。董磊运用卫星数据进行可视化分析人口的流动,产业的变化,地区经济贫困与富裕的分析等等。这些都完美的将科学、技术、艺术和人文关怀紧密的联系了起来。使我相信科技是能改变社会的。
吴令飞、马磊与尤亦庄师兄的Ising model和社会计算与图灵机的讨论再一次揭示了复杂网络与社会学的深刻关系。甚至可以用Ising model用来模拟议会投票机制。复杂网络再一次将物理学、社会学、计算机科学紧密的联系了起来。
这次的研读营每天都给我带来不同的头脑风暴,除开白天的集中学习与讨论,晚上的自由讨论也随处可见。浓厚的学习氛围感染着我激励着我。这短短的几日给我带来的冲击与震撼是前所未有的,吴令飞鼓励我们多关注有趣的问题,不同的专业互相交流探讨。这些拓宽了我的眼界。希望集智的研读营越办越好。
甘文聪 南昌大学硕士二年级
研究方向:量子信息与量子引力的交叉。 曾做过张量网络在AdS/CFT中演生引力的方案;全息复杂度与量子保真率对偶的研究;以及deep learning的双曲几何与全息的关系研究。
推荐阅读
What can we know from the given data?
集智QQ群|292641157
商务合作|zhangqian@swarma.org
投稿转载|wangting@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!