引力波、三体和囚徒困境
10月3日,瑞典皇家科学院将2017年诺贝尔物理学奖授予雷纳·韦斯(Rainer Weiss)、巴里·巴瑞斯(Barry C. Barish)和吉普·索恩(Kip S. Thorne),以表彰他们在引力波研究方面的贡献。“引力波”对很多中国人来说并不是陌生的名词。在刘慈欣获得大奖的科幻小说《三体》中,人类就是通过引力波向宇宙发射地球位置而威胁与三体人同归于尽,才实现了短暂的和平。在著名的科幻电影《星际穿越》里,库珀博士就是通过引力波给女儿留下了关键信息。有趣的是,该电影的科学顾问正是昨天获得诺贝尔物理学奖的吉普·索恩!
我是一个很少看小说的人,但是我要借机向所有人强烈推荐《三体》。这部小说视野广阔,步步玄机,逻辑严密,并且具有悲天悯人的伟大情怀。我很怀疑,小说作者刘慈欣是学过经济学的,至少了解过博弈论。事实上,2015年秋季我曾在人民大学做了一个公开讲座,题目是《博弈论、西游记和三体》。我发现,《三体》三部曲可以用一个简单的囚徒困境来解说。以下是我在《经济学家茶座》上的解说文章。此处纯属剧透,读者慎入!——聂辉华 2017年10月4日 于人大明德楼
一个博弈矩阵破解《三体》奥秘
文/聂辉华
一、《三体》的故事梗概
一个在山西省娘子关火电站工作的工程师刘慈欣,利用业余时间创作了科幻小说《地球往事》三部曲(《三体》、《黑暗森林》、第三部《死神永生》,合称《三体》),在2006-2010年间发表。《三体》先后获得了中国科幻银河奖、全球华语科幻星云奖等重要奖项,并于今年8月23日获得了世界科幻大会颁发的雨果奖,成为首次获奖的亚洲人作品。评论家认为,刘慈欣“以一人之力将中国科幻作品推上了世界水平”。我几乎没有看到哪部作品被颂扬到如此高度,于是从不看科幻小说的我,前几天毅然买了《三体》三部曲。一旦打开《三体》,便发现这套书令人爱不释手,我几乎一口气读完三部。在看完第二部的一半时,我在个人微信公众号“聂氏政经评论”(ruc_nie)里发表了一篇评论《比较优势能让个体存活吗?——二论“三体公理”的黑暗性》。有趣的是,我几乎准确地预见了第二部的结局。
《三体》讲述了地球文明、三体文明以及宇宙中其他文明之间的冲突与矛盾。总体上看,体现了作者浩淼无边的想象力,严谨的逻辑推理能力,对人性弱点的深刻洞察力,以及对人类乃至宇宙社会的终极关怀。这绝对是一部天才般的作品,它是我看过的最好看的小说之一,去掉“之一”也不算过分。毕竟,多年来我都没有看到这么博大精深的作品。我认为,作者当得起评论家的盛赞。
下面介绍《三体》的基本内容和内在逻辑。
1971年,家庭和个人在“文革”中饱受摧残的妇女叶文洁,利用在一个秘密军事基地工作的机会,偷偷地向太空发出信号,暴露了地球文明的存在和位置。这一信号被处于太阳系的三体文明所捕捉。三体文明借助远高于地球的技术,与叶文洁领导的地球三体组织(ETO)里应外合,开始了占领地球和灭绝人类的侵略计划。地球社会察觉了这一计划,消灭了地球三体组织,但人类社会仍面临灭绝危机。(第一部完。)在联合国的统一部署下,地球社会利用三体世界的弱点,制定了“面壁计划”来保护地球文明。三个面壁人的计划均告失败,三体文明仅仅凭借一颗“水滴”武器就在瞬间摧毁了地球人的2000余艘星际战舰。在地球世界即将灭亡之际,第四个面壁人、无名学者罗辑的计划意外地成功了。罗辑的计划其实是一种威慑战略:一旦发现三体文明入侵地球,就立即通过一种特殊装置向宇宙报告三体文明的坐标,然后利用其它更高等级文明的力量来摧毁三体文明。三体文明在接近地球时,发现了罗辑的威慑行动,不得不中止了对地球的侵略行动,使地球赢得了暂时的生存机会。(第二部完。)罗辑的接班人、一个女性程心刚刚接过威慑装置,三体文明对地球蓄谋已久的袭击就开始了。在关键时刻,性格软弱的程心放弃了使用威慑装置,从而三体文明成功地占领了地球,在大规模的移民、冲突、局部战争中,大量地球人死亡。侥幸逃离的“蓝色空间”号星际战舰利用四维空间的优势打败了三体文明派来追击的“水滴”,并紧急向宇宙广播了三体文明的坐标,使三体文明在灭绝人类的计划完成之前被迫撤离了地球,地球社会又恢复了此前的状态。但是三体世界由于暴露了目标,在几年后果真被外星球文明摧毁。威慑广播也间接地暴露了地球文明的位置,地球社会不得不筹划各种逃离计划。在关键时刻,程心再发妇人之仁,放弃了对光速飞船的制造,从而耽误了地球社会乘坐光速飞船逃离的最后一次机会。几年后,地球文明被外星文明以一片奇特的“二向箔”毁灭。最后,地球人只剩下了程心以及一个此前逃离的科学家关一帆。公元十万八千年之后,他们逃到了一个小宇宙。(第三部完。)
二、用博弈论解析《三体》故事
由于《三体》逻辑严密、自成体系,因此可以借助博弈论这一经济学工具,重新推演其主要线索和故事情节。我们只需要两个公理和两个假设作为全书故事的逻辑起点,这也是《三体》借助女主人公叶文洁表达的“宇宙社会学”的逻辑起点。
公理1:生存是文明的第一需要。作为一个整体,任何文明都会为了生存而放弃任何道德或法律,不惜一切代价。
公理2:文明不断增长和扩张,但宇宙中的物质总量保持不变。由于“人口”(生物)的增长速度超过了给定的物质总量,因此一个文明只有占领其它文明的地盘才能继续生存。如果存在一个领域适合生存,却长期无人占领,这违背了公理2。
假设1(猜疑链):宇宙中的每个文明之间距离很远(至少4光年),互不了解,彼此之间对于对方的善恶存在严重的信息不对称问题。例如,A、B两个星球文明之间,A不知道B是善还是恶,B不知道A是善还是恶;A不知道B是否知道A不知道B是善还是恶,B不知道A是否知道B不知道A是善还是恶;……,如此循环往复以至无穷,其实这就是博弈论中的“共同知识”问题。
假设2(技术爆炸):一个文明的技术进步一开始是加速发展的,但是到达一定高度之后(例如三体文明的技术水平)就会减速发展,这类似于经济学中的“边际报酬递减原理”。因此,一旦发现对手存在,即便对手的技术不如自己,也决不能掉以轻心。因为处于低级阶段的对手会以加速度进步,而处于高级阶段的自己很快就会被对手赶上。
在上述两个公理和两个假设下,宇宙社会中的各个星球文明如同生存在一个“黑暗森林”里。每一个文明都是拿枪的猎人,都在寻找一切机会消灭别人然后占领对方的地盘。在信息不对称下,每一个文明都陷入了一种博弈论中的“囚徒困境”(图1)。假设每个文明可以有两种策略:“行善”(欢迎对方),“作恶”(攻击对方)。给定对手选择了行善,那么作恶可以确保自己消灭对方并占领对方领地,显然这比行善要好。因为即便对方一开始行善,自己也行善,但一旦对方首先翻脸作恶,自己就会被毫无防备地消灭。另一方面,给定对手选择作恶,自己也只有作恶才可能生存下来,而行善则无异于自杀。因此,无论对方是行善还是作恶,自己作恶都是最优的。总之,在宇宙社会这片巨大的黑暗森林里,任何一个猎人一旦暴露了自己的位置,都会被其他猎人第一时间射杀。用博弈论的话来说,一旦发现对手就立即消灭对手就是每个文明的“优势策略”。这个囚徒困境的唯一均衡就是(作恶,作恶,…,作恶),即所有文明集体作恶构成了必然的悲剧结果。这也是《三体》第三部《死神永生》在结尾所表达的悲观结果。借用凯恩斯的一句名言:“在长期中,我们都死了”(In the long run ,we are all dead
现在,我们可以用上面的博弈论推理来解析《三体》的主要情节。1971年,当叶文洁在“红岸基地”发现人类可以借助太阳这个电波放大器向宇宙发射来自地球的信号时,饱受“文革”摧残的她毫不犹豫地按下了发射键。8年后,当她无意中收到了来自三体文明的和平警告时,她再次毫不犹豫地进行了回应,呼吁对方来“解放地球”。在地球文明和三体文明的博弈中,叶文洁向三体文明发射信号就是故意暴露地球文明的位置,但地球文明并不知道三体文明的位置,在技术上也远远不是三体文明的对手,因此地球文明在这场博弈中根本不是一个合格的猎手,简直就是一只待宰的羔羊。在黑暗森林中,一旦有人将灯光照亮了这只羔羊,可怜的羔羊就会被某个手快的猎人第一时间消灭,毫无悬念。因此,当三体文明收到了地球的反馈信息之后,一方面通过智子与叶文洁领导的地球三体组织建立联系,让他们杀害地球上的科学家,延缓地球的基础科学进步(技术爆炸假设);另一方面,立即派出一颗“水滴”(强互作用力材料制成的宇宙探测器)向地球飞来。“水滴”无坚不摧,不到一小时就摧毁了停留在太空中的地球联合舰队,2千艘战舰几乎无一幸存。“自然选择”号执行舰长章北海成功地策划了一次完美的逃离地球计划,四艘战舰前往追捕,这五艘战舰成为一批暂时的幸存者。另外还有两艘战舰在遭遇“水滴”打击时向相反的方向侥幸逃脱。
在逃脱过程中,章北海他们的五艘舰船之间再次陷入了囚徒困境。章北海的战舰离最近的目标星系NH558J2还有十多光年距离,离最终的可生存星球还有六万光年距离,而目前携带的燃料和食物根本不够供应所有舰船。要生存,唯一的办法就是消灭其它四只战舰并夺取其食物。再一次,作恶成为每艘战舰的最优策略,也是唯一的选择。章北海冷酷地准备实施,然而,别人也是这么想的。遗憾的是,就在章北海启动次声波氢弹发射器之前的稍微犹豫之际,另一艘“终极规律”号抢先向其他四艘战舰发射了武器。然而,“螳螂捕蝉,黄雀在后”。“蓝色空间”号比“终极规律”号更早一步做好了防御准备,因此它不仅躲过了对手的袭击,而且将对手消灭了,成为这五艘战舰中的唯一胜者。其他四艘战舰上的能源被“蓝色空间”号取走,关键配件被取走,连所有尸体都被当做了食物!这就是残酷无情的黑暗森林法则。类似的故事也发生在另外两艘战舰上,“青铜时代”号偷袭了“量子”号。
一个本来不学无术、玩世不恭的大学老师罗辑识破了上述逻辑链条,帮助地球暂时地跳出了囚徒困境。虽然地球文明打不过三体文明,但地球文明可以暴露三体文明的位置,让别的更高等级的文明来消灭三体文明。因此,对于地球文明来说,最优策略是,只要三体文明对地球的打击不是瞬间的——这个条件恰好满足,因为两者相距4光年,地球一旦接到危机警报就可以立即借助太阳向太空发射三体文明的坐标。三体文明预见到这点,就会理性地放弃袭击计划,因为它绝对不想在宇宙中暴露自己的坐标。这种自杀式攻击策略实际上是一种威慑策略。威慑策略有效的前提是,威慑者的承诺是可置信的,而可置信的前提是,让对手明白自己不遵守(自杀式攻击)承诺的成本高于遵守承诺的成本。罗辑是一个冷酷到底的男人,做事不按常规出牌,为了地球文明的整体生存不惜牺牲个人的道德准则乃至生命。因此,当罗辑成为掌握威慑装置的“执剑人”时,三体文明中途放弃了袭击地球的计划,地球文明和三体文明进入了一种“威慑均衡”。
进入威慑纪元后,人类社会如同安全襁褓中长大的孩子,逐渐变得失去警惕,以至于选择了一个柔弱的女性程心来作为第二任“执剑人”。程心是一个将个人道德看得高于一切、高于人类整体生存的妇人。“给岁月以文明,而不是给文明以岁月”,她是那个时代的典型代表。她根本没想到三体世界还会袭击地球,她宁愿地球毁灭也不愿意通过向宇宙广播间接暴露地球坐标从而导致地球文明被毁。换句话说,她宁愿别人杀自己,也绝不愿意自己杀别人,哪怕这会导致所有人被杀。这种极端的“自私”导致威慑策略失去了有效的前提,而三体文明早就预测到了这种结果,于是再次派“水滴”袭击了人类社会并占领了地球。
后面的故事就相对简单了。逃离地球的“蓝色空间”号战舰及时向宇宙广播了三体文明的坐标,导致后来三体文明被其他文明所毁灭。在黑暗森林的大小战役中,有少数人类或物种乘坐战舰逃离了,他们的生存空间被称为“小宇宙”。小宇宙生存的前提是,从大宇宙带走了各种生物、土壤、能源等物质,但这会导致大宇宙逐步失去质量,最终大宇宙会在无限的膨胀中死去。因此,更高等级的文明用一百五十七万种语言向宇宙呼吁,所有逃离的小宇宙向大宇宙归还物质,这就是第三部《死神永生》结尾的“回归运动”。但是,“回归运动”本身也是一个囚徒困境:给定其他小宇宙归还了自己的物质,这些小宇宙本身必须回到大宇宙的残酷生存环境;得到归还物质的大宇宙有更多生存机会,这会惠及其他游离在外的小宇宙。因此每个小宇宙拒绝归还是一种最优策略。如果所有小宇宙都这么想,那么最终没有小宇宙归还物质,整个宇宙将加速死亡,这可能是《三体》最悲观的结果。那么,小宇宙们最终会归还物质吗?大宇宙会加速死亡吗?天知道。
(本文发表于《经济学家茶座》2015年第4辑,总第70辑。作者系中国人民大学国家发展与战略研究院副院长、经济学院教授。图片来自网络。)
相关阅读
现在的教科书,大部分脱离实际、晦涩难懂。想看“有趣、有理、有用”的经济学故事?欢迎阅读中国人民大学教授聂辉华的企业理论通俗读物《跟<西游记>学创业——一本人人都要读的管理秘籍》,中央电视台两次推荐,中央人民广播电台两次直播专访。点击“阅读原文”即可购买!