查看原文
其他

天才在左 疯子在右丨约翰·纳什和他的“纳什均衡”

华院计算 2022-06-25


无常命运中,坚守一颗美丽心灵

                                               —题记

前几天被志玲姐姐结婚的消息刷了屏

据说很多人的高德导航语音包已经换成了郭德纲


小编印象深刻的是

林志玲言承旭这段感情中令人唏嘘的画面

和那种爱而不得的复杂表情


2015年,俩人隔空回应“好久不见”


在长达十六年的分分合合中

即便粉丝们操碎了心,认为俩人复合是最好的结果

纵使彼此相爱,俩人在各自权衡选择后,

仍没有做出“在一起”的决定,

这是不是算一种纳什均衡?


再来看著名的“囚徒困境”

两个小偷A和B联合犯事被警察抓住。两嫌疑人之间有了一场博弈,如下图所示:

对A、B来说,最好的策略是双方都抵赖,结果是大家都只被判1年。这两个人都会暗自盘算:假如他坦白,我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。看完了八卦,简单理解了纳什均衡,为什么今天说这些?答案来了:6月13日是著名数学家、经济学家、诺贝尔奖获得者、奥斯卡最佳电影《美丽心灵》的原型—约翰·纳什的生日。

电影《美丽心灵》海报

       

纳什以他在博弈论领域的成就著称于世,他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事等领域。其曾患有长达30年的精神分裂,晚年为普林斯顿大学的资深研究数学家。

我们从博弈论说起

博弈论

博弈论属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。它被认为是20世纪最伟大的经济成果之一。


博弈论之父—冯诺依曼


1928年,冯-诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。


1944年,冯-诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。


1950-1951年,约翰·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。其开创性论文《n人博弈的均衡点》,《非合作博弈》等,给出了纳什均衡的概念和均衡存在定理。

纳什均衡定义

在非合作类博弈中,存在一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。


数学定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。


纳什均衡的另外几个典型案例

智猪博弈

猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。但当小猪踩踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;大猪踩动了踏板,则有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半食物。


那么,两只猪各会采取什么策略?当然是小猪等在食槽边,而大猪不知疲倦地奔忙于踏板和食槽之间。因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪不会去踩动踏板,自己亲自去踩踏板还有点吃的,总比不踩强,所以只好去踩踏板。


硬币游戏

你正在图书馆无聊的发呆,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。


应该怎么玩这个游戏?


假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等(如果不相等,对方便会一直出正面或者反面,使得我们的利益最小),由此列出方程就是:


3x + (-2)(1-x)=(-2) * x + 1*( 1-x ) ,解方程得x=3/8;


同样,美女的收益,列方程-3y + 2( 1-y)= 2y+ (-1) * ( 1-y),解得y也等于3/8。


于是,我们就可以算美女每次的期望收益是:(1-y)(2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,也就是说,双方都采取最优策略的情况下,平均每次美女赢1/8元。


其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。


如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;


如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。


比如你用完全随机(1/2,1/2)策略,收益是1/2*(3/8 * 3 + 5/8 * (-2)) + 1/2(3/8 * (-2) + 5/8 * 1) = -1/8;


实际上,不论你用什么策略,你的收益都是-1/8,也就是说,随便玩一种策略,你都是在纳什均衡状态中的,所以,这个把戏你随便怎么玩,都是亏的的。


纳什均衡理论的影响

纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心,在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。” 


最后让我们来回顾下纳什坎坷而又传奇的一生


1928年6月13日

纳什在美国西福尼亚州出生


1948年

20岁,进入普林斯顿求学

1950年

22岁,获得美国普林斯顿高等研究院的博士学位


1952年

年仅24岁的纳什于普林斯顿大学担任教职


1958年

29岁的纳什与物理系学生艾丽西亚步入了婚姻的殿堂


长达30年的病痛折磨

婚后的纳什逐渐显露出精神失常的症状,他因严重的幻听幻觉被确诊为精神分裂,心理干预、两次三番地注射胰岛素,纳什不仅没有从幻听幻觉的世界中醒来,反而愈演愈烈。在艾丽西亚30年的精心照料下,纳什的病情逐渐稳定下来,并慢慢从疯癫中苏醒。



1994年

由于他与另外两位数学家(经济学家,约翰·C·海萨尼和莱因哈德·泽尔腾)在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,获得1994年诺贝尔经济学奖。



2001年

传奇而坎坷的人生经历,纳什传记被改编成电影《美丽心灵》,赢得包括最佳电影在内的4项奥斯卡奖项。

“这是一部制作得非常好的电影,而且取得了很高的艺术成就。我看过好几遍。不过,每次看的时候,我心里并不好受。但我还是认为这部电影有助于人们理解与尊重患有精神疾病的人。”   --约翰·纳什



2015年

纳什获得阿贝尔奖。阿贝尔奖的颁奖词中说,约翰•纳什的突破已发展成应用广泛、功能强大的数学方法,成为研究非线性偏微分方程的关键工具,其影响遍及该理论的所有分支。


2015年5月24日

约翰·纳什夫妇遇车祸,在美国新泽西州逝世。


张维迎在纳什去世后表示

对纳什最好的纪念就是

理解纳什均衡

学会运用博弈论分析社会问题


附:约翰·纳什1994年诺奖颁奖典礼获奖感言

“我一直相信数字、方程式和逻辑关系。因为它们总是为我指引真理。但在追求了一生的真理之后,我问自己,什么是真正的逻辑关系?真理又是有谁来决定?对于这些问题的思索让我经历了从生理上到精神上再到幻觉上的洗礼。


最终,我还是回到了现实中,我找到了一生中最重要的发现,在爱的支持下,任何逻辑关系和真理都会被发掘。今晚,我能在站在这里领奖都是因为你,你不离不弃的陪伴才成就了今天的我。你就是我的真理。”    —约翰·纳什



人生的意义不在于起点

也不在于终点

而在于你和命运博弈的过程

天才在左疯子在右

所有的非凡终将被成就

再次向这位伟大的数学家致敬!


约翰·纳什,摄于2006年科隆大学


编辑:Cherry.hu

参考资料:

1、https://movie.douban.com/review/8700666/

2、http://baike.baidu.com/view/52630.htm,百度百科:约翰·纳什 
3、http://baike.baidu.com/view/28460.htm,百度百科:纳什均衡 
4、http://www.vccoo.com/v/7074d4,一般人也能看懂的纳什均衡案例


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存