天才在左 疯子在右丨约翰·纳什和他的“纳什均衡”
无常命运中,坚守一颗美丽心灵
—题记
前几天被志玲姐姐结婚的消息刷了屏
据说很多人的高德导航语音包已经换成了郭德纲
小编印象深刻的是
林志玲言承旭这段感情中令人唏嘘的画面
和那种爱而不得的复杂表情
2015年,俩人隔空回应“好久不见”
在长达十六年的分分合合中
即便粉丝们操碎了心,认为俩人复合是最好的结果
纵使彼此相爱,俩人在各自权衡选择后,
仍没有做出“在一起”的决定,
这是不是算一种纳什均衡?
再来看著名的“囚徒困境”
两个小偷A和B联合犯事被警察抓住。两嫌疑人之间有了一场博弈,如下图所示:
电影《美丽心灵》海报
纳什以他在博弈论领域的成就著称于世,他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事等领域。其曾患有长达30年的精神分裂,晚年为普林斯顿大学的资深研究数学家。
博弈论
博弈论属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。它被认为是20世纪最伟大的经济成果之一。
博弈论之父—冯诺依曼
1928年,冯-诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯-诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950-1951年,约翰·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。其开创性论文《n人博弈的均衡点》,《非合作博弈》等,给出了纳什均衡的概念和均衡存在定理。
纳什均衡定义
在非合作类博弈中,存在一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。
数学定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。
纳什均衡的另外几个典型案例
智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。但当小猪踩踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;大猪踩动了踏板,则有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半食物。
那么,两只猪各会采取什么策略?当然是小猪等在食槽边,而大猪不知疲倦地奔忙于踏板和食槽之间。因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪不会去踩动踏板,自己亲自去踩踏板还有点吃的,总比不踩强,所以只好去踩踏板。
硬币游戏
你正在图书馆无聊的发呆,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。
应该怎么玩这个游戏?
假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等(如果不相等,对方便会一直出正面或者反面,使得我们的利益最小),由此列出方程就是:
3x + (-2)(1-x)=(-2) * x + 1*( 1-x ) ,解方程得x=3/8;
同样,美女的收益,列方程-3y + 2( 1-y)= 2y+ (-1) * ( 1-y),解得y也等于3/8。
于是,我们就可以算美女每次的期望收益是:(1-y)(2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,也就是说,双方都采取最优策略的情况下,平均每次美女赢1/8元。
其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。
如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;
如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。
比如你用完全随机(1/2,1/2)策略,收益是1/2*(3/8 * 3 + 5/8 * (-2)) + 1/2(3/8 * (-2) + 5/8 * 1) = -1/8;
实际上,不论你用什么策略,你的收益都是-1/8,也就是说,随便玩一种策略,你都是在纳什均衡状态中的,所以,这个把戏你随便怎么玩,都是亏的的。
纳什均衡理论的影响
纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心,在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”
最后让我们来回顾下纳什坎坷而又传奇的一生
1928年6月13日
纳什在美国西福尼亚州出生
1948年
20岁,进入普林斯顿求学1950年
22岁,获得美国普林斯顿高等研究院的博士学位
1952年
年仅24岁的纳什于普林斯顿大学担任教职
1958年
29岁的纳什与物理系学生艾丽西亚步入了婚姻的殿堂
长达30年的病痛折磨
婚后的纳什逐渐显露出精神失常的症状,他因严重的幻听幻觉被确诊为精神分裂,心理干预、两次三番地注射胰岛素,纳什不仅没有从幻听幻觉的世界中醒来,反而愈演愈烈。在艾丽西亚30年的精心照料下,纳什的病情逐渐稳定下来,并慢慢从疯癫中苏醒。
1994年
由于他与另外两位数学家(经济学家,约翰·C·海萨尼和莱因哈德·泽尔腾)在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,获得1994年诺贝尔经济学奖。
2001年
传奇而坎坷的人生经历,纳什传记被改编成电影《美丽心灵》,赢得包括最佳电影在内的4项奥斯卡奖项。
“这是一部制作得非常好的电影,而且取得了很高的艺术成就。我看过好几遍。不过,每次看的时候,我心里并不好受。但我还是认为这部电影有助于人们理解与尊重患有精神疾病的人。” --约翰·纳什
2015年
纳什获得阿贝尔奖。阿贝尔奖的颁奖词中说,约翰•纳什的突破已发展成应用广泛、功能强大的数学方法,成为研究非线性偏微分方程的关键工具,其影响遍及该理论的所有分支。
2015年5月24日
约翰·纳什夫妇遇车祸,在美国新泽西州逝世。
张维迎在纳什去世后表示
对纳什最好的纪念就是
理解纳什均衡
学会运用博弈论分析社会问题
附:约翰·纳什1994年诺奖颁奖典礼获奖感言
“我一直相信数字、方程式和逻辑关系。因为它们总是为我指引真理。但在追求了一生的真理之后,我问自己,什么是真正的逻辑关系?真理又是有谁来决定?对于这些问题的思索让我经历了从生理上到精神上再到幻觉上的洗礼。
最终,我还是回到了现实中,我找到了一生中最重要的发现,在爱的支持下,任何逻辑关系和真理都会被发掘。今晚,我能在站在这里领奖都是因为你,你不离不弃的陪伴才成就了今天的我。你就是我的真理。” —约翰·纳什
人生的意义不在于起点
也不在于终点
而在于你和命运博弈的过程
天才在左疯子在右
所有的非凡终将被成就
再次向这位伟大的数学家致敬!
约翰·纳什,摄于2006年科隆大学
编辑:Cherry.hu
参考资料:
1、https://movie.douban.com/review/8700666/
2、http://baike.baidu.com/view/52630.htm,百度百科:约翰·纳什
3、http://baike.baidu.com/view/28460.htm,百度百科:纳什均衡
4、http://www.vccoo.com/v/7074d4,一般人也能看懂的纳什均衡案例