什么是博弈论 | 集智百科
本词条由集智俱乐部众包生产,难免存在纰漏和问题,欢迎大家留言反馈或者前往对应的百科词条页面进行修改,一经修改,可以获得对应的积分奖励噢!
目录
六、编者推荐七、集智百科词条志愿者招募
博弈论 Game Theory( 亦称对策论或赛局理论) 是研究理性决策者之间战略互动的数学模型 Mathematical models ,是研究具有斗争或竞争性质现象的理论和方法。博弈论既是现代数学的一个新分支,也是运筹学的一个重要学科,在社会科学 Social science 、逻辑学 Logic、系统科学 Systems science和计算机科学 Computer science 中也有应用。博弈论最初产生于零和游戏 Zero-sum game(也称零和博弈),在这种游戏中,赢家的利润来自于输家的亏损,每个参与者的收益或损失由其他参与者的损失或收益来平衡,各方损益总和永远为“零”。今天,博弈论适用于广泛的行为关系,已成为人类、动物和计算机逻辑决策科学的总称。
现代博弈理论始于双人零和游戏 Zero-sum games 中的混合策略 mixed strategy 均衡思想以及约翰·冯·诺依曼 John von Neumann 对该思想的论证。约翰·冯·诺依曼 John von Neumann使用连续映射到紧凸集 Convex set 的布劳威尔不动点定理 Brouwer fixed-point theorem ,建立了博弈论和数学经济学 Mathemastical economics 的标准方法。他的论文发表之后,又于1944年与奥斯卡·摩根斯腾 Oskar Morgenstern 合著了《博弈论与经济行为 Theory of Games and Economic Behavior》 一书,该书考虑了多人博弈。这本书的第二版提供了一个公理系统的预期效用,它允许数学统计学家和经济学家处理在不确定情况下的决策。
20世纪50年代,众多学者将博弈论发扬光大;到了70年代,博弈论在生物学 Biology 中崭露头角 ,类似的发展历程至少可以追溯到30年代。博弈论作为一种重要的工具在许多领域得到了广泛的认同。1999年, 约翰·梅纳德·史密斯 John Maynard Smith 因将博弈论应用于生物学而被授予克雷福德生物科学奖 Crafoord Prize 。在他一生的学术研究中,其最突出的贡献在于将博弈论的分析方法引入到生物演化过程中的竞争行为和选择问题,并对群体行为变化的动力学机制进行相关分析。2014年,诺贝尔经济学奖 Nobel Memorial Prize in Economic Sciences 授予博弈论学家让·梯若尔 Jean Tirole 。其后又有11位博弈论学家获得了诺贝尔经济学奖。
历史背景
有一种理论认为 James Waldegrave 才是真正的作者,但这还有待证实。在这封信中, James Waldegrave 为法国的一种纸牌游戏 le Her提供了一个极小极大的混合策略解决方案,这个方案现在被称为瓦德格拉夫问题 Waldegrave problem 。1838年,安东尼·奥古斯汀·库尔诺 Antoine Augustin Cournot 在《财富理论的数学原理 Principes de la Théorie des Richesses 》 一书中考虑了双寡头垄断,并提出了一个解决方案,即博弈论中的纳什平衡 Nash equilibrium 。
1913年,恩斯特·泽梅罗 Ernst Zermelo 发表了《关于集合论在国际象棋博弈理论中的应用 On a Application of Set Theory to the Theory of the Game of the Chess》 ,证明了最优的国际象棋策略是严格确定的。这为定理的一般化铺平了道路。
1938年,丹麦数学经济学家弗雷德里克·祖恩 Frederik Zeuthen 利用布劳威尔不动点定理 Brouwer's fixed point theorem ,证明了数学模型具有获胜策略。在波莱尔 Emile Borel 1938年的著作《哈萨德的应用 Applications aux Jeux de Hasard》 和更早的笔记中,Borel 证明了当收益矩阵是对称时, 二人零和矩阵对策的极大极小定理,并提供了一个非平凡无限对策的解(在英语中称为Blotto博弈)。Borel推测有限二人零和博弈中不存在混合策略均衡,这一猜想被约翰·冯·诺依曼 John von Neumann 证明是错误的。
直到1928年约翰·冯·诺依曼 John von Neumann 发表了关于战略博弈论的论文,博弈论才真正成为一个独立的研究领域。约翰·冯·诺依曼 John von Neumann的原始证明采用了布劳威尔关于连续映射到紧凸集的布劳威尔不动点定理 Brouwer fixed-point theorem。该种方法成为研究博弈论和数理经济学的标准方法。随后,他在1944年与奥斯卡•摩根斯坦 Oskar Morgenstern 合著了《博弈论与经济行为 Theory of Games and Economic Behavior》 一书。 这本书的第二版提供了一个不言自明的效用理论,它将丹尼尔·伯努利 Daniel Bernoulli 的旧的效用理论(与金钱相关)转变为一个独立的学科。约翰·冯·诺依曼 John von Neumann在博弈论方面的工作突出反映在这本1944年出版的书中。这项基础工作包含了为二人零和博弈找到相互一致解的方法。随后的工作主要集中在合作博弈 cooperative game 理论上:假设群体中的每个个体能够执行他们之间关于适当策略的协议,这个理论将分析个体的最佳策略。
1950年,关于囚徒困境 prisoner's dilemma 的第一次数学讨论出现了。作为兰德公司 RAND Corporation研究博弈论的一部分,著名数学家梅里尔M.弗拉德 Merrill M. Flood 和梅尔文德雷舍尔 Melvin Dresher 进行了一项实验。兰德之所以进行这些研究,是因为它们可能应用于全球核战略。
相关成果
20世纪70年代,博弈论在生物学中得到了广泛的应用。这在很大程度上归功于约翰·梅纳德·史密斯 John Maynard Smith 在进化稳定策略方面的工作。此外,他还介绍并分析了相关均衡 Correlated equilibrium 、颤抖手完美 Trembling hand perfection 、和共同知识 Common konwledge 的概念。
2005年,博弈论学家托马斯·谢林 Thomas Schelling 和罗伯特·奥曼 Robert Aumann 紧随 John Forbes Nash 、塞尔滕 Selten 和哈萨尼 Harsanyi 之后,获得了诺贝尔奖。Schelling 研究的是动态模型,即演化博弈理论 Evolutionary game theory的早期例子。Aumann对均衡学派的贡献更大,他引入了均衡粗化和相关均衡,并对共同知识的假设及其结果进行了广义形式上的分析。
2007年,莱昂尼德•赫维奇 Leonid Hurwicz 、埃里克•马斯金 Eric Maskin 和罗杰•迈尔森 Roger Myerson 由于为机制设计理论奠定了基础而被授予诺贝尔经济学奖。其中,Myerson的贡献包括提出适度均衡的概念以及一篇重要的毕业论文《博弈论,冲突分析》;Hurwicz介绍并正式提出了激励相容 Incentive compatibility 的概念。
2012年,阿尔文• E •罗斯 Alvin E. Roth 和劳埃德•沙普利 Lloyd S. Shapley 因“稳定配置理论和市场设计实践”而获得诺贝尔经济学奖。2014年,让•梯若尔 Jean Tirole 因其在市场力量和监管的分析取得重大发现而荣获诺贝尔经济学奖 。
博弈类型
合作/非合作
合作博弈通常是通过合作博弈理论的框架来分析的。该理论侧重于预测哪些联盟将会形成,群体采取的联合行动以及由此产生的集体收益。它与传统的非合作博弈论不同。(传统的非合作博弈论侧重于预测个体的行为和结果,以及分析纳什平衡)。合作博弈论提供了一种高层次的方法,因为它只描述联盟的结构、战略和收益,而非合作博弈论还研究议价过程影响联盟内收益分配的因素。由于非合作博弈论具有更广泛的适用性,合作博弈可以通过非合作博弈论(逆向不成立)的方法进行分析。前提是作出充分的假设,以涵盖由于合作外部实施的可能性而可能存在的所有策略。因此,尽管在一个非合作框架下表达所有博弈是最佳做法,但在许多情况下,会由于没有足够的信息准确地模拟战略谈判的过程,或由此产生的模型过于复杂,而无法为运用在现实世界中提供较为实用的工具。在这种情况下,合作博弈理论提供了一种简化的方法,该方法允许对整个博弈进行分析,而不必对议价能力做出任何假设。
对称/非对称博弈
非对称博弈是研究最多的是两个博弈者的策略不相同的博弈。例如,最后通牒博弈 Ultimatum game和类似的独裁者博弈 Dictator game 对每个玩家都有不同的策略。然而,对于一个博弈,两个玩家的策略可能是相同的,但是不对称。例如,上图所示的博弈尽管两名玩家的策略设置相同,但是收益是不对称的。
零和/非零和博弈
博弈论学者研究的许多博弈(包括著名的囚徒困境 Prisoner's dilemma )都是非零和博弈,因为结果的净结果要么大于零,要么小于零。不太正式的说法为:在非零和博弈中,一方的收益不一定对应另一方的损失。
常和博弈对应的是盗窃和赌博等活动,而不是从贸易中获得潜在利益的基本经济形势。通过添加一个虚拟玩家来补偿玩家的净赢利,可以将任何博弈转化为(可能是不对称的)零和博弈。
同时/序贯博弈
序贯博弈 Sequential games (或动态博弈)是后期玩家对早期动作有一定了解的博弈。这不需要早期玩家每一个动作的完全信息 Perfect information ;它可能是非常少的知识。例如,一个玩家可能知道前面的玩家没有执行某个特定的动作,但他/她不知道第一个玩家实际上执行了哪些其他可用的动作。序贯博弈就像一棵大树生根发芽一样从初始点向前推进,最终形成的博弈树就是用来分析均衡策略的工具,从终点结沿着树枝向前逆推,最终的得出最优策略,就是逆推均衡。很知名的例子大概是IBM开发的计算机“深蓝”打败了国际象棋大师的故事。但这方法未必总行得通,因为博弈的前提是假设每个参与人都是理性人,终极价值追求就是个人的最大收益,而现实中人的行为模式可要复杂多变得多。
同时博弈和序贯博弈之间的区别体现在上面讨论的不同表现形式中。通常,标准形式用于表示同时博弈,而扩展形式用于表示序贯博弈。泛化向范式的转换是同一种方式,即多种泛化形式的博弈对应于同一范式。因此,同时博弈的均衡概念不足以推出序贯博弈。
序贯博弈 | 同时博弈 | |
---|---|---|
表示形式 | 决策树 | 支付矩阵 Payoff matrix |
对手先前 | Yes | No |
时间先后 | Yes | No |
其他 | 扩展式赛局 | 策略博弈Strategic game |
许多纸牌游戏是不完美信息博弈,如扑克和桥牌。 完美信息博弈经常与完全信息博弈相混淆。完全博弈要求每个玩家都知道其他玩家可以使用的策略和收益,但不一定知道所采取的行动。而完美信息博弈指一个参与人对其他参与人(包括自然)的行动选择有准确了解的情况,即每个信息集里只包含一个值。不完美信息博弈可以通过引入自然波动 Moves by nature 的概念来进行简化。
组合博弈
完美信息博弈已经在组合博弈论 Combinatorial game theory 中得到研究,发展出新颖的表示法,例如超现实数字 Surreal numbers ,以及利用组合和代数(有时是非构造性的)的证明方法来解决特定类型的博弈,包括可能导致无限长移动序列的“环形”博弈。 比起传统意义上的博弈理论,该方法解决的博弈问题具有更高的组合复杂性,一个典型例子就是“十六进制博弈”。博弈复杂性是借鉴计算复杂性理论来估计计算困难程度,从而寻找最佳策略的一个相关研究领域。
人工智能的研究已经解决了完美和不完美信息博弈。这些博弈具有非常复杂的组合结构(如国际象棋、围棋或西洋双陆棋) ,但尚未找到(可证明的)最优策略。实际的解决方案包括计算启发式算法,如 阿尔法贝塔剪枝 Alpha–beta pruning 或使用由强化学习训练 Reinforcement learning 的人工神经网络 Artificial neural networks ,这使得博弈在计算实践中更易于处理。
无限长博弈
在无限长博弈中,人们的注意力通常不是集中在玩这种游戏的最佳方式上,而是集中在一个玩家是否有制胜的策略上。(根据选择公理,我们可以证明,有些游戏,即使信息完美,结局只有“赢”或“输”,但双方都没有获胜的策略。)对于设计巧妙的博弈而言,这种策略在描述集理论中有着重要的影响。
离散和连续博弈
差分博弈 Differential games 适用于在真实世界中经常遇到环境、状态、行为都处于连续空间的情况。这时一般选择用差分方程来表达连续空间。在此类博弈中,终止时间是具有给定概率分布函数的随机变量。因此,参与者最大化了成本函数的数学期望。结果表明,改进的优化问题可以转化为无穷时间区间上的一个折现差分博弈。
连续追逐和逃避等差分博弈是一类状态变量的演化受差分方程控制的连续博弈。差分博弈中最优策略的求解问题与最优控制理论密切相关。特别地,有两种类型的策略:使用Pontryagin极大值原理 The Pontryagin maximum principle 发现开环策略,而使用Bellman动态规划方法 Bellman's Dynamic Programming 发现闭环策略。
演化博弈理论
在生物学中,这样的模型可以代表(生物)进化,在这种进化中,后代采用父母的策略,而采用更成功策略的父母(即与更高的回报相对应)有更多的后代。在社会科学中,这样的模型通常代表了玩家在一生中多次玩游戏,并偶尔有意或无意地调整策略。
随机博弈(以及与其他领域的关系)
对于某些问题,不同的随机博弈建模方法可能导致不同的解决方案。例如,马尔可夫决策过程MDPs 和最大最小解Minimax solution解决方案之间的区别在于后者考虑的是一系列对抗性动作的最坏情况,而不是在给定一个固定概率分布的情况下对这些动作作一个预判。在不确定性的随机模型不可用的情况下,最大最小解解决方案可能是有利的,但也可能高估极不可能(但代价高昂)发生事件的可能性,如果假设对手可以强行让这样的事件发生,则会极大地影响了战略。关于这类模型问题,特别是与预测和限制投资银行业的损失有关的问题,请参阅黑天鹅效应的更多讨论。
一般模型也研究了随机博弈的所有元素、对手、和局部或噪声可观察性(其他参与者的行动)。“黄金标准 gold standard”被认为是部分可观测的随机对策 Partial Observable Stochastic Game(POSG) ,但很多能在 POSG 中表示的现实问题却无法在计算上实现。
元博弈
亚对策分析 metagame analysis 这个术语也用来指奈杰尔 · 霍华德 Nigel Howar 开发的一种实用方法。在这种分析方法中,将一种情况框定为一种战略博弈,然后在博弈中,利益相关者试图通过他们可作出的选择来实现他们的目标。后来在逐步发展中使对抗分析 Confrontation analysis 得以提出。
台球博弈论
平均场博弈论
博弈表示形式
合作博弈多以特征函数形式出现,而非合作博弈则以广义形式和标准形式出现。
广义形式
广义形式还可以捕捉到同时博弈和不完美信息博弈。为了表示它,要么用虚线连接不同的顶点以将它们表示为同一信息集合的一部分(即参与者不知道它们在哪一点),要么在它们周围绘制一条闭合线。
标准形式
假定每个玩家同时行动,或者至少在不了解对方行动的情况下行动,此时会以标准形式呈现博弈;如果玩家对其他玩家的选择有一些了解,此时会以广义形式呈现博弈。每个扩展形式的博弈都有一个等效的规范博弈,但是,转换为标准形式可能会导致表示形式的大小呈指数级膨胀,从而不能进行计算。
特征函数形式
替代形式
应用领域
除了用于描述,预测和解释行为外,博弈论还被用于发展道德或规范行为的理论以规范人们的行为。在经济学和哲学中,学者们运用博弈论来帮助理解良好或适当的行为。这种类型的博弈论论证可以追溯到柏拉图 Plato 。博弈论中的化学博弈论 Chemical game theory ,它将玩家的选择比作称为“知识分子”的化学反应分子,将博弈结果计算为化学反应系统的平衡解。
描述和建模
然而,经验工作表明,在一些经典博弈中,例如蜈蚣博弈 Centipede game ,“猜均值的2/3”游戏 Guess 2/3 of the average game 和独裁者博弈 Dictator game ,人们通常不会完全按照纳什均衡的模式进行游戏。目前正在对这些实验的重要性以及对实验的分析是否能充分反映出相关情况的各个方面进行相关讨论。
在约翰·梅纳德·史密斯 John Maynard Smith 和乔治·R·普莱斯 George R. Price 的工作之后,一些博弈论者转向演化博弈理论以解决这些问题。这些模型假定参与者没有理性或有限理性。尽管称为演化博弈理论,但演化博弈理论并不一定假定生物学意义上的自然选择。演化博弈理论既包括生物进化也包括文化进化,还包括个体学习的模型(例如,虚拟游戏 Fictitious play)。
规范性与规范性分析
经济与商业
一篇关于经济学中的博弈论的原型论文首先展示了一个抽象的特定经济形势下的博弈。选择一个或多个解概念,并证明所提出的对策集是适当类型的均衡。人们自然会想,这些信息应该有什么用呢?经济学家和商业教授提出了两种主要用途(如上所述):描述性和规范性。
项目管理
Piraveenan总结说,二人博弈主要用于对项目管理场景进行建模,根据这些玩家的身份,在项目管理中使用了五种不同类型的博弈。
政府部门-私营部门的博弈(模拟公私合营的博弈)
承包商-承包商博弈
承包商-分包商博弈
分包商-分包商博弈
涉及其他玩家的博弈
政治学
安东尼.唐斯 Anthony Downs 将博弈论应用于组织科学。在他的《民主的经济理论 An Economic Theory of Democracy》 一书中,他将霍特林的公司选址模型应用到政治上。在唐斯模型中,以投票选举为例,若收益大于成本,那就收集信息、投票,反之就不投票。唐斯首先展示了如果选民充分了解某位候选人的信息,(对于投票人而言,投谁的票主要依据自己所掌握的有关候选人的信息,至于是否收集信息、投票,那就取决于预期从这些活动中能获取的收益与付出的代价。),选民就更偏好于选择该候选人;但当选民数量和候选人数量增加时,可能出现收益很低而投票成本很高的情况,此时理性的选民就会选择不去投任何候选人的票。博弈论在1962年在约翰·肯尼迪 John F. Kennedy 总统任期内应用于古巴导弹危机 Cuban missile crisis 。
也有人提出,博弈论可以解释任何形式的政治政府的稳定性。以最简单的君主制为例,就拿君主政体最简单的例子来说,国王只有一个人,他不能也不可能通过亲自对所有甚至任何数量的臣民进行实际控制来维持他的权威。相反,而主权控制则是通过让每个公民都认识到,所有公民都希望彼此将国王(或其他已建立的政府)视为服从其命令的人。为了取代国王而进行的公民之间的商量交流实际上是被禁止的,而因为策划阴谋以夺取君主的王位的行为通常会被视为犯罪而受到惩罚。因此,在一个可以通过囚徒困境变体建模的过程中,我们得出该结论:在稳定时期,即使所有公民都知道如果所有人都集体行动会更好,也不会有公民去取代主权(国王/已建立的政府)。
对于民主制,博弈论的解释是:民主国家会向其他国家传递关于其意图清晰且可信任的信息。相反,对于非民主国家来说,我们很难知道非民主领导人的意图,也不知道如果让步将会有什么后果以及是否能够兑现诺言。因此,如果争端中至少有一个当事方是非民主国家,就会有不信任和不愿意让步。
另一方面,博弈论预测,即使两国领导人意识到战争的代价,它们仍然可能会发动战争。战争可能源于信息不对称;两国可能错误估计他们所拥有的军事资源的数量,从而使它们无法在不诉诸战斗的情况下达成和解。而且,战争可能是由于承诺问题而引起的:如果两个国家希望通过和平手段解决争端,但每个国家都希望对方满足自己之前所提出的条件,那么他们别无选择,只能诉诸战争。最后,因为不可调和的争端也可能导致战争。
当有新的政策或法律要在国家实行时,博弈论也可以帮助预测政策/法律实行后的情况。一个例子就是彼得·约翰·伍德 Peter John Wood(2013)的研究,当时他研究了国家可以采取哪些措施来减少气候变化,提出可以通过与其他国家达成减少温室气体排放的条约来实现。但是,他总结说,这个想法行不通,因为这将给各国带来类似像囚徒困境的困扰。
生物学
在生物学中,博弈论被用作一种模型来理解许多不同的现象。它首先被用来解释约1:1的性别比例的稳定性。费希尔 Fisher(1930)认为1:1的性别比是进化力量作用于个体的结果,因为这保证了他们的后代数量的最大化。
梅纳德•史密斯 Maynard Smith 在《进化论与博弈论 Evolution and the Theory of Games》一书的序言中表示,“矛盾的是,事实证明,博弈论更容易应用于生物学,而不是它最初所涉及的经济行为领域”。演化博弈理论已经被用来解释自然界中许多看起来不协调的现象。
其中一种现象被称为生物利他主义。在这种情况下,一种生物体的行为方式似乎有利于其他生物体,但有害于自己。这不同于传统的利他主义观念,因为这种行为是无意识的,似乎是为提高整体适应性而产生的一种进化。这样的例子可以在以下物种中找到: 吸血蝙蝠将它们从夜间狩猎中获得的血液回流给未进食的群体成员; 工蜂照顾蜂王一辈子,从不交配; 黑长尾猴警告猴群有捕食者靠近,即使这样做会危及到个体生存。所有这些行动都增加了一个群体的整体适应性,但是个体却付出了代价。
演化博弈理论用亲缘选择的观点来解释这种利他主义。利他主义者区别对待他们所帮助的人和亲戚。 汉密尔顿定律 Hamilton's rule 用方程式c<b×r,解释了这种选择背后的进化原理,即利他主义者的成本 c 必须小于利他主义者的收益 b 乘以关联系数 r。两种有机体的亲缘关系越密切,利他主义的发生率就越高,因为它们有许多相同的等位基因。这意味着利他的个体,通过确保其近亲的等位基因能够通过其后代的存活而进行传递时,就会放弃拥有后代的选择。例如,帮助兄弟姐妹(在二倍体动物中)的概率为1 / 2,因为(平均而言)每个个体在其兄弟姐妹的后代中分享1 / 2的等位基因。在确保兄弟姐妹的后代很大概率能够存活并且繁衍后,就排除了利他主义个体繁衍后代的必要性。该系数值很大程度上取决于竞争环境的范围:例如,如果选择的对象包括了所有的遗传生物,那么我们就假设所有生物之间的差异只占了生态环境多样性的1%,那么对于更小的生存空间,关联系数就会由0.5变成了0.995。同样地,如果认为非遗传性质的信息(如表观遗传学、宗教、科学等)会随着时间的推移而持续存在,那么竞争环境就会变得更大,差异也会更小。
计算机科学与逻辑
另外,博弈论在线算法中也扮演了重要角色,尤其是 k -服务器问题,这在过去被称为具有移动成本和请求回答游戏的博弈。姚期智所提出的的原理是一种博弈论技术,用于证明随机算法,尤其是在线算法的计算复杂度的下界。
互联网的出现推动了在游戏、市场、计算机拍卖、点对点系统、安全和信息市场中寻找均衡的算法的发展。算法博弈论和算法机制设计将复杂系统的计算算法设计和分析与经济理论相结合。
哲学
博弈论也要求哲学家们从交互认识论的角度思考:集体拥有共同的信念或知识意味着什么,以及这些知识对主体之间相互作用所产生的社会结果有什么影响。在这一领域工作过的哲学家包括Bicchieri(1989,1993)、布莱恩·斯吉尔姆斯 Brian Skyrms(1990)、以及斯托纳克 Stalnaker(1999)。在伦理学上,有些人试图追寻托马斯·霍布斯 Thomas Hobbes 从自身利益出发推导道德的理论。既然像囚徒困境这样的博弈在道德和私利之间存在明显的冲突,那么解释为什么为了私利需要合作就是这个项目的一个重要组成部分。这一总体战略是政治哲学中一般社会契约观的组成部分(例如,参见戴维·哥梯尔 David Gauthier(1986)和卡夫卡 Kavka(1986))。其他作者试图用演化博弈理论来解释人类对道德的态度和相应的动物行为的出现。他们考察了包括囚徒困境 The prisoner's dilemma 、猎鹿博弈 Stag hunt 和纳什讨价还价理论 The Nash bargaining game 在内的几种博弈,为人们对道德的看法进行分析解释。
零售与消费品定价
在涉及到消费品定价时,零售市场继续发展博弈论的策略和应用。在分析受控环境中的仿真与现实世界中的零售经验之间时,我们发现,这种策略的应用更加复杂,因为每个零售商都必须在定价,供应商关系,品牌形象以及蚕食利润更高的产品销售潜力之间找到最佳平衡。
流行文化
基于Sylvia Nasar的关于Nash的著作诞生了电影《美丽心灵 A Beautiful Mind》(1998)。 1959年由罗伯特·海莱因 Robert A. Heinlein创作的军事科幻小说《小说星河战队 Starship Troopers》提到“games theory”和“theory of games”。在1997年的同名电影中,角色 Carl Jenkins 把他的军事情报任务称为“games and theory”。 1964年的电影《奇爱博士 Dr. Strangelove》讽刺了关于威慑理论 deterrence theory的博弈理论观点。例如,核威慑取决于是否一旦发现核攻击就威胁要进行灾难性的报复。博弈论者可能会争辩说,这种威胁可能是“不可信的” ,因为它们可能导致子博弈不完美的均衡 subgame imperfect equilibria。这部电影把这个想法又推进了一步,苏联不可逆转地做出了灾难性的核反应,而没有将这一威胁公之于众。 20世纪80年代强力流行 power pop乐队“博弈论(乐队)” 由创作歌手Scott Miller (流行音乐人)创立,他将乐队的名字形容为暗指“研究如何在对手面前计算出最适当的行动... ... 让自己失败的次数最少” 。 2005年的日本漫画《骗子游戏 Liar Game 》和2007年的电视剧《骗子游戏 Liar Game 》中,每一集的主要角色都有一个从博弈论中抽取出来的游戏或问题,从游戏中的角色运用的策略就证明了这一点。 Len Deighton,1974年的小说《间谍故事 Spy Story》探讨了关于冷战军队演习的博弈论元素。 维基百科博弈论链接 应用伦理学 Applied ethics 连锁店悖论 Chainstore paradox 化学博弈论 Chemical game theory 集体意向 Collective intentionality 组合博弈论 Combinatorial game theory 对抗分析 Confrontation analysis 博弈论词汇 Glossary of game theory 家庭内部讨价还价 Intra-household bargaining 金匠场景 Kingmaker scenario 法律与经济学 Law and economics 帕龙多的悖论 Parrondo's paradox 预防原则 Precautionary principle 量子博弈论 Quantum game theory 量子裁判游戏 Quantum refereed game 理性 Rationality 反向博弈论 Reverse game theory 风险管理 Risk management 自我确认的均衡 Self-confirming equilibrium 公地的悲剧 Tragedy of the commons 策尔梅洛定理 Zermelo's theorem 认知偏见列表 List of cognitive biases 新兴技术清单 List of emerging technologies 游戏理论中的游戏清单 List of games in game theory 人工智能概述 Outline of artificial intelligence
另请参阅
编者推荐
博弈论相关推文:
相关课程:
课程推荐:周亚:演化博弈与机制设计
https://campus.swarma.org/course/949
根据纳什的传记改编的电影:《美丽心灵》。
百科项目志愿者招募
作为集智百科项目团队的成员,本文内容由李欣儒,刘佩佩、陈关荣,Meng莫和费米子参与贡献。我们也为每位作者和志愿者准备了专属简介和个人集智百科主页,更多信息可以访问其集智百科个人主页。
在这里从复杂性知识出发与伙伴同行,同时我们希望有更多志愿者加入这个团队,使百科词条内容得到扩充,并为每位志愿者提供相应奖励与资源,建立个人主页与贡献记录,使其能够继续探索复杂世界。
如果你有意参与更加系统精细的分工,扫描二维码填写报名表,我们期待你的加入!
来源:集智百科
编辑:王建萍
点击“阅读原文”,阅读博弈论相关内容与参考文献