你必须知道的三个有趣而复杂的博弈论故事

原创 2015-11-16 聂辉华 聂氏政经评论

【导读】博弈论是最高深、也是最有趣的经济学分支。当满大街的人都知道“囚徒困境”时，掌握几个深奥的博弈论故事显然是迫在眉睫了！我在《经济学家茶座》上发表的大约50篇经济散文中，经济学故事讲得最好的三篇，我认为是今天这篇、11月初推送的《再论三个和尚没水喝——企业理论版》以及《挑战所罗门国王的智慧》（均可点击阅读）。这三篇文章巧妙地将高深莫测的经济学模型和通俗有趣的生活寓言结合起来，绝对是经济学中的战斗机！今天之所以忍痛推送第三篇，有两个原因。第一，我昨天在推文“两个经济学博士的对话（2-4）”中提到了“动态道德风险模型”，很多人表示不解。我必须提供一个高深但是浅显的解释。第二，我的新著《跟西游记学创业——一本人人都要读的管理秘籍》，继昨天在京东图书分类销售榜中排名第52位之后，今天居然逆风飞扬，冲到了第13名！因此，今天这篇文章就算给大家发福利了，赶紧收藏啊！剧透一下，这几天可能还有京东的“9.9元秒杀《西创》”优惠活动，请密切关注京东手机客户端，注意“秒杀”通知！

作者：聂辉华（中国人民大学经济学教授）

一、讲故事的四种境界

每一个经济学理论都对应着一个模型，每一个模型都是一个故事。例如，不完全契约理论的主要模型是敲竹杠模型，其代表性故事是哈特（Hart）和莫尔（Moore）在1990年的文章中提供的“大亨、船夫和厨师”的故事。因此，经济学家要想让自己的理论被人接受并广泛传播，就得会讲故事。讲故事的水平有四种境界：用简单的语言表达简单的道理；用复杂的语言表达简单的道理；用简单的语言表达复杂的道理；用复杂的语言表达复杂的道理。显然，第一种境界难登大雅之堂，因为简单的道理老百姓都懂，没必要让经济学家来讲述。第二种境界是用高射炮打蚊子——小题大做，经济学家做这种事情简直就是浪费民脂民膏。相信绝大多数人会推崇第三种境界，认为能用浅显易懂的语言讲述晦涩深奥的经济学理论才算是最高境界。诚然，能用简单的故事讲清楚复杂的理论是需要几分功力的。但是，复杂的理论之所以复杂，往往就是因为它很难用简单的语言讲清楚。在这种情况下，经济学家不得不用比较复杂的语言——除了文字还有数学模型或者图形——来表述，这就是第四种境界。世界本来就是复杂的，我们不能人为地将复杂的问题简单化。麻烦在于，即便用文字语言来表述复杂的道理，看上去这些故事还是晦涩难懂，而且通常比较无趣，当然不可避免地有失严谨。比如，在哈特等人和梯若尔（Tirole）等人关于不完全契约理论的基础的争论中，尽管涉及了一些故事，但是这些故事既不有趣，也无法让行外人看懂。不过，在经济学理论中，有少数故事既复杂又有趣。这一方面让经济学理论保持了阳春白雪般的尊崇，另一方面又贴近了一些下里巴人的口味。用复杂语言讲述的复杂理论往往一开始让人感到“意料之外”，但是最终又让人感到“情理之中”。我认为，这才体现了经济学理论研究的价值。若试图用简单语言来表述复杂故事，则往往只有“情理之中”的效果，而失去了“意料之外”的惊喜。复杂的理论也很有趣？是的。且看下面几个故事。

二、动态道德风险故事

净空法师的《了凡四训讲记》中有一个关于孔子及其弟子子贡和子路的有趣故事。话说春秋时期的鲁国，有许多平民被卖到诸侯家做奴仆。官府规定，如果有人愿意出钱为奴仆赎身，还其自由，就可以得到官府的奖金。子贡赎了一个奴仆却谢绝了官方的奖金，他以为这种高风亮节的行为一定会得到孔子的表扬。没想到孔子严厉地批评了他，“夫圣人举事可以移风易俗，而教道可施于百姓，非独适己之行也。今鲁国富者寡而贫者众。受金则为不廉，何以相赎乎？自今以后不复赎人于诸侯矣。”孔子的话非常深刻：规章制度是用于规范百姓行为，不是针对个人。如果都像你子贡这样“拾金不昧”，以后谁还有激励去做好人好事呢？后来，孔子的另一个学生子路救了一个落水的人，对方送给子路一头牛，子路欣然接受了。而孔子知道后也表扬了子路的行为，认为这将鼓励更多的鲁国人做好人好事。

按经济学的行话来说，上述故事暗含了一个动态道德风险模型。做好人好事就是一种道德风险行为，因为社会难以监督一个人何时该做，法律也不能强制一个人做到什么程度，即当事人可以隐藏自己的行动。但是一个人是否以及怎样做好人好事，这是可以激励的。在重复博弈中，当事人不仅要看短期的行为结果，而且要看长期的行为结果，即他必须进行动态优化。有趣的是，在静态条件下的好结果在动态条件下往往是坏结果，因此契约理论的前沿现在是动态契约模型，而动态模型通常都非常复杂。幸运的是，孔子及其两个弟子的故事有助于我们更好地理解动态道德风险模型。从短期来看，社会当然应该鼓励“拾金不昧”的行为，这是一种美德。但是从长期来看，如果好人做了好事却没有好报，那么最终就没有人有激励去做好人。毕竟，社会要引导人们做好人好事，只能激励，不能强制，也难以监督。这个复杂的动态道德风险模型之所以有趣，是因为乍看上去它否定了雷锋这个好榜样，这是“意料之外”的结论。但是仔细思考之后，我们又觉得它最终是在鼓励更多的雷锋出现——但不再是无偿的雷锋，这又是“情理之中”的结论。不过，请记住这是一个复杂的理论，它的结论绝非上述这个故事那么简单。从理论上讲，当事人的博弈次数、贴现因子以及跨期转移支付的能力都会影响到最终结论。忽略这些假设，就会人为地将复杂的问题简单化，会导致学术庸俗化，而不是学术通俗化。

在现实中，个人的工作业绩不仅取决于自身努力，还取决于很多外部因素，比如团队状况、市场行情和国际形势等，因此个人努力和工作业绩并不是完全一一对应的。用契约理论的术语来说，努力只是一阶随机优于（FSD）不努力。这种不确定性会导致道德风险问题，即努力并非总有好业绩，而偷懒未必总有坏业绩。上述动态道德风险的故事告诉大学毕业生，刚工作时不要太出风头，不要太卖命，要注重可持续发展。否则，一旦以后工作进度稍有落后，或者工作业绩增长速度减慢，老板可能会认为你骄傲自满，而实际上你仍然在努力，但却没有碰到好运气。正所谓“路遥知马力，日久见人心”，何必争一时？

三、动态逆向选择故事

众所周知，诺贝尔经济学奖得主科斯（Roase）的主要贡献体现在新制度经济学的“科斯定理”和“交易费用”两个核心概念上。实际上，科斯在产业组织理论上也有建树。他曾经提出了一个“科斯推测”（Coase，1972），认为一个生产耐用消费品的垄断厂商最终会将产品的价格降到完全竞争的水平，即垄断的产品以边际成本出售。这个过程就是所谓的“科斯动态学”（Coasian dynamics）。两位数理经济学大师哈特和梯若尔将这个idea模型化了，从而奠定了动态逆向选择模型的基础（Hart-Tirole，1988）。哈特和梯若尔的那篇文章发表在著名的RES（《经济研究评论》）上，数学模型相当复杂，即便用文字表述也比较费劲，但我在此愿意尝试一下。

科斯的逻辑是这样的：第一期，垄断厂商向消费者出售了一些耐用品。第二期，原来的消费者可以在二手市场上出售耐用品，与垄断厂商的新产品形成竞争，因此耐用品的价格将因为竞争而下降。在极端的情况下，如果垄断厂商卖出的耐用品足够多，并且耐用品的损耗率足够低（或者消费者的贴现因子足够高），那么在第二期垄断厂商就必须以边际成本的价格出售耐用品。垄断厂商最终以完全竞争的价格出售商品，这个故事有趣但并不复杂。因为从第二期开始，垄断厂商实际上已经不是垄断的了，它面临二手市场的竞争，而竞争当然会导致价格下降。哈特和梯若尔在科斯的基础上前进了一步，他们不仅考虑了供给方，而且强调了需求方。假定消费者有两种类型：高收入者和低收入者。垄断厂商可以制定一个高价格，这可以赚取高端消费者的钱，但也可能面临低端消费者而积压产品。高端消费者可以在一开始就购买，也可以坐等垄断厂商在第二期降价后购买。在这个复杂的动态逆向选择模型中，生产者和消费者都将使用混合策略，形成一个混合策略均衡。结论是：第一，如果垄断厂商能够做出不降价、不利用消费者类型信息的承诺，那么利润将相对最高。第二，如果垄断厂商不做出任何承诺，那么就如科斯所推测的那样，垄断产品的价格将逐步降低至边际成本。但是，出售比出租的利润要高，因为出租意味着垄断厂商可以利用以往的购买信息，分辨出消费者的类型，从而重复地榨取消费者剩余，而消费者会通过减少购买来避免这种结果。第三，如果厂商和消费者之间可以签订长期契约并允许再谈判，那么出租和出售都是一样的，并且价格将逐步收敛到边际成本。

这个复杂的动态逆向选择模型告诉我们什么有用的道理呢？首先，提供耐用品的垄断厂商不能培养自己的潜在竞争对手，以免它们成为自己的“掘墓人”。例如，一些产品（如邮票、手机和书籍）发行“限量版”，实际上就是减少新产品所面临的来自二手市场的竞争。其次，垄断厂商可以改变消费者的贴现因子，具体做法就是对新产品稍加改进，迫使耐用品不再“耐用”，打压二手市场。例如，美国的经济学教科书不断翻版，特别是萨缪尔森的《经济学》已经更新到了第十七版。其实，每个版本之间差别并不是很大。出版商鼓励作者翻新，并免费赠送样书、习题以及配套幻灯片给任教老师和助教，就是要减少旧书的竞争压力。国内的出版社还没有普及这种商业手段，但我本人对此比较反感。因为中国学生收入低，何苦压榨他们的消费者剩余？再次，厂商要向消费者承诺不持续降价，或者对原来的购买者进行补贴。在电器市场上，我们看到商家会在节假日宣布打折，或者赠送礼品，但不会常年打折。而且，有些家电还可以旧换新，这就减少了消费者坐等降价的观望态度。最后，有时掌握更多信息不一定是好事。垄断的出租者可以利用消费者类型的信息反复剥夺消费者剩余，这导致出租不如出售。作为一个组织的领导，不应过于利用下属的优点来不断给任务加码，这会导致“鞭打快牛”的不良局面。轮岗就是避免上司利用下属类型信息的一种方式。

四、坏声誉故事

静态博弈容易导致代理人的短期行为，同时委托人难以获得关于代理人类型或行为的信息。在重复博弈中，代理人为了长期利益会在一定时期内“伪装”成好的类型，委托人也可以利用更多信息来更新对代理人类型的判断，这就是所谓的声誉效应。总之，好的声誉机制可以使坏人变好。有趣的是，声誉并不总是好的，有时代理人为了赢得好的声誉，反而会做出对委托人不利的事情。此时，坏的声誉机制可以使好人变坏！

依莱等人（Ely等，2003，2008）提供了一个坏声誉模型的有趣故事。在一个高速公路上有一个汽车维修店。车主一旦发现汽车出了毛病，知道汽车或者需要大修（50%概率），或者需要小修（50%概率）。但是车主并不准确地知道自己的汽车究竟需要哪种维修，只有修理工知道汽车的真实状况。修理工有两种类型：好的修理工总是根据汽车的真实状况来决定大修还是小修，而坏的修理工则总是选择大修，因为这样带来的利润更高。在不了解车况以及修理工类型的前提下，车主唯一拥有的信息是以往的修车记录，他据此来判断修理工的好坏。如果他发现修理记录上大修的记录超过50%，那么他就倾向于认为修理工是坏的概率更高，反之则认为更低。在这种声誉激励下，修理工为了表明自己是一个好的修理工，就会尽量减少大修，增加小修，而这实际上偏离了汽车的真实维修需求。在极端的情形下，修理工干脆全部小修。而车主一旦意识到这点，就会认定修理工肯定不负责，也就不再来修车了。你看，声誉激励居然是负面的。这个故事的亮点在于，它反弹琵琶出新意，但是又合乎情理，并且在逻辑上丝丝入扣。

这个坏声誉故事其实在生活中广泛存在。例如，一个教授在办公室整夜写文章，第二天白天有点犯困了，就在电脑上看一会电影。假如不幸此时领导刚好经过该教授办公室，就会认定该教授不务正业。预料到这种结局，教授们就不会再加班，工作效率反而降低了。可见，作为领导，评估下属时一定要考虑全面和长远的绩效，避免短视的考核方式。如今，中国的科研论文发表数量世界第一，但是有几篇产生了重大影响呢？注重数量而忽视质量，关注短期而忽视长期，这难道不值得反思吗？

本文发表于《经济学家茶座》，总第51辑，发表时题为《复杂的故事也很有趣》，作者现为中国人民大学国家发展与战略研究院副院长、经济学院教授和博导。图片来自网络。

想看更多有趣、有理、有用的经济学故事？想看看世界著名华人经济学家、经济学界的“怪侠”黄有光教授眼里的“怪书”吗？请订购聂辉华教授的《跟<西游记>学创业——一本人人都要读的管理秘籍》，这是中国第一本企业理论通俗读物，中国人民大学出版社9月出版，中央电视台财经频道专门推荐，世界著名华人经济学家黄有光教授、共识网总裁周志兴先生等人联袂推荐。人大出版社天猫店和微店特意推出签名版，仅售100本，不加价；普通版在京东、当当、亚马逊、天猫等各大网站热销，点击左下方“阅读原文”进入京东页面直接购买。

警察殴打打人学生，舆论撕裂的背后

大摩宏观策略谈：2025中美变局展望

假设，你遇到麦琳怎么办？

董事长两口子不干了，至暗时刻谁是白衣骑士

2024年心理咨询师报名通道开启！可考心理证书，无需辞职，名额有限，11月30日截止报名！！！