查看原文
其他

董志强:真实的人们如何博弈?

The following article is from 小谷围札记 Author 董Sir

作者简介:华南师范大学经济与管理学院副院长、教授。

本文原载于《经济学家茶座》2018年第3期(总第81辑)。


博弈是一种生活经验。一个生活经验丰富的人,即便不懂博弈论,也可以是博弈高手。反过来,如果一味推崇博弈理论,却忽略真实世界人们丰富的行为动机,就极可能犯下错误。经典的博弈论,假设个人只关心自己,追逐物质利益,会趋利避害,偏好稳定而行事极其理性。这都不是真实世界的故事。最近三四十年,越来越多的研究确认了如下几个重要的违反经典博弈论假设的事实,这些事实值得我们在现实博弈时谨记在心。

第一,人并不完全是自私自利的。

毫无疑问,人必须为自己争取利益,才能在生存竞争中为自己赢得更大优势。但是,成员都自私自利的群体,比之成员都不那么自私自利的群体,竞争力会弱得多。生物进化是在“个体-群体”两个层面进行的,个体层面的竞争要求个体充分自利,群体层面的竞争要求个体不那么自利。所以,群居的个体要形成社会,社会通过规范、文化等显在的或隐性的奖惩体系来惩恶扬善,排斥极端自私的个体。漫长的人类进化过程,是社会和个人的共同进化过程。个人行为塑造社会,但社会也为个人行为立下法则;共情、互爱、忠诚、守规、牺牲等等都写入了人类的基因。结果,在社会中生存的个人,不仅关注自己的利益,也会适当关心社会中他人的利益。人们通常愿意在一定程度和范围内牺牲个人利益去遵守道德规范或社会规则,即使这个程度和范围对于某些人来说非常小;极度自私和绝对私利导向的人,是很罕见的。

第二,人并非只关注物质利益。

人们的行为既受市场制度约束,也受非市场制度约束;既受正式制度约束,也受非正式制度(规范和社会文化等)约束。人们追求丰裕的物质利益,但也追求高尚的道德情操。在不同的环境或制度约束下,人们会考虑其行为的适宜性。比如,在情感领域,人们通常难以接受市场手段,正如金钱可以买到婚姻,但买不到爱情。婚前财产公证,本来有利于避免离婚财产争议,但现实中人们却很少进行此类公证,因为它常常被视为对婚姻没有信心的信号而不被接受。有研究表明,幼儿园为了防止家长迟到,而对迟到的家长罚款,反而导致更多家长迟到——因为没有罚款前,迟到的家长本来还心怀内疚,并尽量注意下不为例,而罚款之后,家长对迟到心安理得,因为他已花钱“购买”了迟到的权利。也有研究表明,采取经济激励,可能会降低志愿者的努力程度,因为志愿者并不愿意被人看作是“为了钱”。

第三,人并不总是能冷静而理性。

我们的大脑,有两套决策系统:“快思考”系统依赖直觉,反应快速但容易失误;“慢思考”系统基于深思熟虑,反映较慢但不易犯错。经验对于决策至关重要。结果是,真实的人在诸多重要决策上可能并非依靠理性分析,而是依靠直觉来做出的。诸如吃饭穿衣之类的日常生活琐事,天天会遭遇,时时可练习,日积月累的经验可把此类问题的决策技巧磨砺到最优;而一些人生大事,比如结婚生子,一生也经历不了几次,难有经验可循,所谓的深思熟虑到头来也不过是“大致”、“差不多”就行。可见,人们对重大问题的决策自以为更加慎重(他们确实也更慎重思考过),却未必比在日常琐碎问题的决策上更加理性,质量也未必更高。

第四,人们的偏好是情景依存的。

主流经济学观点假设,人们的偏好是稳定且独立于情景的。换言之,若我认为物A比物  B更好,那么我在任何状态下都会认为A比B好。这是很不靠谱的假设。读者不妨想想是否也有这样的经历:我决定上街去吃晚饭,在家时想着上街去吃粤菜而不是川菜,走到街头突然改变主意去吃川菜而不是粤菜。主流经济学会认为这种偏好逆转违背了偏好一致性公理,但我自己明白,在家和在街头情景不同了,我对川菜和粤菜的选择矛盾实际上不过是情景变化的结果而已。如果“偏好独立于情景”这一主流经济学观点真是对的,那么,若一个女孩会答应一个男孩的求婚,她应该无论在什么场合都会答应的,既然如此,那些坚持主流经济学这一假设的经济学家们,他们何必还要精心筹划一个浪漫的情景来求婚呢?

为什么要记住这些违背经典假设的事实?因为,理论毕竟不是现实,当理论运用于现实的时候,需要添加现实的“细节”才可能获得成功。正如亚里士多德在《形而上学》开篇即表达过的观点:经验使人成功,技术是让人明白为什么成功。懂得博弈理论,还需要充分考虑人类行为的各种现实“细节”,才可以在策略互动中做得更好。

譬如,既然人们的动机并非只看重经济利益,也看重道德情操,那我们就可以通过唤醒道德动机来改善人们的行为。道义劝告和教育的力量有时非常巨大的,甚至可能优于经济激励。依靠公开声明某个行为是反社会的,这一禁令可以与个体的价值观互补,保证人们在道德上不表现出反社会的行为,而不是象在传统激励的一些情形下挤出道德情感。

行为经济学家Dan Ariely等人做过一项实验。他们到加州大学洛杉矶分校招了一些学生,让他们做一个简单数学测试。测试一共有20道题,每道题都给出一组数字,让他们从中找出相加等于10的两个数。测试时间是5分钟,答得越多越好,然后让他们抽签。中签的可按照本人的成绩,每答对一道题就有10美元的奖励。实验要求一组同学将答卷直接交给实验主持人,这是控制组。另外一组则把答卷粉碎掉,只需报告实验主持人他答对了多少道题,很明显,这一组被试有作弊的机会。毫不奇怪,他们确实作弊了。实验的关键一招是,在实验开始之前,实验者要求一部分受试写出他们高中时读过的10本书名,其余的则要求写出《圣经》十诫的内容,记得多少写多少。做完实验的这一“回忆”环节,才让受试开始做数学题。实验结果表明,没有作弊机会的条件下,被试平均答对了3.1道题。在有作弊机会的条件下,回忆高中时代10本书的参与者平均(报告)答对了4.1道题。最重要的是,写下《圣经》十诫的学生,虽然有机会作弊,但是他们根本就没有作弊!他们的成绩与那些没有作弊机会的一组完全相同。

是《圣经》的教义影响了学生的诚实行为吗?事实上,很多学生记不清楚十诫有哪些。只能写出一两条和能写出十条的学生都表现出了诚实,这意味着鼓励人们诚实的并非十诫的条文本身,而是出于某种道德准则的深思。如果真是这样,我们就可以用道德准则来提高大众的诚实水平。

有兴趣的读者可以上网查查宁波鄞州高级中学图书馆的相关新闻报道,这个图书馆无人看护,却并无多少图书遗失,已被当作人们自发诚信行为的一个典型案例。我曾让朋友去这个图书馆拍下不少照片,发现这个图书馆虽然没有摄像头,也没有报警器,但却处处在唤醒人们的道德动机。图书馆入口处悬挂着“道之以法,齐之以礼,有耻且格”、墙上贴着不是其他图书馆常见的大大的“静”字,而是“图书馆无门,我把诚信门”、“显示读书轨迹,考量道德底线”、“尊重规则是对自我的尊重”……这个无人图书馆治理的成功,充分显示了道德准则确实有巨大的力量。

又譬如,既然人们的行为产生于快思考和慢思考两套决策系统,而符合经济逻辑的是慢思考系统,这意味着对人们的机会行为的治理也需区别其来源。刻意算计后的机会主义行为,运用经济手段加以治理是容易见效的;而仅仅处于无意识的机会主义行为,可能对经济治理机制反应就不会太敏感。譬如无意识说谎和欺骗,常常产生于理性算计之外的因素,对其治理有时用经济刺激之外的手段可能更见效。

一个有趣的例子是男厕所清洁的治理。我们很少见到动用经济手段(比如罚款)来强制上厕所的男人小便时不要飞溅到便池外,因为很难罚款监督。其实,也有一些出于“快思考”系统的治理手段。比如荷兰阿姆斯特丹的男士洗手间,每个小便池里都印着一只苍蝇的图案,在排水口附近偏左一点地方。设计者的意图在于刺激男士只对准一个方向“射击”,从而避免尿液四处横流。仅仅这样一个不起眼的设计,便胜过用经济刺激解决问题。原因在于,人们小便时射击方向常常是无意识的,经济逻辑并不适用。

对于司机超速我们如何控制?经济学家的答案是超速罚款,这也是现实中做法。但诺贝尔经济学奖得主Thaler在他和Sunstein的《Nudge》一书中提到一个有趣的例子:芝加哥市区的湖畔路由直行转入弯道,需要大家减速行驶,他们用的办法是,在到达弯道之前的路面上画上很多横向的平行线,刚开始平行线的间距相等,接近弯道时,间距变得越来越小,这样给看着路面的司机造成在加速的错觉,司机会不自觉地去踩刹车,车速就降下来了。这也是利用了“快思考”系统。

快思考和慢思考对于政策和制度设计是深有意蕴和启示的。不假思索的行为(快思考),不太权衡经济成本和收益,因而对经济激励可能不太敏感,采用经济激励之外的手段反而可以更有效地解决问题。对于深思熟虑的行为,它们常常是经济成本和收益权衡之后的结果,经济激励在对付这样的行为时,常常会效果显著。

再譬如,既然人们的偏好是情景依存的,人们会判断在特定场合特定的行为是适宜的抑或不适宜的,那么,对人们的机会主义行为的治理,还可以考虑从情景设计入手。一个常被提及的例子是,犯罪行为往往依赖于犯罪情景。对于预防犯罪,经济学提出的经典解决思路是增加街头的警力以及加大对违法者的惩罚。但是我们会发现,街头犯罪并不是处处常见,而是在某些区域比较集中。很明显,犯罪高发区域看上去就是犯罪高发区域的样子。不可否认,犯罪行为有理性的成份,甚至许多犯罪就是经过理性计算的,但是犯罪现场的情景也常常是影响犯罪行为的重要因素。斯坦福大学心理学教授Philip Zimbardo在1969年的实验提供了例证:两辆相同的汽车,将其中一辆停在加州帕洛阿尔托的中产阶级社区,而另一辆停在相对杂乱的纽约布朗克斯区。他把停在布朗克斯的那辆车的车牌摘掉,顶棚打开,结果当天就被偷走了。而放在帕洛阿尔托的那一辆,一个星期也无人理睬。然后,Zimbardo用锤子把那辆车的玻璃敲了个大洞。结果仅仅几个小时之后,它就不见了。我们完全有理由相信:房屋的修葺一新、街道的整洁,甚至警示的标语,都会对犯罪行为产生重要影响,因为对于潜在罪犯来说,在不同的情境中,他会得出适宜或不适宜从事犯罪行为的不同结论。文学作品中也出现过情景变化遏制犯罪动机的例子,不信可看看讽刺小说家O. Henry(1862-1910)广泛流传的短篇小说《警察与赞美诗》。

有利于唤醒道德动机的情景,将更有利于治理机会主义行为。而“情景”是可以塑造的。回到经济治理这样一个重要问题上来,人们的行为和态度会相互影响,形成反馈,最终会形成有利于或不利于遏制机会主义兴起的情景。比如,在一个组织中,如果派系林立,组织成员之间的信任就会淡薄,每个人都时刻提防着其他人的行为,这种提防行为加剧了组织成员之间的不信任,最终组织中机会主义行为大行其道。俗话说“风气不正”,这是一个糟糕的“情景”。相反,一个组织中成员之间更多是友好相处、坦诚相见,这种态度和行为会产生正反馈,组织中就更能基于集体利益采取行动,也更能避免集体行动的困境。人们一直认为,文化建设对于组织管理是重要的,其实本质上正是因为良好的组织文化可以作为一种“情景”影响其成员的偏好。

与情景依存偏好可以有紧密联系的,还包括最近三十年兴起的“社区治理”(community governance)概念。在治理机制的频谱上,一端是市场,另一端是政府,位于中间的便是社区。社区通过局部信息和同行压力来促进人们采取恰当的行为。特别是在出现社会互动性质或产品和劳务合约难以完备时,社区经常可以解决一些市场和政府束手无策的问题。其中的原因,一方面是高效的社群可以监督其成员的行为,使其对自己行为负责;另一方面,是社区可以获取到政府、雇主、银行及其他正式组织难以获取的分散的私人信息。除此之外,还有一个重要的方面,就是社区的文化、规范,是影响人们行为的最重要的因素之一:社区文化、规范等等塑造了特定的“情景”,让人们明白哪些行为在这个社区是适宜的和不适宜的。良好的社区文化和规范,将极大地遏制人们的机会主义行为。

最后,我想对读者说的是,博弈理论是理解矛盾冲突的工具,但是这个工具运用于现实的时候,还需要对人性有更深层的把握。绝对不能把对于人性的理解,停留在经典理论所持有的假设上面。理论的假设,是对人性的关键部分的浓缩概括,抽象掉了很多具体的“细节”信息。当理论运用于现实的时候,我们需要恢复对“细节”信息的考虑,才能更好地理解人类社会中的矛盾和冲突。


《经济学家茶座》87辑目录
皮建才:经济学需要关注什么类型的现实?
封进:实践与科研:凯恩斯给我们的启示
王军:经济学家眼里的美容
宋胜洲:“苹果”现象的经济学分析

《经济学家茶座》87辑购买渠道:京东商城
 https://item.jd.com/12998292.html

长按识别二维码

关注《经济学家茶座》公众号

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存