PCBI | 道德的进化——基于博弈论的答案
为什么有些人甘愿把自我利益放在一边,为群体服务,甚至做出自我牺牲?为了弄清这个道德难题,德国莱比锡马克斯•普朗克科学数学研究所的数学家Mohammad Salahshour尝试利用博弈论的工具解释了道德规范的出现。
具体来说,Salahshour想要的探究的问题是:为什么道德规范会存在?以及为什么我们会建立不同的道德规范?例如,有些规范提倡自我牺牲的行为(如帮助他人),而其他规范似乎与遏制自私没有多大关系(如着装规范)。
为了回答这些问题,Salahshour耦合了两个游戏:(1)经典的囚徒困境,在这个游戏中,两个玩家必须决定是为了小的奖励而合作,还是为了更大的奖励而背叛。这个游戏可以说是社会困境的一个典型例子,一个群体的整体成功需要个人无私的行为。在这个游戏中,与每个人都表现得无私的情况相比,如果一个群体中有太多的成员表现得自私,那么每个人都会损失。然而,如果只有少数人表现得很自私,他们可以得到比利他主义者更好的结果。(2)群体内决策的游戏,如协调任务、资源分配、领导者的选择或冲突解决。许多这样的问题最终都可以被归类为协调(如猎鹿博弈)或反协调问题(如雪堆博弈)。
图1 合作中的纳什均衡
囚徒困境(Prisoner's Dilemma):两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确凿,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。
猎鹿博弈(Stag Hunt game)源自启蒙思想家卢梭的著作《论人类不平等的起源和基础》中的一个故事。古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果一个猎人单兵优作战,一天最多只能打到4只兔子。只有两个一起去才能猎获一只鹿。从填饱肚子的角度来说,4只兔子能保证一个人4天不挨饿,而一只鹿却能让两个人吃上10天。
雪堆博弈(Snow Drift game)在一个风雪交加的夜晚,两人相向而来,被一个雪堆所阻,假设铲除这个雪堆使道路通畅需要的代价为c,如果道路通畅则带给每个人的好处量化为b。如果两人一齐动手铲雪,则他们的收益为R=b-c/2;如果只有一人铲雪,虽然两个人都可以回家,但是背叛者逃避了劳动,它的收益为T=b,而合作者的收益为S=b-c;如果两人都选择不合作,两人都被雪堆挡住而无法回家,他们的收益都为P=0。雪堆模型与囚徒困境不同的是,遇到背叛者时合作者的收益高于双方相互背叛的收益。因此,一个人的最佳策略取决于对手的策略:如果对手选择合作,他的最佳策略是背叛;反过来,如果对手选择背叛,那么他的最佳策略是合作。
纳什均衡(Nash equilibrium)意指在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。
很明显,在囚徒困境中,合作是没有回报的。从个人的角度来看,如果有足够的人无私地行动,自私行为是最好的选择。但是,采取自私行为的个人不能有效地解决协调问题,并且,会因为未能协调活动而损失大量的资源。如果把两个游戏的结果作为一个整体来考虑,并且让有利于合作的道德规范发挥作用,情况就会完全不同——囚徒困境中的合作会突然得到回报,因为第二个游戏中的收益超过了第一个游戏中的损失。
研究结果发现,在两个游戏相结合的过程中,不仅出现了合作行为,而且还出现了社会秩序。所有的人都从中受益,为此,道德行为会为个体带来回报。Salahshour报告说:"在我的进化模型中,一开始没有无私的行为,但由于两个游戏的耦合,出现了越来越多的道德规范,然后我观察到突然过渡到一个有很多合作的系统"。在这种"道德状态"中,一套协调规范的演化,帮助个人更好地协调他们的活动,也正是通过这一点,社会规范和道德标准才能出现。同时,协调规范有利于合作:合作原来也是一种对个人的奖励行为。一个道德体系的行为就像一个特洛伊木马:一旦出于个人的自我利益而建立道德规范,以促进秩序和组织,它也会带来自我牺牲的合作。
图2 系统随时间的进化
Salahshour希望通过自己的研究能帮助人们更好地理解社会系统,进而改善未来的生活。Salahshour解释说:"其他研究者也可以用我的博弈论方法来解释社交媒体中的社会规范的出现。在那里,人们在交换信息的同时做出战略决策,例如,支持谁或支持什么事业。同样,有两种动力同时在起作用:信息的交流和合作战略的出现。然而,它们之间的相互作用还没有得到很好的理解,但也许博弈论很快也会对这个热点问题有新的认识。”
参考文献