查看原文
其他

比特币史话·55 | 囚徒的困境(2): 纳什均衡

刘教链 刘教链 2023-01-30

(约翰·纳什,美国数学家。图片来源于网络)
前情回顾:
【连载】比特币史话 | 左右互搏(6) - 显卡的进击
【连载】比特币史话 | 左右互搏(8) - 算力中国造
比特币史话·54 | 囚徒的困境(1): 冯诺伊曼开创博弈论

正文:

囚徒困境问题的不可解在于它是一个“阳谋”。也就是说,在整个博弈结构对于参与者完全公开透明的情况下,他们的理性决策仍然会导向对他们整体而言最不利的结局。

正如对上文的甲、乙二人而言,他们每个人经过分析都会发现,无论另外一个同伙如何选择,自己的最优选择都是坦白。若同伙坦白,自己坦白比抵赖要少2年刑期。若同伙抵赖,自己坦白较抵赖可免于1年关押。怎么看都是选择坦白的好。

在某一博弈结构中,对任意一个参与者而言,单方面改变策略都不能让自己获得更大收益,那么这个博弈结构就叫做“纳什均衡”(Nash equilibrium)[1]。

1951年,美国数学家约翰·纳什(小约翰·福布斯·纳什, John Forbes Nash Jr., 1928-2015)发表了名为《非合作博弈》的文章,定义了包含有限行为集合的任意博弈的混合策略纳什均衡,并证明在这种博弈中至少存在一个纳什均衡。根据纳什的说法,“均衡点是一个n元组,如果每个参与者的策略保持固定,那么每个参与者的混合策略都会使自己的收益最大化。因此,每个参与者的策略相对于其他策略都是最优的。” 1959年,他患上了偏执型精神分裂症。1994年,约翰·纳什和博弈理论家莱因哈德·塞尔滕(Reinhard Selten)、约翰·哈桑尼(John Harsanyi)分享了诺贝尔经济学奖。1998年,他与精神疾病抗争的故事被拍成了电影《美丽心灵》。[2]

在纳什均衡中,每个人所选择的策略,是对所有其他策略的最佳对策。所以,每个人都没有动力改变他的策略。

虽然,这种坚持在超脱在博弈结构之外的第三人看来是不理性的。因为,显然的,他们每个人所选择的最佳策略,并不必然导致他们整体收益最大。换句话说,纳什均衡不必然是帕累托最优的。

所谓“帕累托最优”(Pareto optimal),是以意大利工程师和经济学家维尔弗雷多·帕累托(Vilfredo Pareto, 1848-1923)命名的,说明经济效率和收入分配问题的术语,指的是没有任何改变可以让所有人的整体利益进一步改善的情况[3]。显然,对于囚徒困境而言,如果他们能够一致选择抵赖,会得到帕累托最优的结果。

但是恰恰相反,囚徒困境是一个纳什均衡,每个囚徒出于对自己最有利而做出的选择,导致了他们整体收益最低的结果。当然,这种结果也许对囚徒的反方,也就是警察而言是好的。当警察确实在为整个社会正义执法的时候,这样的纳什均衡反而是对社会有利的。

不过,囚徒困境问题的其他等价问题,常常就会损害社会利益,而不是人们所希望看到的了。比如公地悲剧问题。

公地悲剧问题说的是,有一块公共的草地,每个人都能上去放羊,如果所有人都不加节制地放牧,很快这地就被啃光了,再也长不出草来了,大家就失去了一块草地。但是在相互竞争的情况下,每个牧羊人都出于自身利益最大化的动机,选择不加节制的放牧。在现代工业社会,把草地换成湖泊、河流,把牧羊人换成工厂企业家,把放牧换成排放废料、污水,这个问题是等价的。对于公共资源的使用,都存在公地悲剧问题,这一问题最早由美国环境学家格雷特·哈定(Garrett Hardin, 1915-2003)在1968年发表在《科学》杂志上的论文《公地的悲剧》指出[4]。公地悲剧问题,是一个纳什均衡。

比特币要解决的共同记账问题就是一个公地悲剧问题,是一个囚徒困境,是一个纳什均衡。如果参与记账的每个人都能够从篡改账本中攫取利益,那么他就会选择这样做,虽然从整体上看,每个人都这样做的后果就是这个共同账本变得一文不值。

在共同记账这样的社会治理问题上,我们每一个人,都是纳什的囚徒。

【未完待续】(公众号:刘教链)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存