查看原文
其他

比特币史话·59 | 囚徒的困境(6): 九九归一

刘教链 刘教链 2023-01-30

(托马斯·谢林,诺贝尔经济学奖得主。图片来源于网络)
前情回顾:
比特币史话·56 | 囚徒的困境(3): 公地不悲剧
比特币史话·57 | 囚徒的困境(4): 导恶向善
比特币史话·58 | 囚徒的困境(5): 长尾理论

正文:

最终,比特币成功实现了一个自发参与、自动运行、自主治理、自我实现的纳什均衡。

纳什均衡是关于博弈将会如何进行的“一致”预测,意思是,如果所有参与人预测特定的纳什均衡会出现,那么没有参与人有动力采用与均衡不同的行动。因此纳什均衡(也只有纳什均衡)具有这一性质,参与人能预测到它,预测到他们的对手也会预测到它,如此继续。[《博弈论》(Game Theory),2014年诺贝尔经济学奖获得者经典之作;全球博弈论领域经典教材之一。朱·弗登博格(Drew Fudenberg),让·梯若尔(Jean Tirole)著。中国人民大学出版社,2010][1]

与之相反,任何固定的非纳什组合如果出现就意味着至少有一个参与人“犯了错”,或者是在对对手行动的预测方面犯了错,或者是(给定那种预测)在最优化自己的收益时犯了错。[同上]

要实现对一个系统的有效治理,大到一个社会,小到一个企业,要欣欣向荣而不是土崩瓦解,都需要构建有效的纳什均衡,然后一切政治经济活动都在这个博弈结构框架之内展开。要构建有效的纳什均衡,就要设计和实现“好”的纳什均衡,避免“不好”的囚徒困境和公地悲剧问题。[公众号:刘教链]

怎么定义所谓“好”和“不好”?从天人合一的角度来看,政治经济学的问题仍然可以回归到物理学的第一性原理,即一个开放系统中一群人的有目的的行为,最终导致这群人所在系统的“熵”(entropy)减少了,可以是热力学熵减(比如屋子变整洁了),也可以是信息熵减(比如交易数据有序排列起来了),这就是“好”的。反之,就是“不好”的。“熵减”就等于“好”。《大学》称之为“善”。人生的所谓“意义”也就是一个“善”。所谓“行善”,也就是要做这样的“好”事。行一家之善,你是一个称职的家庭成员;行一方之善,你是一个造福人民的大人物;行一国之善,你是一个为民请命的伟人。

当然,《矛盾论》告诉我们,善恶本就是一体两面。我们这个宇宙的终极法则也确实如此,即,对一系统内行善的人,必定同时是在对系统外作恶。善越大,恶也越大,而且,所作的恶恒大于所行的善。翻译成物理学的语言就是,一个开放系统内熵减的过程,必定在其外部造成更多的熵增。因为整体加和之后,必须保证总熵是增加的,这,就是我们这个宇宙的终极法则,“熵增定律”。没人一个人,能够逃过这个终极法则,无论他是谁,在哪里,有多么伟大,或者多么渺小。

这就是我们的局限性。我们只能在一个有限的范围内来讨论我们的纳什均衡。因此,以下对于行善和作恶的表述,都是局限在一个有限的范围之内的。[公众号:刘教链]

纳什均衡的“善”,是导恶向善,是让所有的参与人能够“行善”,而不是“作恶”。方法就是激励机制,也就是“奖励”和“惩罚”。

在今天市场经济法治社会相结合的现代社会治理体系中,奖励往往是社会化的、“去中心化”的(打扫屋子就能从客户手里挣到钱),而惩罚则常常是国家化的、“中心化”的(这正是现代法治精神,未经法律审判,任何人都不能对另一个人定罪并处以私刑)。

比特币的自治体系却有着独特之处。奖励自不必说,每个率先攻破哈希算题,发现工作量证明,抢到记账权,创建新区块的矿工都可以自行写入币基交易,把一笔奖励的比特币发给自己。那么惩罚呢?比特币系统没有中心化权力,不能惩罚任何人。比特币使用了一种非暴力的惩罚方式,社会排斥。通俗的讲,就是没人愿意跟你玩儿了。

如果矿工创建了无效区块,那么由于比特币区块链数据的公开透明,以及比特币的机制和规则完全公开,任何人都可以进行验证,一旦发现违规,就不会在无效区块的上面继续挖矿。在无效块之上挖掘的任何块都将变为无效块。使用此规则,矿工将简单地忽略无效区块并继续在主链顶部挖掘。

而且,这种社会排斥是递归的。也就是说,如果谁不对违规者实施排斥,那么他也一起会被其他人排斥,他费时费力挖的区块也一样会被大家抛弃,为之所花费的电费、时间、心血也就付之东流。[公众号:刘教链]

这样一来,所有人都默认认可最长链,也就是累积最大工作量证明的链,也就是比特币的纳什均衡的均衡点。这个均衡点,正是比特币区块链的“谢林点”(Schelling point,又称为“焦点”)。所谓“谢林点”,是指博弈论中人们在没有沟通的情况下的默认选择倾向,这个选择看起来自然、特别。这个概念最早是在1960年由美国经济学家、诺贝尔经济学奖获得者托马斯·谢林(Thomas Schelling)在《冲突的策略》一书中提出的。[2]

正如中本聪在邮件中所说,“始终把最长链视为有效链是严格必要的”。[中本聪,2008年11月9日,密码学邮件列表组][3]

此时,矿工们作为一个群体将选择最稳定的状态,即具有纳什均衡的状态。显然,你可以让所有的矿工在分叉链上开采并使其成为新的主链,然而,矿工的数量是如此巨大,以至于这样的事件根本无法协调。如果群体中的大多数人没有改变他们的状态,少数人将没有任何动力留在分叉的状态。如果明知这是徒劳的,为什么一个矿工会浪费他们的计算能力和冒巨大风险?[公众号:刘教链]

加密货币的价值在于人们赋予它价值。那么,为什么普通用户会认可主链中的比特币而不是分叉链中的比特币的价值?原因很简单。从用户的角度来看,主链是一个谢林点。他们赋予主链价值,因为主链看起来很自然而且特别。

另外,人是有限理性的。用户更重视主链的另一个原因只不过是已经习惯了它。有限理性基本上意味着当给出一个选择时,人们将总是沿着一条简单的路径和他们习惯的东西。这条路可能不是最适合他们的路径,它可能不会给他们最高的回报,但他们总是遵循最简单的路径。有限理性,往往也是一种“大智若愚”。

最终,“如果有足够多的人这么想的话,那么它就会成为一个自我实现的预言”。[中本聪,2009年1月16日,密码学邮件列表组][4]

【未完待续】(公众号:刘教链)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存