查看原文
其他

独家 | 以太坊未被认识的潜力:从囚徒困境到合作博弈

关注👉 加密谷Live 2019-05-27


本文作者 Virgil Griffith 是以太坊基金会成员。原题为“Ethereum is game-changing technology, literally.”由加密谷独家编译。

 

作者从博弈论角度切入,试图回答“什么是以太坊?”的经典设问。最后,通过推论指出:以太坊是前所未有的合作博弈竞技场,是我们尚不了解的强大经济载体。


博弈论和以太坊


人们经常会问“以太坊是什么?”通常的回答为:“世界计算机”。仅此而已吗?

 

非合作博弈论(Non-cooperative game theory)是博弈论中最原始,也是应用最广泛的一个分支。它假定没有外部力量来执行规则。在非合作博弈中,参与者只从自身的角度出发来优化自己的收益;而在合作博弈中,多名参与者以共同合作来达成协议,从而统一各自的行为。非合作博弈的例子有很多,比如“囚徒困境”、“猎鹿赛局”和“懦夫博弈”等。

 

而最大的智能合约平台以太坊恰好可以充当一个不会被收买、无处不在的外部监督者,用于执行和监督利益相关者之间的协议。这意味着在理论上,以太坊可以将任何非合作博弈变成合作博弈(联盟博弈)。在智能合约机制的引入下,此前的利益格局会被打破。

 

从非合作到合作博弈的转变是通过一种名为 Game Warping 的技术实现的,我们将其定义为透明、可触发、不可外部干预的链上清算支付系统。它使得新规则的创建成为可能,使合作博弈成为一个合乎逻辑的选择。


以太坊和智能合约并非改变博弈的必要条件。但在此之前,我们很难找到普适、可信的第三方工具。当然,谈到智能合约与现实的博弈相结合,我们必须要找到适合的机制让博弈的关键操作与链上合约绑定。


囚徒困境


博弈论中最著名的问题是囚徒困境 ,这是一种典型的非合作博弈。在这种博弈中,理性的策略会把博弈者置于最糟糕的境地。

 

但在以太坊之中,囚徒困境就变成了合作博弈。假设玩家A和B想做一些“调皮”的事。但在他们犯罪之前,他们各自在智能合约中存入一百万美元 (价值1000个效用点)。该合约规定:“如果我发布一条错误的信息,我的一百万美元就会被销毁。” 现在智能合约已经生效了,只要警方提供的奖金不超过一百万美元,理性的犯人就会选择合作。

 

在最初的囚徒困境中,理性玩家将会叛变。但是,当支付矩阵发生扭曲,形成新的平衡后,理性玩家便会合作。见下图:


游戏扭曲了囚徒困境。绿色表示纳什均衡


为了寻求灵感,这份清单包括了与囚徒困境里相匹配的情况:碳排放,体育兴奋剂,公地悲剧和国际武器增长。以太坊能为这些领域提供一些东西吗?这似乎是可信的。

猎鹿博弈


猎鹿是一种典型的合作博弈。我们假设两个猎人可以选择猎捕雄鹿或兔子。最大的回报是双方都能猎杀雄鹿 (成功地猎杀雄鹿需要两个猎人的共同努力)。与此同时,猎鹿也是一种风险更高的策略,因为如果另一个猎人去猎捕兔子,那么猎鹿的人将一无所获 —— 更安全的选择是从猎捕兔子中得到保证的回报。

 

理想中的扭曲和囚徒困境是一样的。每个猎人存一大笔钱 (价值1000效用点),如果某个猎人选择猎杀兔子,这笔钱将被消耗掉。

 

游戏扭曲了猎鹿游戏。绿色表示纳什均衡。结果和囚徒困境一样,合作是现在唯一的平衡。

 

在扭曲之后,理性的猎人将会坚持选择雄鹿。为了让游戏更真实,猎鹿博弈也有一些变化和扩展,但是通过扭曲将其转化成合作是可以实现的。

懦夫博弈


除了为了集体利益而扭曲游戏外,一个玩家还可以通过扭曲游戏来获得竞争优势。我们用懦夫博弈 (亦称斗鸡博弈) 来说明这一点。

 

在这个游戏中,有两个玩家A和B,以及两个动作,转向和直行。懦夫博弈是这样一种游戏:假如两名车手向对方驱车而行,其中一方是不计后果的人,选择直行;另一方是足够理性的人,会先选择转弯。那么鲁莽者极可能是博弈的胜出者。

 

这个过程可以通过在链中存入一大笔钱来完成,如果你突然转向,这笔钱就会消耗掉。这相当于告诉另一个玩家,你作为一个“理性的人”,永远不会突然转向。

 

这就是以太坊,它相当于“公开扔掉方向盘”。


玩家A公开扭曲自己的行动,迫使玩家B在-1效用为转向,或-100为直行之间作出选择。理性的表现是:B选择转向,A获得奖励。

 

懦夫博弈中有两种平衡:[直行,转向] 和 [转向,直行]。但是在扭曲之后,唯一剩下的平衡就是 [直行,转向],你(玩家A)得到了最大的回报。

 

在一个以太坊的世界里,懦夫博弈变成了一场比赛,看谁会第一个公开扔掉自己的方向盘。

扭曲其他玩家的游戏


不仅是局限于从扭曲自己的游戏中获利,人们甚至可以通过威胁来扭曲你没有参与的游戏来获利。这种敲诈勒索显然没有得到认可,但我们将其列为智能合约技术的衍生物。回想来自 Bono&Wolpert 文中的情况,其中第三个玩家C知道玩家A和B即将要玩一个游戏(以及他们的支付矩阵)。有了以太坊,玩家C可以通过清晰地看到玩家A和B来创建一个智能合约。这个新创建的合约规定,玩家A需支付合约,否则合约将向玩家B发送大额款项,除非B对A执行竞争行为。从本质上讲,玩家C通过威胁B对A采取竞争行为来勒索玩家A。

 

更具体地说,请考虑以下情况。玩家A有向上/向下的动作,玩家B有向左/向右的动作。起初,他们都非常渴望在正和互动( Positive-sum interaction)的10个效用点中占据优势(向上,向左)。

 

然而,玩家C识别了即将要玩的游戏,并实例化一个智能合约,从玩家A勒索5000美元(价值5个效用点)。如果A拒绝支付合约,合约将向B支付高达100,000美元(价值100个效用点)让他选择“向右”。

 

一旦玩家A看到智能合约,A就会面临两个更糟糕的选择 - 复合游戏I或复合游戏II。不幸的是,对于玩家A来说,理性选择是复合游戏II,而A将支付敲诈费。


合约勒索A的钱,这样合约就不会激励B总是选择“向右”。绿色表示纳什均衡。这个游戏扭曲相当于臭名昭著的 p+epsilon 攻击。

 

游戏扭曲最令人惊讶的一个方面是,即使有人做出了承诺付款,他可以改变理性的策略 (这也通常是游戏的结果),从而无需真正付款。如果每个人都理性地玩游戏,游戏就可以免费地受到影响。

 

警告。以太坊支付和消耗只会被链中的事件触发。显然,这是一个限制——例如,在囚徒困境中,如果一个囚徒能够在不通过链播的情况下叛变,玩家便能够避开百万美元的消耗。侧通道(off-chain)通信的相关性因情况而异。但是玩家之间的链外互动越少,游戏成功被扭曲的可能性就越大。对这一领域最大的贡献将是发现游戏的确切属性,以确保玩家被扭曲的动作将始终在链上广播。

 

另外需要注意的是,为了获得个人收益而进行游戏变形,接受玩家必须发现扭曲已经完成了;更准确地说,扭曲必须成为众所周知的事实。这种限制对于反社会契约来说可能是件好事。

以太坊会发生什么变化?


从技术上讲,游戏扭曲不需要智能合约。然而,对于以太坊智能合约来说,一个明显的特质是当涉及到你的管辖权或其他相关问题时,你很难找到可靠公正的“法官”。除了这些特质之外,以太坊 (或另一个智能合约平台)通过提供一个确定性的、全视角的、廉价的和方便的法官,使得所有的游戏扭曲都变得更加实际。

 

这个框架提供了一个生成以太坊初创企业的流程。例如,人们可以按照以下步骤来操作:


  1. 阅读经典的博弈论书籍。

  2. 列举所有常见的非合作博弈。

  3. 通过有条件支付或存款消耗,看看这些博弈论中能够产生多少比原始纳什均衡更优的均衡。

  4. 发现这些博弈游戏出现的重要行业。

  5. 然后,针对每个产生的行业,确定玩家行为是否可以成为链上事件。 

  6. 然后对于每个产生的行业,提交创业提案,成为 ConsenSys 发言人。

  

说真的,抓住这个想法,并付诸实践吧!


特别感谢:Georgios,vi 和 Dan 为我们的联合研究开发游戏扭曲和草稿反馈。


- END -


Virgil Griffith  作者

DUANNI YI  翻译

Sonny Sun  编辑

       Roy   排版





内容仅供参考,不作为投资建议,风险自担!

版权所有,未经允许,严禁转载

商务合作,请联系 微信:Claire-CVL



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存