这道经典的“海盗谜题”,牛津大学用它面试新生,你能解开吗?
双语君前几天给大家整理了牛津大学的招生面试题,其中有一道“海盗谜题”(pirate game)不知道大家还记得吗?
船上有5个海盗,船长提议分100枚金币,若提出的分赃方法获得半数以上(包括半数)的人同意,就按提议进行,否则船长就要被投入大海。
船长应该如何提议,才能在保命同时将自己的利益最大化?
实际上,“海盗分金”是一道经典问题,Ted日前就这个问题做了一个小视频(翻译@谷大白话)。
大家别掉队,跟着双语君(微信ID:Chinadaily_Mobile)看一看。
https://v.qq.com/txp/iframe/player.html?vid=m0513jp68z1&width=500&height=375&auto=0
这道题的谜面是这样的:
有五个海盗,分别是Amaro、Bart、Charlotte、Daniel和Elizabeth。他们今天运气不错,抢到100枚金币。
但现在他们需要按照《海盗准则》来分赃。
这个海盗准则是怎样的呢?
Amaro是船长,因此由他先来建议分金币。其他人对分金结果进行投票。
A proposal that gets a tie or majority of yarrs passes. A proposal with a majority of nays fail, and the captain has to walk the plank.
如果投票结果为平票、或者多数人投了赞同票,那么提议通过。如果大多数人投反对票则提议失败,海盗就得投海赴死。
walk the plank:源于海盗文化,表示“惩罚”、“被迫赴死”,引申为“被迫辞职”。
如果Amaro船长投海赴死,那么分金的提议权就落到了Bart的头上。
但如果Bart的提议也不能通过投票,那么他也得跳海。
就这样一直重复这个程序,由活着的海盗进行投票。
直到某人提议通过,或者只剩一个海盗。
当然,每个海盗都是在保命的同时尽可能多地争取金币。
Each pirate's primary objective is to stay alive. Each pirate's secondary objective is to maximize his or her gold.
每个海盗的第一目标都是活命,第二目标是获得更多金币。
但海盗的天性都是无情且嗜血的,他们不信任彼此。
Pirate cannot collaborate, make promises to each other, or form alliances; there is no communication outside the proposal and the votes, and no other trickery like murder or bribery.
海盗们不会提前串通,不会对彼此许诺或者结盟;在提议和投票之外没有沟通,也不会出现诸如谋杀或者贿赂的把戏。
而且海盗们头脑也灵光得很:
Each pirate is a perfect logician and all of them know this about each other.
每个海盗的逻辑都很好,也知道其他人也是这样。
那么问题来了:
What distribution should Amaro propose to make sure he lives and gets as much gold as possible?
Amaro应该提出怎样的分赃计划,才能保证自己活命,同时又能得到尽可能多的金币?
先思考几分钟,再看视频给出的答案。
因为每个海盗都是逻辑高手,因此,他们每投一票都会考虑之后的情况,同时调整自己的策略。
因为Elizabeth需要考虑的情况最多,我们不妨从她开始倒推,得出最终结果。
如果只剩Daniel和Elizabeth两人,那么Daniel显然将提议金币都归他所有,Elizabeth的一票也不足以反对他。
因此Elizabeth要避免这种情况的发生。
所以我们继续向前推导,由Charlotte提出提议。
如果Charlotte的提议没有通过,那么投票权将落到Daniel头上,Elizabeth将一无所获。
要获得Elizabeth的赞同票,Charlotte只要保证Elizabeth不要空手而归即可(slightly more than nothing)。
因此,Charlotte只需要分给Elizabeth一枚金币,而不需要分给Daniel一分一毫。
那么加上一个人,到了Bart呢?
他仍然只需要一张投票就可以使最终结果变成2:2,故事就结束了。
因为他知道,Daniel不会想让Charlotte做决定,那么他会提议分给Daniel一枚金币,换取他的支持。而Charlotte和Eliza则要空手而归。
那么最关键的部分来了,Amaro该如何考虑呢?
如果他被迫跳海,决策权落在Bart手里。那么Charlotte和Elizabeth就要吃亏。
因此他会给她们两个人一人分一枚金币,自己留98枚。
这样一来,Bart和Daniel会投反对票,另外两位呢,则会心不甘情不愿地献上赞同票。因为其他情况对她们来说更为不利。
其实,在这个谜题里,包含了不少博弈论的知识。
One is the concept of common knowledge where each person is aware of what the others know and uses this to predict their reasoning.
其中一个概念是“共同知识”,这个概念假设所有局中人都知道彼此掌握的信息,还能依此推导出别人的思路。
最后的分配结果是“纳什均衡”(Nash Equilibrium [,i:kwi'libriəm])的范例。
Each player knows every other player’s strategy and chooses theirs accordingly, even though it may lead to a worse outcome for everyone than cooperating would, no individual player can benefit by changing their strategy.
每个人都对彼此的策略心知肚明,并将相应调整其自己的策略。虽然这样得出的结果比合作要差,但如果改变策略,没人会得到好处。
所以看来,这次分赃最大的赢家是Amaro。
接住约翰尼·德普的迷人微笑
“纳什均衡”还有一个著名的例子,就是囚徒困境(prisoner’s dilemma)。
约翰·纳什
我们也一起来看看吧:
Two criminals in separate prison cells face the same offer from the public prosecutor.
两个罪犯分别被关在不同的牢房里,检方都向他们开出了同样的条件。
“If you confess to the bloody murder and testify against your accomplice, we’ll let you off and throw the book at the other guy — a life sentence in prison.”
“如果你承认犯了谋杀罪,并证明你的共犯的罪行,我们就放你走,另外那个家伙就会被终身监禁。”
If both stay quiet, the prosecutors cannot prove the more serious charges and both would spend just a year behind bars for lesser crimes.
如果两人都保持沉默,检方无法证明他们更严重的罪行,那么两人就只需要为较轻的罪行服刑一年。
If both confess, the prosecutors would not need their testimony, and both would get 10-year prison sentences.
如果两人都供认不讳,那么检方无需任何证词,就可以判两人10年监禁。
两个囚徒会做何选择呢?
At first glance, keeping quiet might seem the best strategy.
乍一看,保持沉默似乎是最好的策略。
But the calculation of the Nash equilibrium shows they would likely both confess.
但用纳什均衡来算一下,结果是两人都会认罪。
为什么呢?
This type of problem is called a noncooperative game, which means the two prisoners cannot convey intentions to each other.
这种问题就叫做“非合作博弈”,即两名囚犯无法沟通彼此意图。
Without knowing what the other prisoner is doing, each is faced with this choice: If he confesses, he could end up with freedom or 10 years in prison. If he stays quiet, he goes to prison for one year or gets lifetime imprisonment.
因为不知道对方的打算,他们就都面临这样的选择:认罪的话,自己要么被释放,要么被判10年监禁。沉默的话,自己要么坐一年牢,或者面临终身监禁。
In that light, confessing is the better option. And he knows that the other prisoner has the same incentive to confess, so it is less likely he would stay quiet.
由此看来,认罪就是更好的选择。而且他知道另一个囚徒也会出于同样的动机而认罪,所以他保持沉默的可能性就更少。
好了,今天的烧脑题就讲到这里,小伙伴们觉得有趣吗?
编辑:左卓
实习编辑:李雪晴
今年这几个专业的毕业生火了!填志愿的同学看过来,给你10个前景最好的发展方向!