查看原文
其他

鞅与停、赌徒必胜策略与生男生女问题

算法数学之美

日期:2019年2月12日

正文共:2390字62图

预计阅读时间:6分钟

来源:Mather King


鞅的英文是martingale,是一种马具,据称是a strap with a strange form: it is a long leather belt that bifurcates, at one end, into two strips of the same length. 具体样式见下图。鞅在中文中是『马颔缰』,就是这样意译的。

概率论中的martingale,名字来源于同名的赌博方法,简单来说就是赢了收手,输了加倍。只要输光之前能赢一把,就能赚钱(虽然相对于赌本不多)。而赌博中的martingale,据说名字来源于普罗旺斯语,意思是to play in an absurd and incomprehensible way。

所以概率论中的martingale,其实和马具没有关系,也许不该翻译成马。硬要意译,恐怕应该叫『谬』(absurd)。

下面定义鞅

考虑一个filtration , 即一个递增的域序列。然后考虑一列随机变量。假设 (i)  。(ii)每个可测。 (iii) 

此时称作一个(对可测的)鞅。

前两个条件都好理解,第三个改写一下就是. 就是说这个过程的增量对上一个域做可测投影,是0. 对第三个条件再取期望,得到. 所以鞅描述了某种『公平过程』。

注意之前所有都对可测,大,所以不止由决定,还可能依赖于更早的。所以鞅可以不是马氏过程。参见鞅过程与马尔科夫过程是什么关系? - Lillian Song 的回答 - 知乎。

如果把上面的第三个条件改成,则成为下鞅(submartingale),反之称上鞅(supermartingale)。

不难看出,下鞅的期望递增,上鞅的期望递减。所以问题来了:这名字是不是瞎起的?

我认为比较合理的解释是:这和调和函数(harmonic function)有关。

一个函数的函数称作harmonic,如果. 如果,称作subharmonic。如果,称作superharmonic。

一个harmonic函数里面放个n维布朗运动,是一个martingale。一个superharmonic函数里面放个n维布朗运动,是个supermartingale。一个subharmonic函数里面放个n维布朗运动,是个submartingale。考虑到布朗运动和鞅在历史上的密切关系,通过调和函数命名上下鞅还是挺合理的。

下一个问题是,subharmonic是大于等于,superharmonic是小于等于,这名字是不是瞎起的?

一个解释是,如果有superharmonic函数f,harmonic函数g,subharmonic函数h,且他们在一个区域边界上相等,则在区域内f大于等于g大于等于h。

考虑一个随机变N,取值范围是.如果对每个,都有,则称N是一个停时。上面的可以换成.

假设N是一个赌徒停止赌博的时刻。停时是说,赌徒在n次赌博之后,亦即知道了前n次赌博的所有信息后,知道是否不赌了。这就是停时名字的来源。比如说,赌徒决定连赢三把就不赌了,停止条件能够由当前信息决定,所以是个停时。如果赌徒决定,如果下一把会输,就不赌了,就不是个停时。因为当前信息决定不了是否停下。

对于两个停时S和T,都是停时,其中是取大,是取小。特别地,由于常数总是个停时,是个停时。

对于停时N,可以定义在时刻N的信息,即. 如果事件A满足,则A在中。特别地,N对可测。


——————————————————————————————

我们关心的,是对于一个赌博系统(比如掷硬币),考虑一个事先设定好的赌博策略(比如输了加倍),以及对应的停止条件(比如输光了赌本就不赌了),停止时有多少钱。

赌博系统加上策略,假设是个鞅。停止条件是个停时N(要求以概率1小于无穷)。那么就是考虑的值。

首先有个定理,是个鞅,有。也就是说,如果强制在某个固定时刻结束赌局,停止时的钱的期望和一开始一样。特别地,如果停时有界,那么一定是不赚不赔,因为

如果停时无界,那就比较复杂了。假设掷硬币,每次赌一块钱,赌本无限,首次赢钱后结束,那么停止时不赚不赔。但如果停止条件改成“手里的钱首次超过赌本”,那么结束的时候一定赚了一块钱。而且可以验证这个停时以概率1小于无穷。

关于需要的条件,有“可选停时定理”(optional stopping theorem)。

先定义一致可积鞅(uniformly integrable martingale)。如果,则称为一致可积鞅。

可选停时定理1:如果是个一致可积鞅,则成立。可以知道,如果的概率随下降足够快,那么条件成立。

这个条件比较难验证。有另一个较弱的版本。

可选停时定理2:假设有界,且N的期望小于无穷,则.

可以看出“手里的钱首次超过赌本”这个策略的用时期望是无穷,所以上述定理失效。

对于现实中的赌博,假设是个公平赌博(鞅)。由于赌徒和庄家赌本有限,有界成立。由于每次赌博的下注有最小单位(一个筹码),容易验证某一方破产的用时期望小于无穷。作为一个赌博策略,破产了就没法再赌了,所以停止条件肯定包含了破产,于是N的期望小于无穷。那么由于上述定理,。期望是不赚不赔,没有什么必胜策略。

对于生男生女,比如生男生女概率各50%,每个家庭都生到第一个男孩就不再生,那么产生的男女比例是多少? 也是一样。如果策略是生到第一个男孩为止,那么可以用上述定理,停止时男女一样多。如果策略是生到男孩比女孩多一个,那么用时期望是无穷,不能用上述定理,而且停止时确实男孩比女孩多。

- End - -


更多精彩:

数学家探索两个几何世界之间的镜像链接

学术史上的奇文:怎样用数学抓狮子

29岁当教授,30岁成博导,入选国家优青,这位学术女神有多牛?

从一个骗局谈生活中的基础算法

知乎上获赞最高的66条神回复,句句戳心~

41岁英年早逝北大计算机系才子,给四岁幼子的临别赠言

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存