查看原文
其他

出色不如走运?

石川 川总写量化 2019-07-12



巴菲特的类比


1984年,沃伦巴菲特在介绍格伦厄姆和多德的价值投资流派时,举了下面这个例子:


I would like you to imagine a national coin-flipping contest." Let's imagine all 268 million people in the United States are asked to wager one dollar on their ability to call the flip of a coin. "If they call correctly, they win a dollar from those who called wrong." After each flip the losers drop out, and on the subsequent flip the stakes multiply. Each person has a 50-50 chance of calling each flip and approximately half of the people will lose and drop out each round. After ten flips there would be approximately 260,000 people that had successfully called ten consecutive coin flips. After 20 flips, based purely on chance, there would be approximately 250 people that had called 20 consecutive coin flips - a seemingly miraculous feat


它的意思是说:假设全美国2.7亿人都下注1美元来猜扔硬币的结果(猜对的概率是50%),猜对的人得到2块钱,猜错的人出局。在此后的每一轮中,仍未被淘汰的人继续押注它们的所有赌资,猜对后赌资翻倍,猜错出局,以此类推。这样,10轮过后,大概还会剩下26万人(即10轮全部猜对);20轮后,2.7亿人中还会剩下250人左右(即20轮全部猜对)。有250人连续猜对20轮扔硬币的结果,多么不可思议!


连续猜对20轮后,剩余的这些人将会有超过1百万美元!连续猜对20次,打败了剩下的近2.7亿人,从1元轻松赚到100万,这些人听起来简直就像是天选之人!但他们的成就真的是出于他们自身的某种特质,还仅仅是依靠运气呢?


巴菲特想通过这个故事表达的道理还没有讲完,但让我们先把它放下,先来看看下面这个简单的计算。


仅靠运气胜出的“牛人”


如果你从大街上随便抓一个人,然后让他连续猜20次硬币的正反,那么他全部猜对的概率微乎其微(顺便说一句,如果你真的碰上这么一个全猜对的牛人,那么他很可能是真牛逼!)。但是,如果许多许多人一起猜硬币,那么是否一定会从中脱颖出来一个“牛人”呢?这样找出来的“牛人”是否可信呢(即他是真牛还是仅仅是运气呢)?这些问题可以通过下面的概率模型来回答。


对于一个人来说,假设他猜扔硬币的结果n次,每次猜对的概率为p(p=0.5),不同次猜的结果相互独立。那么,这个人在n次中猜对k次的概率符合二项分布。令X表示这个人猜对的次数。显然,它是一个随机变量,满足以下概率质量函数(probability mass function):




如果以这个人猜对个数的多少来衡量他是否厉害,那么我们关心的则是他在n次中至少猜对k次的概率,即:




接下来,我们找来了好多好多人,一共有m位。我们想看看这m个人里面最厉害的人猜对次数的概率分布。根据我们对厉害的定义,这m个人里面最厉害的一定是在这些人中猜对次数最多的那一个。因此,如果用Y代表这个最厉害的人在n次中猜对的个数,那么不难发现,Y和每个人猜对次数X的关系为Y = max(X1, X2, …, Xm)。这其中Xi是第i个人猜对的次数。在这种关系下,不难推导出Y的累积分布函数(cumulative distribution function):




由此不难计算出最厉害的人至少猜对k次的概率,即Y≥k的概率:




同样,我们也可以从CDF反推出Y的PMF:



得到PMF后,我们可以求出Y的期望和方差:





下面我们就来看看,随着人数的增多,最厉害的人猜对k次的概率,即prob(Y=k),是如何随人数m变化的。令轮次n=20,猜对概率p=0.5,下图分别表示了当我们有1个人,100个人,以及10000个人猜硬币时,Y的概率分布。




可以明显的看出,随着参与人数的增多,Y的概率质量函数(pmf)在横坐标轴上向右移动,且变的越来越窄。Y的pmf向右平移说明随着人数的增多,最厉害之人的水平越来越高:当只有1个人猜时,他猜对10次的概率最高(因为每次有二分之一的概率猜对,一共猜20次);当人数上升到100人时,他们之中猜的最好的那个人最有可能猜对15次;当有10000人同时猜时,最好的那个最有可能猜对18次。这正所谓“水涨船高”。Y的pmf变窄说明它的标准差越来越小;换句话说,随着人数的增多,我们对于这其中最厉害人猜对的个数的判断将越来越有信心。


下面再让我们来看看最厉害的人至少猜对k次的概率,即prob(Yk),是如何随人数m变化的。下图分别为k取18,19以及20的情况(轮次仍然是一共20轮)。比如,绿色曲线表示的是prob(Y≥19)是如何随m变化的。可以看到,在参与的人数大约为30万人时,最厉害之人至少猜对19轮的概率就已经非常接近1。换句话说,我们可以断言,如果有30万人同时参与猜硬币的游戏,那么一定会至少有一个人从中脱颖而出,猜对至少19轮。当k=20(即20轮全部猜对)时,prob(Y≥20)的概率也是随m单调递增的,虽然速度比起k=19时要慢得多。当1百万人同时猜硬币的时候,最厉害的那个人有超过60%的概率猜对全部的20轮。




从上面的结果不难发现,当越来越多的人参与猜硬币的游戏后,总会出现一个或者多个最厉害的“天选之人”,会全部猜对,令众粉丝惊呼。这些人也许会将这种幸运误以为是自己的天生神力;也许还会开始在自媒体上大肆曝光、出书、给迷信的人讲座、开启网红之路、站上人生巅峰。殊不知这这种结果的出现仅仅是靠运气(pure luck),一切皆枉然。


与猜硬币相似的证券投资界


上面这个例子在证券投资界也有着完美的体现。下面这类场景你一定不陌生:每年末在各大基金或者阳光私募排行的榜单上,都有收益率嗷嗷牛叉的top 10。又或者在民间量化平台(诸如果仁网)首页上的推荐策略中,各种上榜的策略那无论从回测还是到实盘,其业绩让人看来都啧啧称奇,感叹这些人赚钱简直如探囊取物一般简单。


相信看过猜硬币的例子后你能够明白,这些上榜的例子和猜硬币中的那些最厉害的人并没有太大的差异。为了进一步说服你,让我们假设一个股票型投资策略的年化收益率X符合均值为10%,标准差为20%的正态分布。假设市场中有m支股票型基金,则它们中最好的那个的收益率Y是X的函数,Y = max(X1, X2, …, Xm)。类似上节中的计算不难得到关于Y的概率分布和各种统计值。比如,下图是当有3000支基金时,其中最好的那个的收益率分布和单独一支基金收益率分布的比较:和猜硬币的例子一样,最好的那支的收益率分布在横坐标上向右移动且变的更窄。




下图为prob(Y≥0.7)——最好的那个基金的年化收益率超过70%的概率——随基金个数m变化的结果。同时,我们也给出了Y的均值和标准差随m的变化。随着m的增大,prob(Y≥0.7)向1逼近(即我们越来越确定总会有一些基金脱颖而出,年化收益率超过70%)。这种判断也同样可以被Y的均值和方差来证明:随着基金个数的增大,最好的基金的年化收益率的均值也在增加,且标准差在减小。




这个结果告诉我们,看到各种榜单上无敌的产品根本不足为奇。但我们内心真正关心的问题是:这些上榜的基金取得的优异业绩靠的到底是运气(比如评比的当年的市场恰好适合它们的策略),还是一套真正的科学投资体系?看看基金的排名,不禁让人心灰意冷。


下图为2015年净值增长最高的前12支偏股混合型基金。这些在2015年风光无限的基金在2014年如何呢?可谓惨不忍睹。我不想不负责任的基于此就认为这些基金2015年的表现纯粹是来自运气。但同样的,如果让我来选基金,我也不会把投资人的钱轻易的就交给它们管理。毕竟,短期的“运气”无法说明任何“能力”。这不是“实力强”,而是“人生状态比较好”。




巴菲特的深意与中国FOF/MOM之困


下面我们回头来看巴菲特的例子。他通过猜硬币的例子真正想说明的是,如果猜对的250个人仅仅凭借的是运气,那么按照随机性,这些人应该来自美国的各个不同的地方。但是,如果这些人里面有大一部分(远超过随机性所对应的数字)来自一个名为“格伦厄姆和多德的小镇”呢?那就要好好看看这些出自该小镇的人拥有哪些共同的特质。


众所周知,格伦厄姆和多德是价值投资的开山鼻祖,而巴菲特无异于最好的继承者。他通过这个例子想要说明的是,价值投资是一个经过风雨考验的科学投资系统,这些真正掌握该系统的人会长屹立于证券投资之林,这些人在投资界可以做到靠真正的能力来持续的“猜对硬币”(赚到钱)。


时间才是检验一个基金或者一个基金经理是否优异的唯一标准。


为此,我们从时间维度再做最后一个实验。我们仍然假设一个基金年化收益率X的分布符合正态分布。此外,我们考虑该基金在连续T年内中最差的那一年的收益率作为评价该基金水平的一个标准,令Z代表这个收益率,因此我们有Z = min(X1, X2, …, XT)。


假设该基金的年化收益率为N(0.2, 0.3),并令T=5年。Z的分布如下图所示。Z的均值为-14.4%,标准差为20.0%。最差年份中,期望收益为亏损14%以上。面对20%的期望收益,恐怕没有人想遇到这样的年景。




这支基金年化收益率的期望有20%,似乎足够吸引人。但是,之所以产生这么差的结果是因为该基金年化收益率分布的标准差太大(我们假设0.3)。标准差是用来衡量一支基金的稳定程度,那自然越小越好;越小说明年与年之间,它的表现越稳定。


这个结论不难证明。假设其他条件不变而仅改变收益率标准差后,得到的Z的均值如下图所示,可见标准差越小(即基金的水平越稳定),最差年份的收益率才会越高。




时间永远是稳定性最大的敌人。上面的实验仅仅考虑了5年的情况。如果我们把时间拉长又会怎样呢?不同的收益率标准差能否禁得起时间的考验呢?下图显示了标准差分别为2%,5%,以及10%的情况(收益率期望仍然为20%),时间跨度从5年到30年。当一个基金足够稳健(标准差为2%),它在30年内的最差收益的期望也不会差到哪里。但如果它不够稳健(标准差为10%),它的表现一定是会在时间面前褪色的。




时间又从来都是一个科学投资体系的朋友。上图同时说明,随着时间的正常,这三个不同sigma的曲线之间的差距逐渐增大。这说明,如果仅仅看短期(3到5年),我们还无法准确的判断滥竽充数者,但它们一定会在时间的冲刷下原形毕露的。


但是,我们国内的基金又有多少有10年甚至更长的历史呢?那些“著名”的基金经理又有多少有记载可回溯的track record呢?在这种背景下就来大搞MOM和FOF,在我看来是国内投资界所面对的困扰。


再来看看巴菲特的表现。下图是美国拥有30年以上历史的基金的信息率(类似夏普率)分布图。在30年尺度的丈量下,巴菲特的表现有目共睹(排名第二)。这也许是对来自“格伦厄姆和多德小镇”的投资者最好的褒奖。




结语


优秀的业绩是靠运气还是来自实力?时间是评判这一切的唯一标准。面对一个潜在的好的策略或者基金产品,我们切记不要被它完美的业绩所迷惑双眼,必须时刻保持理智,冷静的对其历史业绩进行业绩归因,客观的考量投资团队以及风控体系。这一切有不得半点马虎,来不得半点急躁。




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存