《随机漫步的傻瓜》:以概率思维看世界
编者按:
《随机漫步的傻瓜》是启发国人独立思考最棒的一本书,也是基础书单的重中之重,我们会不断推送这本书的罗马大道成员的读后感,以供大家交流。第一篇来自徐倬迅,他有统计、会计、编程三个方向的专业学习经历,而这三项恰好是下一个投资时代必备的多学科组件。统计学上的专业术语,在日常生活中经常被误读,而塔勒布在写《随机漫步的傻瓜》时又是那么天马行空,所以徐倬迅整理了书中的一些统计学知识,帮助大家归纳。
徐倬迅:
写这篇文章之前,我的脑海中有很多头绪,但是很难串成一条逻辑链,我只能尽量得保证自己不偏离主题太多,来简述一些自己的解读、观点和思考。作者的论述其实非常碎碎念,而且翻译的质量堪忧,建议有英文底子的人去看看英文版《Fooled by Randomness》。
我尝试对作者的观点进行筛选、归类和总结,大致分为三个部分:幸存者偏差、统计思维、独立思考。
幸存者偏差
幸存者偏差,通俗地讲就是“死人不会说话”。很多现象都是我们事后观察到的,大多数情况下我们只能看到结果,而忽略其中筛选的过程。
举一个简单的例子,有人说日本侵华时期并没有犯下太多罪行,理由是当初他爷爷亲眼所见日本人很守纪律,没有烧杀掳掠。但是他没有想过他爷爷只是运气比较好,遇到了一帮讲道理的日本人,见证日本人犯罪的那帮人已经死去,他爷爷是幸存者,而我们也都是幸存者的后代。
幸存者偏差对我们的影响其实非常深刻,最典型的就是路径依赖。
一个成功人士的成功可能是因为当时的运气,而人们总是将其归结为实力,所谓“时来天地皆同力,运去英雄不自由”。如果无法认清成功背后的运气成分,盲目高估了自己,很可能会产生错误的推论。
路径依赖使得个人、企业甚至国家错失一些机遇,继续保守地选择原来的路径。
柯达直到破产的那天他生产的胶卷依然还是世界最好的,但是全世界已经不再需要他,更让人不解的是数码相机其实是柯达自己研发出来的。对于柯达而言,从做胶卷起家到全球80%的市占率是一条深得看不到头的路径,整个企业和模式都深深的陷在里面。
时代变了,之前的路径依赖也阻止了企业的转型,“船大了难掉头”也是一样的道理。
作者在书中说:“在任何一个时间点,赚最多钱的交易员往往是最差的交易员。在市场上的任一时间点,获利最多的交易员,可能是最适合上一个周期的人。”
由于幸存者的存在,总会出现一个幸运的傻子,靠着运气获得了最高的收益率,但是依靠着过往的短期业绩来衡量一个交易员水平是一件荒谬的事情。
因为随机性的存在,你看到的很可能是上一个周期留下来的幸存者,在下个周期市场情绪发生改变时,这些交易员是否能获得稳定盈利还需要打个问号。
人类的眼睛能够感知到的电磁波波长在0.4~0.76um之间,也就是可见光的范畴,而这恰好是太阳光辐射最强的光谱段。这是一次又一次自然选择挑选出来的幸存者。生物进化的过程就是不断挑选幸存者的过程。
就生物进化的角度而言,一个生态系统最重要的是保证足够的生态多样性,保证遇到危机时也会有少量的幸存者活下来,把基因流传下去。可以说,从小到大我们在生物教科书里面接受的知识:“生物的进化方向是从简单到复杂、从水生到陆生、从低级到高级” ,是错误的观点。
客观地来讲,生物不存在高级和低级的区别,生命的终极意义只是为了延续,就生物形态而言都是平等的。从微观层面看,演化本身没有目的和方向。
其实在这个世界上,我们每个人都是幸存者,以至于我们所接受的教育、信息的来源都是经过幸存者们筛选的。作者在他的书中提到,“常识不过是18岁以前学到的错误观念”。
人类社会目前认识的规律分为两种,一是人们已经认识到错误的规律,二是人们还没认识到错误的规律。作者欣赏索罗斯的风格,对于索罗斯而言,每天的交易都是重新开始。跳脱出幸存者思维的局限性,拥抱变革、拥抱新的环境。
统计思维
作者在书中对使用统计学来预测市场不屑一顾,认为市场波动无法通过统计学方法来预测,并举了长期资本管理公司用统计学方法管理基金也最终破产的例子。虽然被怼到了家门口,但是我要在这里客观公正得澄清一下事实,强调一下我的个人看法。
我们会在身边看到各种对市场波动的解释,但是这些解释和归因都是事后的,市场的波动本身不需要理由。还记得有一次证券报的记者把当日市场的下跌归因于非洲埃博拉病毒带来的恐慌情绪。简直是无稽之谈。严谨地说,市场波动的一部分可能是由埃博拉病毒的带来的,比如某个医药公司研发出有疗效的相关药物。但是当涉及到市场整体的时候就像一滴水滴到大海里,没有任何踪迹可寻。
事后的归因对于市场波动也没有任何意义。事实上,经济类的数据具有极高的相关性,但是很难证明两者具有因果性。大多数对市场波动的解释不存在严格的逻辑关系,并且市场本身带有极重的情绪化色彩和噪声,强行解释市场波动毫无意义。
其实目前为止,绝大多数量化模型都是基于历史数据,其前提假设是历史会重演。统计学上,如果需要计算一件事情的概率,必须事先知道其分布或是其分布特征。由于大数定理的存在,在样本量足够多时,我们可以近似地把历史分布看作真实的分布。
在独立随机事件上这种处理方法没有问题,而经济数据具有极强的相关性,会出现明显的“厚尾”现象。
简单地讲,当来到统计学概率计算出来的那个边界时,突破这个边界的概率远大于基于统计分布计算的概率,在概率密度图上表现出一个“厚尾”。这是包括海龟交易法则在内的一些趋势交易策略盈利的根本原因。这个“厚尾”是长期资本管理公司亏损的根源,但是也是很多趋势类策略盈利的根源,并不能因为“厚尾”的存在而否定掉没有好好利用“厚尾”的长期资本管理公司。
另外,在传统的参数统计学中,计算概率密度是基于标准差的,表现为越偏离均值其概率快速接近于0,这只是基于正态分布的理想状态,就和用经典物理学来看待接近光速的物体一样有失偏颇。
作者也讲了关于过度外推和过度拟合的问题,这两者可以算作幸存者思维的统计学表述。例如感恩节前的火鸡,在过去的一年中火鸡数量稳定增长,火鸡中的统计学家更能精确得估算出未来伙伴总数的增长情况,直到感恩节来临,所有火鸡都被端上餐桌。
事实上,如果样本量过少,根据这些样本无法推导出未来的情况。甚至说,过去的所有样本都只是发展历程的一小段。只考虑过去小部分样本是不足以推导出未来的。事实上,统计学家计算概率、计算未来的发展趋势都是基于一定前提的,当这些前提被打破时一切都会发生变化。
而过度拟合在量化策略中经常见到,由于最幸运的傻子的存在,人们总能通过一些逻辑选到这些最幸运的傻子。
但是这些傻子是通过过度拟合的参数来找到的,任何过度拟合的策略在未来能否继续保持都是要打问号的。在量化投资中比较公认的一点就是策略本身要包含一定的经济学逻辑,不符合经济学逻辑的策略都应该谨慎对待,很可能包含了过度拟合的因素。
让我欣赏的是作者居然讲到了遍历性和蒙特卡洛算法,由于大数定理的存在,一些事物现象在长时间的发展后都会趋近一种统计平衡状态,达到这种状态途中的噪声和随机性并不重要。蒙特卡洛算法指的就是一种生成随机数的算法,这种方法在机器学习算法中应用广泛。
组合投资、量化投资的思路也是通过样本量的扩张来降低随机性的干扰,在当前的结构化多因子模型中,我们想买的其实是某一个因子,只是通过买入一个组合来达到这个目的,买入组合的本质也是为了降低随机性。
换句话说,过程是曲折的,但是前途是光明的。好比一个运气不好但是有实力的人,可能会受到一定的挫折,但是只要尝试的次数足够多,总能够慢慢爬上来。
而一个幸运的傻子,可能因为运气的原因获得了成功,长期看也会慢慢收敛于平均水平或是他的实力水平。
独立思考
可以说,独立思考是南老师给我讲的第一堂课,也是投资必须的能力。作者认为人们无法看清事物的本质,前人总结的观点也不一定是正确的,时代也是在变化的,在这种大环境下,独立思考尤为重要。那么如何才能做到独立思考呢?我个人有以下几点建议:
1、 少看新闻多读书。我们身边会有很多的人热爱看新闻,但是新闻每天都在变化,新闻包含着记者博人眼球的目的,新闻只是给人灌输信息,大多数新闻都是经过筛选并逻辑简单的,新闻会消磨你静下心长时间深度思考的精力。某种意义上来讲,新闻的存在是一种娱乐品,是打发时间的方式。对外界信息的过滤和思考是要做的首要任务。
2、 一手信息求证。其实我们接触到的大多数信息都是二手的,经过人为加工的,或多或少带入了传话者的个人观点。甚至很多“我有一个朋友”这种信息已经是三手四手的了。一手信息或许很难获取和深度理解,但是这是走向独立思考的最主要部分,需要尽力去尝试。比如大多数人对区块链的思考基本就止步于“去中心化”、“物联网”这种高大上的范畴了。有心的程序员阅读了区块链的源代码后认为,区块链只是一个并不复杂的技术方案,至少在我的脑海中可以瞬间想到好几种比这更伟大的技术方案。人们对他们不熟悉的领域却抱有极大的认可和信心,陷入一种狂热的人性中,这和很多传销手段有雷同之处。
3、 认识自己的局限性。人们无法看到事情的全貌,虽然这有点陷入不可知论的范畴,但是我个人完全认可。很多情况下,真相是复杂而混乱的,要对已知的信息存一份怀疑,不要先入为主。认识到自己的局限性,扩张能力圈,或者只在能力圈内思考。
4、 敢于打自己脸。做错了就认错,这是幼儿园里面常教的东西,可惜大多数成年人都做不到,包括我也不擅长打自己脸。大多数情况下,人们对自己的观点都抱有一种迷之自信,对不利于他们的观点都选择性地视而不见。要认识到自己的错误并打自己脸是一件困难和比较痛苦的事情,大多数人都没有这么理性。我喜欢数理类的东西,主要原因是对错容易区分且答案唯一,错了就打脸可以做到不含糊。但是对于投资这种没有标准答案的事情,至少我目前还不擅长打自己脸,希望以后能让自己脸皮厚一点、不要怕疼。
历史推送:
关注罗马大道青训营,做时间的朋友