查看原文
其他

《复杂》读书笔记

Ponge Yestoday 2022-10-28

1. 什么是复杂系统
2. 复杂系统研究上的难点
3. 一些有趣的「理想模型」
    3.1. 从确定走向混沌:逻辑斯蒂映射
    3.2. 介于一维和二维之间的分形:科赫曲线
    3.3. 计算机里的「生命」:生命游戏
4. 启示和思考
    4.1. 幂律和分形的关系
    4.2. 从自然中学习如何在复杂系统中生存(对投资的启示)
5. 冷知识
    5.1. 信息熵
    5.2. 可以自我复制的程序
    5.3. 生物基础代谢率和生物体重之间的关系
    5.4. 「基因开关」


《复杂》是一本很好的「复杂性研究」的入门书籍,正好这两天有机会,集中读完了。作者在访谈中提到,尽量避免使用「复杂性科学」(complexity science)一词,而是用「复杂性研究」(the sciences of complexity)替代,因为对于复杂性,目前的研究还非常分散和不系统,甚至都不能给出一个明确的定义。


1. 什么是复杂系统



作者认为,通俗来说,复杂系统是指由大量相互作用的组分组成的系统,与整个系统比起来,组分相对简单,没有中央控制,组分之间也没有全局性的通信,并且组分的相互作用导致了复杂行为(自组织、涌现等)。
复杂系统表现出的共性包括:
  1. 复杂的集体行为:在一个大规模网络中,个体的规则相对简单,不存在中央控制或领导者,但大量个体的集体行为产生了复杂、不断变化、难以预测的行为模式;
  2. 信号和信息处理:所有这些系统都利用来自内部和外部环境中的信息和信号,同时也产生信息和信号;
  3. 适应性:所有这些系统都通过学习和进化过程进行适应,即改变自身的行为以增加生存或成功的机会。

2. 复杂系统研究上的难点



难点在于没有办法被计算和预测。天气、蚁群、昆虫群落、大脑、免疫系统、金融市场、互联网等都是复杂系统。
因此,在研究方法上,核心的方法是计算机仿真。计算机仿真研究的是理想模型,人们通过研究相对简单的模型,希望了解复杂系统的一般性概念,而不是要用模型对具体系统进行详细的预测

3. 一些有趣的「理想模型」



3.1. 从确定走向混沌:逻辑斯蒂映射


混沌系统有一个特点:即便我们完全知道了运动定律,两组差别很小的初始条件(在这里是指物体的初始位置、质量和速度),有时候也会导致系统随后的运动极为不同。这其中的关键因素在于非线性
之前在《随机漫步的傻瓜》读书笔记中,塔勒布也讨论了这个问题,他认为,现实中很多系统是非线性的是因为现实中的概率论往往不满足“独立性”的假设(下一次拿球的概率与上一次拿的是什么球有关)
他当时举了一个很重要的例子:波利亚罐子模型。一个罐子中有五个红球,四个黑球,三个黄球,两个绿球,一个蓝球。先随便抓取一个球,然后把它和另一个相同颜色的球放回到缸内。重复着这个过程,直到填满整个缸为止。
这里就用到了计算机仿真,仿真程序可以访问:波利亚罐子模拟器[1]
《复杂》一书中则列举了一个方程,从数学角度展示了结果是如何从确定走向混沌的。这个方程就是著名的非线性方程:逻辑斯蒂映射(logistic map)
这个方程具有这样的特性:值的变化会让方程从确定走向混沌。
  • 最终会收敛到 0.5;
  • 最终会在两个值(0.5580141 和 0.7645665)之间振荡,且周期为 2(2 个值);
  • 最终会形成周期为 4 的振荡;
  • 最终会形成周期为 8 的振荡;
  • 最终会形成周期为 16 的振荡;
  • 最终会形成周期为 32 的振荡;
  • 的振荡周期趋于无穷,变为混沌,在这种时候,小数点后 10 位的一点点变化,也会导致完全不同的运行轨道。
正如上面的逻辑斯蒂映射一样,系统从确定性通往混沌时都会存在突然的周期倍增,被称为「分叉(bifurcation)」。人们使用「分叉图(bifurcation diagram)」来表现分叉。下面就是逻辑斯蒂映射的分叉图:

逻辑斯蒂映射的分叉图,来自 Wikipedia

逻辑斯蒂映射非常反直觉的点在于:
  1. 表面上的随机可以来自非常简单的确定性系统。正因为如此,逻辑斯蒂映射还被用来在计算机中生成伪随机数;
  2. 在混沌状态下,如果初始条件有任何的不确定性,对一定时间之后的轨道就无法再预测了;这意味着,在混沌状态下,即使我们的模型很简单,所有的参数也都完全确定,长期预测也仍然是不可能的。

3.2. 介于一维和二维之间的分形:科赫曲线


一般来说,分形是指在任何尺度上都有微细结构的几何形状,且往往具有自相似性。
「科赫曲线(Koch Curve)」是满足这样一种规则生成的分形曲线:将每段线段等分成三段,中间一段替换为一个三角形的两条边,每一边都等于原线段的 1/3。具体见下图:

科赫曲线(Koch Curve),来自stackexchange.com[2]

对于分形,常见的空间维度完全不适用。
维度一般满足这样的规律:将几何结构从各边分成等份,不断重复这个过程。每次得到的将是前一次的个拷贝。
对于科赫曲线来说,每次直线段都是之前的 1/3 长,而得到的则是之前的 4 个拷贝。因此根据前面的规律,科赫曲线的维数是 1.26,而且,如果你在每次应用规则后测量科赫曲线的总长度,你会发现每次长度增加为原来的 4/3。

3.3. 计算机里的「生命」:生命游戏


1970 年数学家康威(John Conway)设计了一种非常简单的两状态通用图灵机,被称为「生命游戏」。康威将状态为开的元胞看作活的,状态为关的元胞看作死的。并设定了规则:
  1. 出生:死元胞的相邻元胞中如果刚好有 3 个是活的,下一步就变成活的;
  2. 存活:活元胞的相邻元胞有 2-3 个是活的,下一步就能继续存活;
  3. 死亡:
    1. 过于稀疏:活元胞的相邻活元胞如果少于 2 个就会死去;
    2. 过度拥挤,活元胞的相邻活元胞如果多于 3 个就会死去。
关于这个游戏,可以看一下 B 站上的视频《生命游戏:几个方格演变出一个世界[3]》,会有比较直观的了解。非常有趣。

4. 启示和思考



4.1. 幂律和分形的关系


对于分形来说,分形维的定义为,可以发现分形维数就是幂律指数,而维数量化的正是分布的自相似与放大倍数的比例关系。也可以说,分形导致了幂律,分形结构是产生幂律分布的一种方式;如果你发现某种量(例如代谢率)遵循幂律分布,你就可以猜想这是某种自相似或分形系统导致的。

4.2. 从自然中学习如何在复杂系统中生存(对投资的启示)


在《复杂》一书中,作者是这样描述蚁群寻找食物的方式的:蚂蚁们要通过一种策略,既要保证考虑到每种可能性,但又能够区别不同可能性的概率。他们使用的解决方案是让大部分蚂蚁采取两种策略的组合:不断随机搜索与简单地跟随信息素轨迹并沿途留下更多信息素的反馈机制相结合,也即并行级差扫描(parallel terraced scan),这是一种探索不确定环境的方案。
并行级差扫描」是指对许多可能性和路径同时进行探测,某项探测所能获得的资源依赖于其当时的成效。搜索是并行的,许多可能性被同时探测,但是存在“级差”,意思是并不是所有可能都以同样的速度和深度进行探测。利用获得的信息不断调整探测,从而有所侧重。
以蚁群为例。
蚁群中搜寻食物的蚂蚁随机朝一个方向搜索,如果遇到食物,就返回蚁穴,沿途留下作为信号的化学物质——信息素(pheromones)。当其他蚂蚁发现了信息素时,就有可能会沿着信息素的轨迹前进。信息素的浓度越高,蚂蚁就越有可能跟着信息素走。如果蚂蚁找到了那堆食物,就会返回巢穴,将信息素的轨迹增强。如果信息素的轨迹得不到增强,就会消失。
开始时许多蚂蚁随机寻找食物。一旦在某个方向发现了食物,就会分派更多的系统资源(蚂蚁),通过前面描述的反馈机制,进一步探测这个方向。路径得到的探测资源不断通过其相对绩效——所发现食物的数量和质量——进行动态调整。但是,由于蚂蚁数量很多,再加上具有随机性,绩效不好的路径也会继续探测,当然分派的资源会少得多。
在复杂系统中,随机分散探测与集中行动之间会根据需要不断进行调整。开始时所知的信息很少,探测基本是随机分散的。随着信息增多并产生影响,探测逐渐变得具有确定性,集中于对系统的感知进行响应。
这部分的内容,我在之前的笔记中有涉及一些(参见《适应性市场》读书笔记Yestoday Newsletter No.009),或者可以参考刘强的《环境的变化升维与底层的自适应性》。这篇文章我也做过笔记,这里我将笔记再发一遍,可以作为这个话题的补充:
企业的自适应系统和非自适应系统
  • 企业的自适应系统是指企业对稳定环境的适应系统,即上文所提到的「公司内在的商业模式」,这种商业模式具有一定的自适应性。在系统性风险没有发生的时候,这种自适应系统可以不断优化追求最优解。重点在对已有环境的「开发」;
  • 企业的非自适应系统是指对变化和不确定环境的应对系统。拥有非自适应系统的企业往往能在系统性风险来临的时候存活。重点在对未知环境的「探索」。
  • 在稳定的生态系统中,优化行为是普遍的最佳策略,而在快速变化的生态系统中,探索行为则是普遍的最佳策略。
两种类型的管理层
  • 具有自适应性系统的管理层需要从基础运营中获得稳定的现金流来源。具有经常性收入、长期合同、或者习惯性的消费者购买等特征的企业中往往会出现这样的管理层。
  • 具有非自适应性系统的管理层(或者称为「具有远见卓识的管理者」)倾向于目标驱动、内在动机和增长导向,可以在错误的方向上大胆下注,进行旨在实现长期目标的投资,但在短期内可能看起来很愚蠢。
如何理解两种系统的适用范围
  • 事实上,这两种类型的管理层没有绝对的好坏之分,而要取决于公司在其生命周期中所处的阶段及其基础业务,以及其所处的环境。
  • 如果投资者投资于行业稳定的企业,那么价值投资者对优化(即以开发为重点)管理团队的总体偏好是完全合理的。但在投资充满活力的行业时,投资者应坚持投资于有远见(即以勘探为重点)的管理团队。
  • 成功的有机体会根据环境的不同将这两种策略进行不同的混合。
    • 只追求探索的风险:过度地探索新事物,而忘记实际享用他们发现的利润池;
    • 只追求开发的风险:一旦改变它们所处的生态系统,它们可能会措手不及,忘记如何探索。
价值投资者往往会高估自适应性系统的价值,低估非自适应性系统的价值。
  • 价值投资者对具有自适应性系统的管理层更为满意,因为它们的有效性在季度和年度业绩中经常表现出来。
  • 具有非自适应性系统的管理层其回报特征更类似于看涨期权,而非确定性,这也导致估值与当下的业务规模相比处于较高的位置。
  • 如果以传统的价值投资思路来看,后者面临着大量的不确定性,同时商业模式有可能也未经验证,持有这样的公司不是很好的选择。
对价值投资的启示
  • 构建投资组合:既要有在相对稳定的行业中运行的具有稳固自适应系统的企业,同时要有在充满活力的行业中运行的具有远见卓识的企业。
  • 关键判断因素:无论是我们自己,还是我们所投资的企业,都要能认识到什么时候需要前一个系统,什么时候需要后一个系统。

5. 冷知识



《复杂》一书中还提供了很多我之前不知道的知识,也摘录一些。

5.1. 信息熵


严格来说这个不是书中的内容,而是我自己找到的。B 站上有一个《如何理解信息熵[4]》的视频,我认为可以比较直观的了解信息熵。

5.2. 可以自我复制的程序


作者构建了一个能够「自我复制」的简单程序,并指出自我复制的本质在于信息的双重使用,即用两种方式来使用内存中的信息:既作为执行的指令,又作为这些指令使用的数据。
程序如下(假设程序的行号对应 ip 值,从 1 开始):
program selfcopy
 L=ip-1
 {
  print(line[L])
  L=L+1
 }
 print("end")
end

5.3. 生物基础代谢率和生物体重之间的关系


早年有人提出所谓「表皮猜想(surface hypothesis)」,即为了安全地发散热量,大自然让我们的代谢率与体重的比例关系同表皮面积一样,代谢率同体重的 2/3 次幂呈比例。但与实际数据不相符。
但是通过实际数据验证,人们发现代谢率与体重的 3/4 次幂呈比例,这个关系被称为「克莱伯定律(Kleiber’s law)」。
此外,实际数据还显示,很多物种的平均生命期是体重的 1/4 次幂,平均心率是体重的 -1/4 次幂。所有这些关系被称为「四分幂比例律(quarter-power scaling laws)」。
这些数据很早就被观测到了,但是却缺乏比较好的解释。
复杂性科学对此提出了自己的解释:代谢比例理论(Metabolic scaling theory,或简单代谢理论)。这个理论认为,代谢的网络结构是分形的,因此遵循幂律定律。他们假定网络向身体组织提供燃料的「终端单元」大小不随体重变化。之所以是 3/4,是因为进化将我们的循环系统塑造成了接近于「四维的」分形网络(虽然生物是三维的,内部的生理结构和运作却表现为四维……分形几何给了生命一个额外的维度),3/4 就是将「表皮假说」应用到四维生物的结果。

5.4. 「基因开关」


DNA 测序发现许多不同的物种 DNA 却很相似,而且胚胎学家发现,不同物种之间,调控身体部位发育的「主导基因」DNA 序列有很多相通之处,但物种形态却非常多样。有一种观点认为,物种形态多样性的主要来源不是基因,而是打开和关闭基因的基因开关(genetic switch)
基因开关是不编码蛋白质的一串 DNA 序列,它们以前被认为是「垃圾基因」的一部分,但现在发现有基因调控的作用。这些基因与特定的调控蛋白质结合来决定基因的开关。也就是说,基因调控网络包括功能基因和调控基因
根据进化发育生物学,生物的多样性主要来自开关而不是基因的进化。这个理论能够很好地解释为什么物种可以在很短的时间内发生剧烈变化,因为主导基因没有变,变的是基因开关。此外,这个理论还很好地解释了为什么会存在「趋同进化(convergent evolution)」,因为可能不同物种都有一套类似的主导基因,只是基因开关不同。
进化发育生物学还有一个神奇的结论:任何生物的身体形态类型都受主导基因高度约束,进化可能性是有局限的。








参考资料

[1]

波利亚罐子:http://success-equation.com/urn.html

[2]

stackexchange:https://math.stackexchange.com/questions/3005409/koch-curve-from-cantor-sets-paradox

[3]

生命游戏:https://b23.tv/DwweQu1

[4]

信息熵:https://b23.tv/Qj5wOnb


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存