查看原文
其他

失败

孟岩 孟岩 2022-10-20

题图:晴雨  | 摄影:孟岩

在《运气》的结尾,我这样写道:

这并不是一个因果关系主导的世界,偶然性、或者说运气,在其中起了很大的作用。

但我们依然可以找到方式与运气相处:

1)不下牌桌,长期坚持做一件事;

2)提升自己做这件事的数学期望,或者说成功的概率。

这听起来没错,也似乎能减少我们的焦虑。

但一旦回到事情上,当我们继续尝试时,焦虑感又会袭来:

我们的能力提升了吗?我们离成功还有多远?

最近,在命运女神的指引下,我非常偶然地看到了一篇研究「失败」的论文,从科学而非直觉的角度,解答了我的这些问题。

这篇文章我没有顾及篇幅,写了 6000 字。另外,由于涉及到对论文的解释,也有些难。阅读下来,可能会需要很长的时间。

但我相信,这些时间会有所收获。

 

1

 

这篇论文的题目是《Quantifying dynamics of failure across science, startups, and security》(论文链接见阅读原文),作者是来自美国西北大学、芝加哥大学以及圣塔菲研究所的几位科学家。

研究者们认为,在人们取得成功之前,通常会经历很多次失败。但是,人类对于失败动力的研究少之又少。他们希望通过研究,找到「失败对成功」的真正启示。

我喜欢这个方向。

小时候,老师经常挂在嘴边的一句话就是「失败是成功之母」,而老师经常引用来证明这句话的例子,就是失败了 1000 次的托马斯·爱迪生。

在测试了 1000 中不同材料后,爱迪生终于成功地发明了第一个商业上成功的灯泡。于是他说了下面这句著名的话:

「生活中的很多失败,乃是由于很多人没有认识到,在他们放弃的时候,他们是多么接近成功。」

但说实话,当我小时候第一次听到这个故事的时候,我内心的声音是这样的:

我真的不想失败 1000 次。

慢慢的,我经历了大大小小、各种各样的成功和失败,也亲眼见证了越来越多人的案例。

我真的看到过很多人不管做什么,都能很快的上手并成功,但也发现更多的人,困在不断的尝试中无法前进。

区分他们的究竟是什么?

我期待这篇论文能给我答案。

 

2

 

为了更好地研究这个问题,科学家们需要仔细选择用来研究的样本集。

首先,这些样本集必须是巨大的。毕竟,一个爱迪生的背后,可能有 1000 个始终没有走向成功的人。

其次,这些样本集应该能清晰地记录个体反复失败直到最终成功的尝试过程;

最后,这些样本集还应该能量化评估每一次尝试的效果。

在这些约束条件下,研究人员选择了以下三个不同领域的数据库。

1)NIH 科研经费申请(NIH Grants)

这个样本集包含了从 1985 年到 2015 年,由 139,091 名研究者提交给美国国立卫生研究院(NIH)的所有与 R01 有关的科研经费申请。

科研经费申请最终获得的百分位得分,不但决定了科研经费是否能被批准,同时也可以用来近似地衡量一次申请的「效果」,或者说「评分」。

另外,这个样本集中还包含了每个研究员的历史提交记录。这样,就可以从经费申请信息的历史中,找到那些经历了多次失败,但最终获得成功(申请通过)的研究员。

2)创业公司(Startups)

这个样本集主要采用了由美国风险投资协会提供的 VentureXpert 数据库中的创业投资记录,其中包含从 1970 年到 2016 年的 58,111 家创业公司的 163,106 轮融资。为了数据的严谨性,研究人员还与 Crunchbase 交叉验证了个人企业家的信息,最终还原了 253,579 位创业者的创业轨迹。

创业者的每一次创业的最终投资额,被用来近似地衡量一次创业的「效果」或者「评分」。而最终成功的定义是:上市(IPO)或者被高价值并购。

为了解决初创公司融资的「贬值」问题,比如 1990 年拿到的 100 万美元和 2010 年的 100 万美元价值完全不同,科学家们还通过对数化等方式进行了处理。

3)恐怖袭击(Terrorist Attacks)

这个样本集从全球恐怖主义数据库中收集了从 1970 年到 2017 年,由 3,178 个恐怖组织所策划的 170,350 次恐怖袭击。

对于每个恐怖组织,一次尝试的「效果」或者「评分」用导致受伤的人数来衡量。

「成功」被定义为至少引起一人死亡,「失败」则被定义为无人死亡。

 

3

 

在我前面写下的与运气相处的两个方法中,「不下牌桌」是希望通过时间和不断的尝试,来降低随机性的干扰。而「提高能力」是期待在过往失败中学到些什么,提高下一次尝试成功的概率。

科学家们的研究,也是从这两个方面开始入手:运气和学习。

先来看看「运气」。

如果说一次尝试的成功和失败,完全是由「随机性」和「运气」所主导的,那么多尝试几次,次次都失败的概率,一定会随着尝试的次数呈现指数型的下降。

这张图左边所说的是,第一次尝试和倒数第二次(Penultimate)尝试成功的概率一样。而右边所说的是,随着尝试次数的增加,失败的概率指数型降低。

再来看看「学习」。

科学家们分析了上面三个样本集的数据后发现,对于最后取得成功的人来说,倒数第二次尝试的效果(或者说评分)显著地比第一次尝试要高(下图左)。

这也说明,人们所做出每一次尝试并不是随机地掷骰子,他们确实从过往的失败中学到了什么,提升了自己的能力。

如果是这样的话,不断从失败中学习带来的能力提升,会减少获得成功所需要的失败次数。失败曲线(下面右图)应该呈现比「运气」模型的指数曲线更「窄」的分布。

但是,当科学家把上述三个样本集的真实数据进行统计后,他们发现最终的失败分布曲线都遵循「肥尾分布」,不但没有比「运气」模型的指数型尾部要窄,甚至还要更宽。

也就是说,「不断尝试」、「从失败中学习」,确实有助于提高成功的概率,但在最终成功之前「需要」失败的次数,显然比预期的要多。

更残酷的是,对很多人来说,尝试到一定阶段,他最终能成功的概率就不再提升了。

换句话说,他们可能会一直失败下去。

 

4

 

这带来了一个有趣的问题:失败究竟是被什么影响的?运气和学习,究竟如何主宰我们未来的成功?

为了进一步研究这个问题,科学家们通过对各种学习模型的对比,最终设计了一个简单的单变量模型,来模拟人们从失败中学习、并进行下一次尝试的过程。

首先,科学家们认为,每一次尝试都是由许多不同的组成部分(简称「模块」)组成。

以 NIH 科研经费申请为例,模块包括构建生物概述、编制预算、编写数据管理计划、添加初步数据、概述影响广泛性等等。

当尝试者在经历了一次失败,再做一次新尝试的时候,他会对上述的每一个模块做如下处理:

1)创建一个新版本(概率为 P);

或者,

2)重用前 k 次尝试中的最佳版本(概率为 1 - P)。

什么时候创建新版本呢?显然不是随机的。

我们对之前的版本越满意,我们创建新版本的动力和概率就越低。毕竟,创建一个新版本需要时间,而且最终的结果也不确定会更好还是更坏。

相反,如果复用过去的最佳版本,不但能节省时间,还能保留最佳的分数(假设我们对每个组成部分的每一个版本都有自己的评分)。

 

5

 

我猜你已经快读不下去,准备放弃了,我来举个例子。

假设,我定了一个目标:写出一篇「成功」的「投资实证」文章。

怎么定义呢?假设我用 10 万加的阅读量和 1 万加的「在看数」(看懂我的暗示了吗?😜)来定义「成功」。

每周,我的公众号文章都是向着这个目标的一次尝试,它们由以下模块组成:

  • 选择文章选题(写什么)

  • 确定文章的结构

  • 让内容更可读

  • 起一个好标题

  • 选择合适的时间推送

等等。

我目前已经经历了 202 次「失败」。

今天,是我向着「成功」发起的第 203 次冲锋。在这次崭新的尝试里,我会重新组装以上的模块,以决定我如何完成这次尝试。

拿「起一个好标题」这个模块来说。

在过去的 200 多次尝试中,我经历过《怎样衡量指数的内在收益率?》的惨痛失败,让我理解了在周日晚上推送这样一篇,标题看起来很硬核的文章,给读者带来的压力。

我也隐隐约约地意识到短一些、甚至两个字的标题,比如《当下》、《虚荣》,似乎效果还不错。

于是,这次我选择复用以前的某个版本,也就是「用很短的、文章中最高频出现的词语做为题目」,作为今天的尝试中,「起一个好标题」这个模块的版本。

于是,这篇文章的题目就变成了《失败》。

如果某个模块(比如「让内容更可读」)过往的版本都不令我满意,那我就可以选择用一个崭新的版本来进行尝试。

不知道你有没有意识到,在我最早的文章里,很少会用类似的案例来说明一段道理。

其实,这就是我在不断尝试、不断失败的过程中,针对「让内容更可读」这个模块所做出的改进。

 

6

 

科学家们还希望知道,对于每一个模块而言,当人们从以往的尝试中学习的时候,他会多大程度上参考过去的经验呢?

科学家们引入了一个参数 k,用来表示一个人在进行一次新的尝试时,考虑的先前尝试的次数。

比如说,当我从过往给文章起标题的经验中进行学习的时候,我脑海中考虑的是上周的文章?最近 1 年的文章?还是过往所有的 202 次文章?

如果 k = 0,意味着人们在做出新尝试的时候完全不考虑过去的失败,每次都重新创建新版本,这个模型其实也就退化为了上面的「运气」模型。

当 k 趋近于无穷大(∞)时,意味着要考虑过去的所有尝试,比如我需要考虑过往所有的 202 次文章。

在 k = 0 的运气模型中,「不断尝试」并未带来质量和效率上的改进。简单说,没有任何积累。

而随着 k 的增大,人们开始从失败中有效地学习,开始积累经验。尝试的效果不断提升,效率也得到了改进(尝试所需的用时减少)。

 

7

 

下一个问题是,随着 k 的不断增加,经验和知识的积累是线性的吗?

当 k 很小的时候,虽然比起 k = 0 有所改进,但和什么都不学的差别并不大,整体的改进非常非常缓慢。

比如说,假设 k = 2,我只能从过去的两次失败中得到经验,也许 1 年前的那些尝试,我就已经找到最好的答案了,但很小的 k 让这些经验无法得到运用。

下图左侧的停滞区域(黄色,Stagnation)就对应着这个时期。

当 k 超过了某个临界值 k*,经验开始快速积累,说明系统进入到一个快速进步的区域,在这个区域,「不断尝试」会导致质量和效率的持续改进。上图中间的绿色区域(Progress),就对应着这个时期。

然后,系统很快到达下一个临界值 *k** + 1,超过这个临界值,质量和效率不再提升。

这也意味着,只要考虑了足够多的过往经验,再多一些的意义不大。换句话说,你不需要参考过去所有的失败,足够多的过往经验,往往已经足以揭示真理。

这个观察非常有意思。

还是拿「给公众号取标题」来举例。

在我刚开始写公众号文章的时候,k 很小,基本上和没有知识也差不多,我每次也是跟着感觉走,随机乱试。

当 k 增长到一段,超过 k*(比如 50 篇),我开始快速从过往的反馈中进行改进,不断积累经验

当 k 继续增长到 k*+1 (比如 100 篇),更多的尝试已经不足以带来更多知识和经验了。100 篇的各种尝试,已经足以让我找到了给公众号起一个好名字的圣杯。

Gradually, then Suddenly.

知识和经验的积累,也是非线性的。

 

8

 

根据上面的建模和三个大型样本集的测试,科学家们发现了惊人的事实:

第一,并非所有的失败都会带来成功。

无论是 NIH 科研经费申请、创业公司还是恐怖组织,「不断尝试」但始终失败的案例比比皆是。

更关键的问题是,他们并非不努力,恰恰相反,他们做出了足够的尝试次数,但始终在失败。

第二,我们可以在很早期,就把成功者和失败者分开。

三个大型样本集的结果都向我们揭示:「最终成功组」,在早期的尝试中,会展现出性能的改进和效率的提升。而「非成功组」则完全没有这些信号。

面对同样的问题,初识时彼此差不多的人,也会因为学习方式的不同,在漫长的时间和不断尝试的过程中,产生巨大的分野,从而决定了最终的成功和失败。

第三,「成功组」和「失败组」最大的区别,在于如何复用以往尝试的模块。

复用有助于提高效率,也有助于我们保留好的版本。但是,也会让一个人在很长的时间内保持「次优」的状态。比如说,也许还会有更好的「给文章起名」的方式,如果我一直停在这里复用,确实节省了时间也能获得不错的结果,但可能失去了获得更好方式的可能性。

另外,对「停滞区域」的那些案例的研究也带来了另一个略带苦涩的事实:

那些一直在失败的人们,并没有偷懒,相反,他们做了更多的工作。

问题的关键是,他们对很多原本不错的版本做了很多不必要的修改。最终导致在积累经验和知识这件事情上随机游走,并没有真的提升。

 

9

 

如果让我对这些早期就能看出端倪的「成功者」做个总结的话,我会选择以下几个特点:

1)能把一个未知答案的复杂问题,有效地拆分成不同的模块;

(别小看这一点,就拿写出一篇不错的文章来举例,我曾经写了很久也不知道该如何去拆解)

2)在每一次新尝试的过程中,知道何时复用旧的版本,何时创造新的版本;

3)具有高效的从失败中学习的能力,能快速度过停滞期,达到进步区间,而不是随机游走。

 

10

 

这篇论文的几位作者,都是研究复杂系统的专家。

什么是复杂系统呢?

大到「天气预报」、「股市预测」、「创业成功」,小到「写出一篇阅读量高的文章」、「做一个用户喜爱的功能」、「获得不错的投资收益率」,甚至「稳定地用正手把网球打回对方半场」,这些由非常多因素互相作用,导致结果很难预测的系统,都属于复杂系统的范畴。

这篇论文,我看了 4 遍。

看完后,我似乎找到了开头那个问题的答案:

为什么有些人无论学什么都很快?

为什么有些人无论做什么都注定能成功?

我眼前仿佛浮现出这样一副景象:

任何一个复杂系统,都好像一个充满迷雾,没有地图的森林。

一个个探险者,就像被蒙着双眼,从空中丢进这片充满迷雾的森林中。而他们的任务,则是安全地从这个森林中找到出路。

不可避免,他们最初的几次尝试都会失败。

但是,不同的学习方式和积累经验的能力,会让他们变得越来越不同。

有人始终在撞大运,随机波动;

有人看似很努力,但根本没有积累有效知识和经验,最终的结果和撞大运也差不多;

还有人,通过失败不断收集信息,快速积累经验,而他们注定会在未来的某一次尝试中,获得成功。

 

11

 

最近半年,我花了很多时间参与产品团队的工作。

打造一个用户需要、并且喜爱的 App,也是一个复杂系统。

如果用上面的方法论去拆分模块的话,我会把它拆解为:

1)提出要解决的问题和假设;

2)针对问题,寻找解决方案;

3)带领团队将方案落地,推出功能;

4)获取用户反馈和使用数据,验证假设。

我们的每一次尝试,每一次迭代,其实都是在通过这些尝试收集更多的信息和反馈,在积累整个团队在「产品」这个领域的信息和知识。

比如说,对于模块 #3,我们曾经花 2 个月推出一个大功能,但我们很快把它升级为「功能切小、2 周发版、快速试错」的新版本;

再比如,对于模块 #1,我们曾经用过「收集用户反馈和 NPS」的版本,也曾经用过「根据自己的感受寻找需求」的版本,每一次新的尝试,都给了我们更多信息,让我们意识到还可以寻找更好的方式。

这里面,有些我们已经进入了成长期,也有些,我们还在停滞期。

 

12

 

有知有行 1 周年的时候,有一位用户问了一个问题:

「我想知道当有知有行团队做出了一个功能没有得到很好的用户反馈(数据反馈)时,你们是怎么做的?」

我的回答是:

「如果我们的目标是学会骑自行车的话,之前无论怎么摔跤,我们都不会失落。爬起来,想想哪儿做的不好,坐上座椅,再试一次。」

过去半年的经历,以及命运之神送来的这篇论文,让我更深刻地认识到这一点。

人生又何尝不是如此。

失败,确实会带来痛苦。但另一方面,我们也可以把它当作,在探索人生这个复杂系统的过程中,必要的收集反馈和积累知识的方式,当作把自己变成一个更好的人的机会。

别忘了,在人生这场每个人的《无限游戏》中,最终让所谓的成功者和失败者慢慢分野的,正是我们对待失败的方式。


本周操作

  • 9 月 3 日:买入 5 万富国消费


最新净值

实盘投资周报第 203 期,最新的资产是 7,750,540.91,基金净值是 1.5111,本周增长 1.20%

市场有风险,投资需谨慎。本记录不代表任何推荐之用,仅作为自己的长期投资验证。投资者应保持独立思考。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存