躺平or内卷,或许这条数学定律能帮你选择最优解
点击上方蓝字“返朴”进入主页,可关注查阅往期文章
1
在大自然中,动物为了摄食或者繁衍后代,往往面临着收益与体力的抉择。比如大山雀在灌木丛中捕食,开始它会很容易找到毛毛虫,一段时间后则越来越难以找到,甚至最后找到食物却不足以弥补寻觅过程的体力消耗。那么,什么时候应该离开这片区域,另寻他路?人们惊奇地发现,动物往往会本能地选择最优解决方式,即将所得收益最大化。而在数学上,这就是边际价值定理所展现的。
翻译 | 施昊
懂得何时适可而止是我们人生中的一大难题。当面对收益递减时,选择坚持,还是放弃当下,以期将来获得更丰厚的回报,这样的困境比比皆是。对于每一座金矿来说,都会到达一个节点——继续开采所得到的黄金不能抵上所付出的成本,一旦这个时间点到了,就是时候放弃开采,开始寻找新的金矿了。
相似的,对于在灌木丛中以毛毛虫为食的鸟来说,当它们获得的卡路里不足以继续寻找更多毛毛虫的时候,也是时候放弃在这里捕食,应转而去另一片灌木丛。同样,对于蜜蜂而言,收集花粉的重量与其所需能量不相匹配的时候,此时应停止收集,该飞回蜂巢了。
幸运的是,数学上有个解决方案——边际价值定理(Marginal value theorem,1976年由美国生态学家Eric Charnov提出)。边际效益理论明确指出了何时放弃以获得最大的回报。更重要的是,从最初的最佳觅食理论到大脑如何处理信息,边际价值定理已经有了很广泛的应用。本质上,无论你所付出或收获是什么,边际价值理论提供了一种一般的策略,即将每份付出所得最大化。
捕食中的瓢虫
瓢虫和蚜虫丨图片来源:Greyson Orlando
瓢虫以蚜虫为食,但是看瓢虫吃蚜虫就像看人类吃龙虾,因为蚜虫的外骨骼对于瓢虫来说就像龙虾的外壳对于人类一样,难以直接穿透进食。一开始吃完最多汁的部分之后,往往需要越来越多的努力来获取越来越少的食物。人类面临这个难题往往懂得适可而止,转而享用别的美食。同样的,当瓢虫面临这样的问题,也知道什么时候放弃转而去找另一只蚜虫。
如果瓢虫过早的放弃眼前这只,它将会浪费掉容易获得的一部分食物。相反,如果过迟放弃,大费周章却得到的越来越少,而这三三两两本可以从另一只蚜虫身上轻松获得。显然,有一个既不过早也不太晚、“恰到好处”的时间来放弃。为了弄清楚这个“恰到好处”的时间点何时到来,我们需要更加详细地了解瓢虫的进食行为。
蚜虫类似于龙虾的解剖学性质意味着,如果让一只瓢虫只吃一只蚜虫,那么累计进食的重量会随着喂食时间t的增加而增加,如下图所示。(这个数据来自与R. M. Cook 和B. J. Cockrell 发表于1978年一篇经典的关于觅食理论的文章[1],这篇文章启发了我们举了瓢虫的示例。)
这些数据点可以拟合成收益函数E(t)=a(1-e-bt)。在我们的瓢虫例子里a=10.43,b=0.0245;我们可以用这个收益函数来定义两个量:
1. 即时收益率,r(t)=ΔE(t)/Δt,也就是每个时间周期Δt所增加的卡路里ΔE(t)(比如每分钟增加的卡路里);
2. 移动平均收益率,
这些量都有着相当直观的几何解释。由上述瓢虫的数据点拟合的收益函数如下图所示,展示了在食物在T时刻被发现之后的累积收益E(t)。
图中黑色的曲线是收益函数E(t),曲线的斜率是即时收益率r(t)。红色虚线表示移动平均收益率R(t)。这个图反映了瓢虫过早放弃蚜虫的情况。
在蚜虫被发现之后的点t,我们可以定义一个底边长为T+t,高为E(t)(黑色的垂直虚线)的直角三角形。这个直角三角形的斜边是一条红色的虚线,这条虚线的斜率等于
在上图中,进食的时间为t=10min,红色的虚线的斜率比较小;如果瓢虫延迟放弃进食,斜率将会变大,它放弃得太早了。如果进食时间超过10分钟,移动平均收益率R(t)将会变大。
同样地,如上图所示,进食的时间为t=55min,红色虚线的斜率也比较小,如果瓢虫提前放弃进食,斜率将会变大,它离开得太迟了。如果进食小于55分钟,移动平均收益率R(t)将会变大。
最后,进食时间t=35min产生了一个可能最大的斜率。这是最优的进食时间,如果此时放弃进食,移动平均收益率R(t)将会最大。
注意到“恰到好处”的进食时间发生在收益曲线的斜率r(t)等于红色虚线的斜率,也就是移动平均收益率R(t)的时刻。换句话说,恰到好处的进食时间发生在即时收益率等于移动平均收益率的时候:r(t)=R(t)。
可以用几何验证,即时收益率r(t)在下图用红色的虚线表示,移动平均收益率R(t)用黑色的实线表示。
正如我们预料那样,这两条曲线在“恰到好处”的时间相交(也就是r(t)=R(t))。从这种几何角度的分析有效证明了边际价值定理,也就是最佳的退出时间是当即时收益率等于移动平均收益率的时候,也就是当r(t)=R(t)。
在下面三个相当弱(温和)的条件下,边际价值定理是成立的:
1. 固定成本T大于0;
2. 收益函数E(t)随着时间t增加而增加;
3. 收益函数的斜率我们希望证明当R(t)最大时候,即时收益率r(t)等于平均收益率R(t)。为此,我们需要找到当R(t)最大时,r(t)的值。为了找到最大的平均收益率,我们要用到(平均收益率)在它的斜率为0处最大这个事实。
平均收益率被定义为:
以及它的导数是
根据定义,
是即时收益率,以及
把等式(3)和(4)代入到等式(2)中,可以得到
又因为
是平均收益率,所以公式(5)变成了
在最大值处,令上式等于0,
最后在等式两边同时乘上T+t,移项得
这就证明了当即时收益率等于平均收益率得时候,平均收益率将会达到最大。
瓢虫懂得边际价值定理
上述的分析假设了一个恒定不变的搜索时间T。但是,对边际价值定理一个妥当的检验应涉及到可变的搜索时间。本质上来讲,较长的搜索时间表明食物比较稀缺,因此相应地增加进食每只蚜虫的时间是有道理的。换句话说,在一只蚜虫身上花费的进食时间应该随着寻找到这只蚜虫所花费的时间增加而增加。然而,相比于这个正确但是模糊的结论,边际价值理论精准地预测了进食时间该如何随着搜索时间增加而增加,如下图所示。(再次使用了建立在Cook和Cockrell 1978年实验数据的收益函数)。
如果用40分钟找到一只蚜虫,瓢虫将会花费50分钟来进食这只蚜虫(红色的虚线);如果用10分钟找到了一只蚜虫,瓢虫将会花费28分钟来进食这只蚜虫(蓝色虚线)。
从上图中我们可以看出,边际价值定理预测以蚜虫为食的时间会随着寻找蚜虫的时间增加而增加。如果找到一只蚜虫需要40分钟,那么瓢虫应该花费大约50分钟来进食(上图中的红色虚线)。如果找到一只蚜虫需要10分钟,那么瓢虫应该只花费大约28分钟来进食(蓝色虚线)。
问题是,瓢虫会按照边际价值定理预测的时间放弃进食蚜虫吗?为了回答这个问题,Cook和Cockrell 将蚜虫随机散放在一个托盘里,然后测量瓢虫幼虫找到每只蚜虫所花费的时间T以及进食每只蚜虫所花费的时间t。(Cook和Cockrell 使用了瓢虫幼虫,不过这个并不是很重要。)
瓢虫幼虫平均进食时间如何随着找到一只蚜虫的时间变化:点表示实验中观察值,黑色的线表示由边际价值理论预测的进食时间。
上图显示了Cook 和 Cockrell 观察到的瓢虫幼虫的平均摄食时间如何随着搜索时间变化的:点代表着他们在实验中观察到的结果,黑色的曲线代表着边际价值定理预测的进食时间。经过多次实验,蚜虫的数量渐渐减少,使得搜索新的蚜虫的时间相应地变长。如预测的一样,随着搜索的时间增加(蚜虫的密度降低),每只蚜虫平均被食用的时间也会增加。更重要的是,这样随着搜索时间增加而进食时间增加的方式,在某种程度上和边际价值定理预测的一致,正如上图所示。
在这个特定的例子中,数据和理论之间的拟合不是那么令人印象深刻,这可能因为移动平均收益函数R(t)没有一个尖峰,因此提前一点或者推迟一点放弃进食所损失的收益相对来说比较小。相反,如果收益函数上升的十分陡峭,那么移动平均收益率曲线会有一个更高的锋,那么实验的数据和边际价值定理预测值可能会更加匹配。
动物懂得何时适可而止
大山雀的伟大智慧
假设一只大山雀花费了一些时间寻找到有大量毛毛虫的灌木丛。找到灌木丛后,大山雀开始每分钟可以吃到的大量的毛毛虫,但是过了一会儿,可以找到的毛毛虫数量下降了,因此每分钟可以吃到的毛毛虫数量也下降了。鉴于边际收益的递减,大山雀该何时放弃这片灌木丛而选择去寻找新的灌木丛呢?
正如上述的瓢虫例子一样,答案由边际价值定理得出。通过做类似于瓢虫实验的实验,科学家Richard Cowie在1977年发现边际价值理论可以正确预测大山雀放弃灌木丛的时间。
放弃交配
我们可以发现,寻找新的雌蝇所花费的时间,和前面例子中寻找新的食物来源(新蚜虫和新灌木丛)是类似的,和一只雌蝇交配的时间对应一个增加但是增量减少的收益。因此,边际价值定理能够预测一个雄性的粪蝇应当和每个雌性交配多久以保证尽可能多的后代,对此结果我们不应感到惊讶。1976年,科学家G. A. Parker 和 R. A. Stuart 观察到雄性粪蝇和每只雌性粪蝇的交配时间为36分钟,和边际价值定理预测的41分钟相当。
蜜蜂会因太忙而效率低下吗?
在一个极端的情况下,如果蜜蜂仅仅采集了一粒花粉后就返回,那么几乎肯定的往返蜂巢所消耗的能量会超过从花粉粒中获得的能量;另一个极端情况是,如果蜜蜂收集了大量的花粉,那么花粉会收集得很快,但是在飞回蜂巢的路上所消耗的能量将会占据从花粉中获得能量的很大一部分比例。两个极端情况之间有一个恰到好处的承载量——它为飞行中消耗的每一卡路里提供了(因采集花粉而获取的)最大能量。值得注意的是,蜜蜂连续采集花朵导致负载变多,收益是递减的。
科学家Paul Schmid-Hempel, Alejandro Kacelnik 和Alasdair Houston 在1985年的实验中观察到蜜蜂花粉的负载量和边际价值定理预测的相符合。简而言之,就每克收集的花粉所消耗的能量而言,蜜蜂在尽可能有效地收集花粉。相比之下,在一个基于每分钟收集速率最大化的模型下,与负载花粉的量拟合非常差。这表明,蜜蜂更偏向能源的效用化而不是花粉的收集速率。
大脑和边际价值理论
根据香农的信息论,信息的常用单位是比特(bit),它提供了足够的信息来在两个等可能的事件中进行选择,例如抛掷一枚硬币。但是,香农的信息定义了一个普遍的收益递减的规律,这意味着处理每一个比特信息所需要的能量随着每秒处理比特数增加而增加。因此,信息可以慢速低成本地处理或者高速高成本地处理,但是不能高速低成本地处理。
这个收益递减定律和瓢虫每秒吃的食物量的收益递减问题是类似的。不同之处在于,瓢虫想要最大化每秒平均吃掉的食物量,而神经元想要最大化每焦耳能量消耗能处理的平均信息量。鉴于这些相似之处,瓢虫问题和神经元问题都可以使用边际价值定理来解决。
能量效率随着神经元发放的速度变化。曲线的高峰预测了神经元的平均发放频率,与神经元最大化能量效率的想法一致。
边际价值定理可以根据能量消耗(代替进食时间)和信息处理(代替进食收益)来重新定义。由此得出的效率曲线表明,由边际价值理论预测的最大效率(以比特/焦耳为单位)出现在每秒约2个神经元峰值的发放频率下。重要的是,1996年科学家William Levy和Robert Baxter发现这一预测与对神经元的平均发放频率的观察结果是一致的。
因此,无论是用寻找蚜虫花费了多少时间,或者是神经元放电消耗能量,以及用每小时吃掉蚜虫还是每焦耳处理信息比特来衡量,边际价值定理具体说明了付出多少使得收益最大化。
参考资料
[1] https://www.jstor.org/stable/3799
本文译自James V. Stone, Knowing when to quit 原文链接:https://plus.maths.org/content/knowing-when-quit
相关阅读
近期推荐
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。
↓↓返朴书单,点击购买↓↓
长按下方图片关注「返朴」,查看更多历史文章