100倍的压力下的上海牌操作系统运行状况
做完今天临时通知的核酸的志愿者工作,已经快到深夜了。在过去的9天里面,看到了一个操作系统在重压之下必然会出现的各种现象。简单做个提纲。
排队系统是为了解决波峰波谷问题。排队用来把时间平移,消峰填谷。
如果顾客愿意长时间排队到深夜/凌晨吃饭的话,麦当劳用4个位置就可以服务一天的所有顾客。
当排队的人不断增加,处理能力无法立刻增加,排队长度就会不断增加,从1天到3天,到9天。大家的感觉是什么都需要等。怎么等都等不来。
如果供应过多,超过了系统承受能力,就如同洪水一样,来时1个小时,却需要几天慢慢退却。
一个系统,如果是由多个节点组成,一旦一个或多个节点出现过载,会导致依赖它的节点等待超时,从而引发连锁反应。网络里面叫做“雪崩效应”。我们集体经历了一场社会系统雪崩。
当复杂系统负载一旦增加,它的运行效率可能会骤降,从而雪上加霜。比如,高速公路负载一旦过载5%,车速就会明显下降,从而导致每分钟通过的车的数量急剧下降。当需求增长十倍,处理能力减少90%以后,100倍的差异,任何复杂系统都会瘫痪。
当系统瘫痪以后,需求会不合理上涨。正常情况一人一天访问一次健康码,一旦系统变慢或者瘫痪,每人每分钟会刷5次健康码。从中快速恢复是工程上的难题。
数学:分子除以分母等于每份的数量。如果一个隔离病人有丰盛的4菜一汤,当病人数量增加10倍,可能供应还有余量;再增加10倍,达到系统上限;再增加十倍,每个人平均只有半个鸡腿;再增长十倍,每个人只能吃上一口米饭。再增长十倍。。。。当需求指数增长的时候,总有突破任何储备的时候。
任何事情都需要调整时间。当业主看到楼下的物资没有人运输,在群里面要求不顾封控,冲下去自己拿;到我们完成志愿者招募,组成志愿者团队,分配保护装备,做好分工,到第一箱货物开始运输,我们用了2个小时。而一个城市完成这样的反应,以周计算。
在一个需求骤增的系统中,排队时间增长,系统死锁,服务无反应,每个人分到的资源少得可怜,大约需要一段时间才能慢慢缓解,城市慢慢活过来,这是一个复杂系统恢复必然的过程。