瑞典疫情分析之,到底有没有拐点
上次我说根据大众健康局最新数据和预测模型,拐点可能真的来了,并说拐点出现在20号左右,到时死亡人数共达1400人。我自己打自己脸一下。如果现在问我会不会近期出现拐点,我只能说,出现拐点的概率远小于数据再次被修改的概率。
其实如果按照大众健康局今天出来的数字(2020-04-23),是下面的图,就算不选用较不准确的近三天的数据建立模型,也能做出十分乐观的预测(虚线),也就是我们所说的,拐点终于出现了。这么看起来我的预测也不算差了很多。
图一,大众健康局2020-04-23公布的死亡数据,每百万人死亡总数。Day 1 从03-11开始
但凡事需要多做一点点分析。因为我们知道大众健康局在周末和假期有许多数据没有录用,所以之前有过瑞典周末不死人的戏称。上一篇说到大众健康局会在事后修正数据,这其实是很好的做法,因为任何预测和数学模型都需要建立在可信的数据的基础上。靠别人不如靠自己。我们来看看大众健康局到底提供了怎样的数据。
下图很一目了然了,我们看到了三个拐点,分别是大众健康局于0407,0414和0423(今天)提供的数据算出的每百万人死亡总数。我们看到,拐点总是快要出现了,但是事后都会发现,可能根本没有什么拐点。比如最近这几天,看起来曲线很平,死亡人数增长缓慢,但可能十天八天以后,我们再看大众健康局的数据,会像今天看待4月14日的数据一样。
图二,大众健康局2020年04-07,04-14和04-23公布的死亡数据的对比,每百万人死亡总数。Day 1 从03-11开始
下图进一步看出大众健康局在这三个时间节点发布的每日死亡数据。可以看出过去14天,死亡数据被大大修正,当日收录的比实际死亡人数少50人以上,最多的漏报比如4月14日,少收录超过100个死亡人数。注意到我取得这几个时间节点,都不是节假日。
其实当日漏报,过后补录,也不是什么特别大的问题。最大的问题是,我之前说过的,这让人为操纵数据成为可能。完全有可能人为让数据看起来positive或者negative。所以凡事都要多一点critical thinking,最起码看到现在的数据,完全看不出来好转的趋势。建议大家还是继续该窝家的窝家,该带娃的带娃。
最后想跟大家聊一聊,和疫情数据分析没有太大关系。疫情爆发,每个人都有自己的观点。现在互联网深入生活,大家每个人都接受了各式各样很多的信息。哪些信息是有用的,哪些信息是垃圾呢?当然每个人都觉得自己的观点最聪明,最正确。现在互联网的发达,尤其是网络推送,不管是朋友圈也好,知乎,fb,instagram,都是给你推送你想看到的,然后你看到的推送更加确认了你的观点,让人在此观点上走的越来越远。所以每个人看到的世界,都是不一样的,都是自己想看到的世界。我觉得此时,应该刻意多看一看别的,看看纯新闻,第一手新闻,不要看推送,去看看bbc,cnn,svt,看看ecomonist。观点相互矛盾也好,就算都是盲人摸象,那么看到了一个大柱子一个大扇子,也能从各个盲人那拼凑出大象的样子,而不是看到了一个柱子,然后又一个柱子,然后许多许多的柱子。
还是那句话,希望大家都stay safe!