查看原文
其他

新世野 | 伤害不高?侮辱性极强。经济学人是如何揭穿新冠对国外造成的损失的?

海洋 WAVE可视化灵感库 2022-12-31

新世野是高下制图推出的数据可视化的案例推荐栏目,我们将定期为您带来全球优秀信息的可视化案例。


2020年是一个不平凡的年度,人类社会正面临着严峻的挑战——covid-19肆虐全球。如何衡量该流行病毒带来的损失变得尤为重要,从宏观上看,有利于专家对流行病的发展做出判断,从而帮助各个国家抑制病毒的进一步泛滥;从微观上看,这有利于普通民众了解真实的流行病毒危害,从而积极防护。




背景


受制于不同国家的政策制度以及经济水平,故官方给出的统计数据口径并不一致。这对于研究而言,就会出现很大的误差,真实的死亡人数往往是大于官方给出的数据。


《经济学人》为了解决这些客观难题,在衡量死亡率时他们会选择查看该地区的 "超额死亡",即用因各种原因死亡人数与往年同期的平均人数作比较。而他们的数据来源有两种:一是少数几个统计局定期提供的有关死亡率的公开数据;二是使用EuroMOMO(欧洲死亡率监测组织:European mortality monitoring)的数据。

接下来就带大家一起看看《经济学人》的记者是如何实际操作的!

实操




  • 对于每个国家或地区,记者将超额死亡人数与官方 covid-19 死亡数据进行了比较。


对于衡量病毒传播情况而言,最大的一个挑战就是每个国家收集数据的方式不同;除此以外,各国的数据质量和数据频率也不相同。就比如西班牙每天都会发布数据,但数据却有很大的滞后性以及不确定性;而英国虽然每周发布一次,但数据是值得信赖的。所以经济学人的记者就会采用前几年同一周的平均数来确定 "预期死亡 "基准。


  • 西班牙的每日总死亡人数经常被追溯修改。


◆  ◆  ◆  ◆  ◆  


对于一些发展中国家而言,受制于技术水平的因素,他们的死亡数据也是不可靠的;就比如土耳其官方甚至没有定期给出按地区分列的 covid-19死亡人数,所以记者只能根据4月1日的报告来估算。有时候就连一些发达国家也不能给出完整的数据,也需要记者根据以前的报告去预测。


  • 根据现有的数据,记者对伦巴第地区死亡总数和死亡人数的估计。


◆  ◆  ◆  ◆  ◆  


除此以外,记者还需要解决不同数据之间的格式和语言问题;通常他会采用 R 语言写脚本来帮助自己做数据清理工作。该脚本长约1000行,作用是把各个国家的数据输出为相同格式的 CSV 文件。然后将文件放入 Github  库,交由其他同事制作动态图表来进行数据追踪。


  • 记者使用 R 脚本来清理每个国家(通常是外语)的原始数据文件。



  • 转换后具有相同格式的 csv 文件。


延伸阅读
       除此以外,原文还介绍了 Euro MOMO (欧洲死亡率监测组织)是如何估算死亡数据的,并且附有详细访谈记录。您可以扫码或者点击阅读原文,了解更多内容

END
扫码阅读原文


图文丨海洋
编辑丨海洋



还在为如何制作精美图表苦恼头秃么?全新推出高下制图app,不断更新的制图模板,随心更改样式,轻松一键制图。现在积极参与高下制图内测,更有机会获得正式版会员,享受轻松作图哦。更多详情请扫码进群了解。










往期推荐

好享学丨「跨越山河,踏遍万里」口说无凭。在这里我终于发现了所有故事的秘密

好享学丨没想到我们与数据可视化,竟谈了场千年的恋爱!

好享学丨Seaborn:一行代码生成酷炫狂拽的数据集可视化

好享学丨为什么数据科学家需要了解可视化

新世野 | 麦肯锡瀑布图:打工人如何优雅地向领导汇报工作?

好享学|涨姿势!神奇的 r 语言竟能折千纸鹤?还有更多惊喜等待解锁




点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存