其他
卫健委的“糊涂账”
本文作者:张馨月
文字编辑:朱巧利
1月23日之前:可防可控,数据真空
1月23日至今:瘟疫攻城,携手战疫
自封城以来,卫健委每日发布的数据相对较为完整,对新增数量、累计数量、跟踪数量等信息有明确的报道。但这之中也不乏存在一些问题,具体如下:
1.缺乏时间趋势分析
在每日发布的通报情况中,卫健委仅仅列示了前一日的疫情状况,而从未对数据的突增突减做出任何解释。
我们选择了几项指标画出时间趋势,或许能带来更多的思考。
从中可以得到一些积极的信息:
比如,从1月30日起,与新增死亡人数相比,新增治愈出院人数显著增加。
比如,自2月3日以来,湖北省外的新增确诊数量呈现出连续下降的趋势。
2.缺乏面板分析
关于各个省市的疫情发展状况,我们从卫健委发布的通报中获得的信息寥寥如下。除了对各省新增死亡的具体报道,其他信息仅仅对湖北省的情况进行了说明。想要了解疫情在全国或本省的现状,只能通过地方平台或其他媒体平台获得了解。
而对于湖北本省而言,虽然公布了各市的数据,仍然不足以说明势态发展如何。
在疫情最初蔓延的一段时间内,全国的注意力都集中在武汉市上,而忽略了武汉周边的城市。以新增确诊病例为例孝感市、黄冈市疫情最初爆发增速便达到数十例、数百例。与荆州、荆门等市相比,潜江市与武汉的距离更近,但疫情一直得到了良好的控制。疫情的肆虐,是否应当全部归咎于病毒的传染性?
3.数据足够准确吗?
绘图程序如下:
use total_data,clear
*全国累计确诊
scatter 累计确诊 date , mfcolor(blue%40) mlcolor(black) msize(*0.3) ylabel(0(10000)70000,angle(0)) xlabel(#10) ///
mlabel("累计确诊") mlabsize(*0.4) mlabposition(12) mlabcolor(red) connect(l) ///
ytitle("累计确诊", placement(north)) xtitle("日期",placement(right)) subtitle("全国累计确诊人数",position(6) box bcolor(white))
*疫情初期全国累计确诊人数
scatter 累计确诊 date if id<16, mfcolor(blue%40) mlcolor(black) msize(*0.5) ylabel(0(50)600,angle(0)) xlabel(#10) ///
mlabel("累计确诊") mlabsize(*0.7) mlabposition(12) mlabcolor(red) connect(l) ///
ytitle("累计确诊", placement(north)) xtitle("日期",placement(right)) subtitle("疫情初期全国累计确诊人数",position(6) box bcolor(white))
*新增出院与新增死亡人数对比
twoway (scatter 新增出院 date if id>15 , mfcolor(blue%40) mlcolor(black) msize(*0.3) ylabel(0(200)1400,angle(0)) xlabel(#10) ///
legend(label(1 新增出院) label(2 新增死亡) region(lpattern(blank) fcolor(none)) pos(10) cols(1) ring(0) order(2 1) size(*0.8)) ///
mlabel("新增出院") mlabsize(*0.5) mlabposition(12) mlabcolor(red) connect(l)) ///
(scatter 新增死亡 date if id>15 , mfcolor(blue%40) mlcolor(black) msize(*0.3) ylabel(0(200)1400,angle(0)) xlabel(#10) ///
mlabel("新增死亡") mlabsize(*0.5) mlabposition(12) mlabcolor(red) connect(l) ///
xtitle("日期",placement(right)) subtitle("新增出院与新增死亡人数对比",position(6) box bcolor(white)) )
*近期湖北省外各省新增人数
scatter 各省新增 date if id>26, mfcolor(blue%40) mlcolor(black) msize(*0.3) ylabel(0(100)1000,angle(0)) xlabel(#7) ///
mlabel("各省新增") mlabsize(*0.5) mlabposition(12) mlabcolor(red) connect(l) ///
xtitle("日期",placement(right)) subtitle("近期湖北省外各省新增人数",position(6) box bcolor(white))
*尚在观察接触者
scatter 尚在观察接触者 date if _n>15, mfcolor(blue%40) mlcolor(blue) msize(*0.3) ylabel(10000(20000)190000,angle(0)) xlabel(#10) ///
mlabel("尚在观察接触者") mlabsize(*0.5) mlabposition(12) mlabcolor(blue) connect(l) xtitle("日期",placement(right))
*新增确诊与新增疑似患者
twoway (scatter 新增确诊 date if _n>15 , mfcolor(blue%40) mlcolor(black) msize(*0.3) ylabel(0(2000)15000,angle(0)) xlabel(#10) ///
mlabel("新增确诊") mlabsize(*0.5) mlabposition(6) mlabcolor(red) connect(l)) ///
(scatter 新增疑似 date if _n>15, mfcolor(blue%40) mlcolor(blue) msize(*0.3) ylabel(0(2000)15000,angle(0)) xlabel(#10) ///
mlabel("新增疑似") mlabsize(*0.5) mlabposition(12) mlabcolor(blue) connect(l))
*新增死亡与累计死亡人数
twoway (scatter 新增死亡 date if id>15 , yaxis(2) mfcolor(blue%40) mlcolor(black) msize(*0.3) xlabel(#10) ytitle(新增死亡.axis(2)) ///
mlabel("新增死亡") mlabsize(*0.5) mlabposition(12) mlabcolor(red) connect(l)) ///
(scatter 累计死亡 date if id>15 , mfcolor(blue%40) mlcolor(blue) msize(*0.3) ylabel(0(200)1600,angle(0)) xlabel(#10) ytitle(累计死亡) ///
mlabel("累计死亡") mlabsize(*0.5) mlabposition(6) mlabcolor(blue) connect(l))
*全国死亡率与湖北死亡率对比
twoway (scatter 死亡率 date if id>15 , mfcolor(blue%40) mlcolor(black) msize(*0.3) ylabel(0(0.01)0.1,angle(0)) xlabel(#10) ///
legend(label(1 死亡率) label(2 湖北死亡率) region(lpattern(blank) fcolor(none)) pos(2) cols(1) ring(0) order(2 1) size(*0.8)) ///
mlabel("死亡率") mlabsize(*0.5) mlabposition(6) mlabcolor(red) connect(l)) ///
(scatter 湖北死亡率 date if id>15 , mfcolor(blue%40) mlcolor(black) msize(*0.3) ylabel(0(0.01)0.1,angle(0)) xlabel(#10) ///
mlabel("湖北死亡率") mlabsize(*0.5) mlabposition(12) mlabcolor(red) connect(l) xtitle("日期",placement(right)) subtitle("全国死亡率与湖北死亡率对比",position(6) box bcolor(white)) )
*疫情爆发20天内湖北省新增人数
use hubei_2_11,clear
mkmat 武汉 鄂州 天门 十堰 荆门 潜江 孝感 随州 黄石 宜昌 恩施州 黄冈 襄阳 荆州 仙桃 咸宁 if _n<21 ,matrix(C)
mat C1=C'
heatplot C1,values(format(%6.0f) mlabsize(*0.5)) color(hcl,diverging intensity(0.5)) xlabel(none) cut(0(10)1000) ramp(right space(15) subtitle("") label(@min "low" @max "high")) note("疫情爆发20天内湖北省新增人数",position(6) )
关于我们
微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。