查看原文
其他

各省市的疫情历史数据来了!

Y叔叔 biobabble 2020-02-04

检索疫情数据的R包来了》一文介绍了nCov2019包,用于检索在线的最新数据。然而大家最关心的,是历史数据,能不能获得之前每一天的历史数据呢?这个包现在更新到了0.0.2版本,解决了这个问题。

首先要感谢【新一线城市研究所×8点健闻】,他们整理了全国各城市新型肺炎疫情详情,并且联系我,提供给我打包进nCov2019包里,供大家研究。

在现在0.0.2版本中,可以使用load_nCov2019获得历史数据:

library(nCov2019)
x <- load_nCov2019()
x
## nCov2019 historical data
## last update: 18294

各省市详情

还是原来的用法,只要使用[就可以拿到和个省下面各个市的数据,这个数据有非常详细的注释。

> head(x['湖北',])
province city time cum_confirm cum_heal cum_dead 累计重症病例 累计危重病例 confirm heal dead
4 湖北 武汉 2020-02-02 5142 265 1033 41 53
5 湖北 黄石 2020-02-02 334 2 82 0 8
6 湖北 十堰 2020-02-02 256 0 44 0 2
7 湖北 襄阳 2020-02-02 548 0 107 0 0
8 湖北 宜昌 2020-02-02 392 1 39 0 1
9 湖北 荆州 2020-02-02 499 6 166 2 2
新增重症病例数量 新增危重病例数量 武汉接触史 来源链接 数据来源
4 http://wjw.hubei.gov.cn/fbjd/dtyw/ 湖北省卫生健康委员会
5 http://wjw.hubei.gov.cn/fbjd/dtyw/ 湖北省卫生健康委员会
6 http://wjw.hubei.gov.cn/fbjd/dtyw/ 湖北省卫生健康委员会
7 http://wjw.hubei.gov.cn/fbjd/dtyw/ 湖北省卫生健康委员会
8 http://wjw.hubei.gov.cn/fbjd/dtyw/ 湖北省卫生健康委员会
9 http://wjw.hubei.gov.cn/fbjd/dtyw/ 湖北省卫生健康委员会
公告中是否有病例 其他
4
5
6
7
8
9

我们把累积和新增的拿出来:

> x['湖北', c(1:6, 9:11)]
province city time cum_confirm cum_heal cum_dead confirm heal dead
4 湖北 武汉 2020-02-02 5142 265 1033 41 53
5 湖北 黄石 2020-02-02 334 2 82 0 8
6 湖北 十堰 2020-02-02 256 0 44 0 2
7 湖北 襄阳 2020-02-02 548 0 107 0 0
8 湖北 宜昌 2020-02-02 392 1 39 0 1
9 湖北 荆州 2020-02-02 499 6 166 2 2
10 湖北 荆门 2020-02-02 345 11 16 4 3
11 湖北 鄂州 2020-02-02 306 15 28 2 2
12 湖北 孝感 2020-02-02 918 14 169 0 0
13 湖北 黄冈 2020-02-02 1246 17 244 2 5
14 湖北 咸宁 2020-02-02 296 0 50 0 0
15 湖北 随州 2020-02-02 458 5 74 2 0
16 湖北 恩施 2020-02-02 111 0 6 0 4
17 湖北 仙桃 2020-02-02 169 3 29 0 0
18 湖北 天门 2020-02-02 115 10 16 3 0
19 湖北 潜江 2020-02-02 35 1 0 0 0
20 湖北 神农架 2020-02-02 7 0 0 0 0
534 湖北 武汉 2020-02-01 4109 224 894 32 32
535 湖北 黄石 2020-02-01 252 2 43 0 1
536 湖北 十堰 2020-02-01 212 0 35 0 0
537 湖北 襄阳 2020-02-01 441 0 94 0 0
538 湖北 宜昌 2020-02-01 353 1 77 0 0
539 湖北 荆州 2020-02-01 333 4 46 0 0
540 湖北 荆门 2020-02-01 329 7 78 2 2
541 湖北 鄂州 2020-02-01 278 13 51 4 0
542 湖北 孝感 2020-02-01 749 14 121 2 0
543 湖北 黄冈 2020-02-01 1002 15 276 1 10
544 湖北 咸宁 2020-02-01 246 0 40 0 0
545 湖北 随州 2020-02-01 384 3 80 2 3
546 湖北 恩施 2020-02-01 105 0 18 0 1
547 湖北 仙桃 2020-02-01 140 3 43 2 0
548 湖北 天门 2020-02-01 99 7 17 0 0
549 湖北 潜江 2020-02-01 35 1 8 0 0
550 湖北 神农架 2020-02-01 7 0 0 0 0
690 湖北 武汉 2020-01-31 3215 192 576 33 36
691 湖北 黄石 2020-01-31 209 2 41 1 0
692 湖北 十堰 2020-01-31 177 0 27 0 0
693 湖北 襄阳 2020-01-31 347 0 61 0 0
694 湖北 宜昌 2020-01-31 276 1 109 0 0
695 湖北 荆州 2020-01-31 287 4 66 1 1
696 湖北 荆门 2020-01-31 251 5 24 0 1
697 湖北 鄂州 2020-01-31 227 9 38 3 0
698 湖北 孝感 2020-01-31 628 12 87 3 0
699 湖北 黄冈 2020-01-31 726 14 153 2 11
700 湖北 咸宁 2020-01-31 206 0 40 0 1
701 湖北 随州 2020-01-31 304 1 76 1 0
702 湖北 恩施 2020-01-31 87 0 12 0 0
703 湖北 仙桃 2020-01-31 97 1 7 0 0
704 湖北 天门 2020-01-31 82 7 15 1 0
705 湖北 潜江 2020-01-31 27 1 15 0 0
706 湖北 神农架 2020-01-31 7 0 0 0 0
1027 湖北 武汉 2020-01-30 2639 159 378 30 21
1028 湖北 黄石 2020-01-30 168 1 55 0 0
1029 湖北 十堰 2020-01-30 150 0 31 0 0
1030 湖北 襄阳 2020-01-30 286 0 123 0 0
1031 湖北 宜昌 2020-01-30 167 1 50 0 0
1032 湖北 荆州 2020-01-30 221 3 70 0 0
1033 湖北 荆门 2020-01-30 227 5 36 1 0
1034 湖北 鄂州 2020-01-30 189 6 66 4 0
1035 湖北 孝感 2020-01-30 541 9 142 3 2
1036 湖北 黄冈 2020-01-30 573 12 77 0 1
1037 湖北 咸宁 2020-01-30 166 0 36 0 0
1038 湖北 随州 2020-01-30 228 0 85 0 0
1039 湖北 恩施 2020-01-30 75 0 9 0 0
1040 湖北 仙桃 2020-01-30 90 1 35 1 0
1041 湖北 天门 2020-01-30 67 6 23 3 0
1042 湖北 潜江 2020-01-30 12 1 2 0 0
1043 湖北 神农架 2020-01-30 7 0 2 0 2
1701 湖北 武汉 2020-01-29 2261 129 356 25 7
1702 湖北 黄石 2020-01-29 113 1 27 NA
1703 湖北 十堰 2020-01-29 119 31 NA
1704 湖北 襄阳 2020-01-29 163 32 NA
1705 湖北 宜昌 2020-01-29 117 1 54 NA
1706 湖北 荆州 2020-01-29 151 3 50 1
1707 湖北 荆门 2020-01-29 191 4 49 NA
1708 湖北 鄂州 2020-01-29 123 2 39 1
1709 湖北 孝感 2020-01-29 399 6 125 3
1710 湖北 黄冈 2020-01-29 496 12 172 7 3
1711 湖北 咸宁 2020-01-29 130 18 NA
1712 湖北 随州 2020-01-29 143 27 NA
1713 湖北 恩施 2020-01-29 66 15 NA
1714 湖北 仙桃 2020-01-29 55 23 NA
1715 湖北 天门 2020-01-29 44 3 10 NA
1716 湖北 潜江 2020-01-29 10 1 2 NA
1717 湖北 神农架 2020-01-29 5 2 NA
1921 湖北 武汉 2020-01-28 1905 104 315 19
1922 湖北 黄石 2020-01-28 86 1 33 NA
1923 湖北 十堰 2020-01-28 88 23 NA
1924 湖北 襄阳 2020-01-28 131 61 NA
1925 湖北 宜昌 2020-01-28 63 1 12 NA
1926 湖北 荆州 2020-01-28 101 2 30 NA
1927 湖北 荆门 2020-01-28 142 4 28 1
1928 湖北 鄂州 2020-01-28 84 1 27 1
1929 湖北 孝感 2020-01-28 274 3 101 2
1930 湖北 黄冈 2020-01-28 324 5 111 1
1931 湖北 咸宁 2020-01-28 112 21 NA
1932 湖北 随州 2020-01-28 116 46 NA
1933 湖北 恩施 2020-01-28 51 13 NA
1934 湖北 仙桃 2020-01-28 32 5 NA
1935 湖北 天门 2020-01-28 34 3 11 1
1936 湖北 潜江 2020-01-28 8 1 1 NA
1937 湖北 神农架 2020-01-28 3 2 NA
2050 湖北 武汉 2020-01-27 1590 85 892 22
2051 湖北 黄石 2020-01-27 53 1 17 0
2052 湖北 十堰 2020-01-27 65 0 25 0
2053 湖北 襄阳 2020-01-27 70 0 34 0
2054 湖北 宜昌 2020-01-27 51 1 20 0
2055 湖北 荆州 2020-01-27 71 2 24 0
2056 湖北 荆门 2020-01-27 114 3 24 0
2057 湖北 鄂州 2020-01-27 57 0 37 0
2058 湖北 孝感 2020-01-27 173 1 73 0
[ reached 'max' / getOption("max.print") -- omitted 75 rows ]

随手可以做一图:

library(ggplot2)
require(ggrepel)

d <- x['湖北',]

ggplot(d,
aes(time, as.numeric(cum_confirm), group=city, color=city)) +
geom_point() + geom_line() +
geom_text_repel(aes(label=city), data=d[d$time == time(x), ], hjust=1) +
theme_minimal(base_size = 14) + theme(legend.position='none') +
xlab(NULL) + ylab(NULL)

全国数据

一样是不带下标来获得:

> head(x[])
province city time cum_confirm cum_heal cum_dead 累计重症病例 累计危重病例 confirm heal dead
1 天津 天津 2020-02-02 48 1 15 3 7 1
2 北京 北京 2020-02-02 191 9 1 NA
3 湖北 湖北 2020-02-02 11177 295 350 1223 478 2103 56 80
4 湖北 武汉 2020-02-02 5142 265 1033 41 53
5 湖北 黄石 2020-02-02 334 2 82 0 8
6 湖北 十堰 2020-02-02 256 0 44 0 2
新增重症病例数量 新增危重病例数量 武汉接触史 来源链接
1 2 http://wsjk.tj.gov.cn/col/col14/index.html
2 http://wjw.beijing.gov.cn/xwzx_20031/wnxw/
3 http://wjw.hubei.gov.cn/fbjd/dtyw/
4 http://wjw.hubei.gov.cn/fbjd/dtyw/
5 http://wjw.hubei.gov.cn/fbjd/dtyw/
6 http://wjw.hubei.gov.cn/fbjd/dtyw/
数据来源 公告中是否有病例 其他
1 天津市卫生健康委员会
2 北京市卫生健康委员会
3 湖北省卫生健康委员会
4 湖北省卫生健康委员会
5 湖北省卫生健康委员会
6 湖北省卫生健康委员会

各个省的总结数据

也是一样使用summary:

> summary(x)[,1:5]
province time cum_confirm cum_heal cum_dead
1 天津 2020-02-02 48 1
2 北京 2020-02-02 191 9 1
3 湖北 2020-02-02 11177 295 350
21 河北 2020-02-02 113 3 1
33 山西 2020-02-02 66 2
45 内蒙古 2020-02-02 34 1
57 辽宁 2020-02-02 70 1
71 吉林 2020-02-02 30 1
79 黑龙江 2020-02-02 118 2 2
92 上海 2020-02-02 193 10 1
93 江苏 2020-02-02 271 7
107 浙江 2020-02-02 724 36
119 安徽 2020-02-02 408 7 0
136 福建 2020-02-02 179 0
146 江西 2020-02-02 391 18
158 山东 2020-02-02 246 6 0
174 河南 2020-02-02 566 14 2
193 海南 2020-02-02 70 4 1
208 湖南 2020-02-02 521 16 0
223 广东 2020-02-02 683 14 0
244 广西 2020-02-02 127 2 0
257 重庆 2020-02-02 300 7 2
258 四川 2020-02-02 254 12 1
280 贵州 2020-02-02 46 2
290 云南 2020-02-02 105 3 0
304 西藏 2020-02-02 1 0 0
306 陕西 2020-02-02 128
317 甘肃 2020-02-02 51 3
329 青海 2020-02-02 13 0 0
332 宁夏 2020-02-02 31
337 新疆 2020-02-02 24 0 0
345 香港 2020-02-02 15
346 澳门 2020-02-02 8
347 台湾 2020-02-02 10
348 天津 2020-02-01 41
349 北京 2020-02-01 183 9 1
350 福建 2020-02-01 159 0
360 云南 2020-02-01 99 2 0
373 河北 2020-02-01 104 3 1
385 内蒙古 2020-02-01 27 1
397 山西 2020-02-01 56 1
409 辽宁 2020-02-01 64 1
422 吉林 2020-02-01 23 1
430 黑龙江 2020-02-01 95 2 2
443 上海 2020-02-01 177 10 1
444 江苏 2020-02-01 236 6
458 安徽 2020-02-01 340 5 0
475 江西 2020-02-01 333 10
487 浙江 2020-02-01 661 23
499 山东 2020-02-01 225 5
515 河南 2020-02-01 493 4 2
533 湖北 2020-02-01 9074 215 294
551 湖南 2020-02-01 463 8 0
566 广东 2020-02-01 604 12 0
587 广西 2020-02-01 111 2 0
600 海南 2020-02-01 63 1 1
614 重庆 2020-02-01 262 3 1
615 四川 2020-02-01 231 3 1
637 贵州 2020-02-01 38 2
647 西藏 2020-02-01 1 0 0
649 陕西 2020-02-01 116
660 甘肃 2020-02-01 40
671 青海 2020-02-01 9 0 0
673 宁夏 2020-02-01 28
678 新疆 2020-02-01 21
686 香港 2020-02-01 14
687 澳门 2020-02-01 7
688 台湾 2020-02-01 10
689 湖北 2020-01-31 7153 166 249
707 河北 2020-01-31 96 0 1
719 北京 2020-01-31 156 5 1
720 天津 2020-01-31 32 0
721 山西 2020-01-31 47 1
733 内蒙古 2020-01-31 23 1
744 辽宁 2020-01-31 60 1
758 吉林 2020-01-31 17 1
766 黑龙江 2020-01-31 80 2
778 上海 2020-01-31 153 9 1
779 江苏 2020-01-31 202 5
793 浙江 2020-01-31 599 15
805 安徽 2020-01-31 297 3
822 福建 2020-01-31 144 0
832 江西 2020-01-31 286 9
844 山东 2020-01-31 202 2
860 河南 2020-01-31 422 3 2
878 湖南 2020-01-31 389 3
893 广东 2020-01-31 520 10
914 广西 2020-01-31 100 2
926 海南 2020-01-31 57 1 1
940 重庆 2020-01-31 238 1 1
941 四川 2020-01-31 207 3 1
963 陕西 2020-01-31 101
974 贵州 2020-01-31 29 2
983 云南 2020-01-31 91 1
996 西藏 2020-01-31 1
998 甘肃 2020-01-31 35
1008 青海 2020-01-31 9 0 0
1010 宁夏 2020-01-31 26
1015 新疆 2020-01-31 18
1023 香港 2020-01-31 12
1024 澳门 2020-01-31 7
1025 台湾 2020-01-31 10
1026 湖北 2020-01-30 5806 116 204
1044 台湾 2020-01-30 9
1045 香港 2020-01-30 10
1046 澳门 2020-01-30 7
1047 福建 2020-01-30 120
1057 西藏 2020-01-30 1
1059 贵州 2020-01-30 15 1
1068 四川 2020-01-30 177 1 1
1090 重庆 2020-01-30 206 1
1091 海南 2020-01-30 49 1 1
1104 广西 2020-01-30 87 2
1116 广东 2020-01-30 393
1136 湖南 2020-01-30 332 2
1151 河南 2020-01-30 352 3 2
1169 山东 2020-01-30 178 2
1185 云南 2020-01-30 76 0
1197 江西 2020-01-30 240 7
1209 陕西 2020-01-30 87
1220 安徽 2020-01-30 237 3
1237 青海 2020-01-30 8 0 0
1239 甘肃 2020-01-30 29
1249 宁夏 2020-01-30 21
1254 浙江 2020-01-30 537 9
1266 江苏 2020-01-30 168 2
1280 新疆 2020-01-30 17 0 0
1287 上海 2020-01-30 128 5 1
1288 黑龙江 2020-01-30 59 2
1300 吉林 2020-01-30 14 1
1308 辽宁 2020-01-30 45 1
1320 内蒙古 2020-01-30 20
1331 山西 2020-01-30 39 1
1341 河北 2020-01-30 82 1
1352 天津 2020-01-30 31
1353 北京 2020-01-30 132 5 1
1354 内蒙古 2020-01-29 18
1364 辽宁 2020-01-29 39 1
1376 甘肃 2020-01-29 26
1386 陕西 2020-01-29 63
1397 西藏 2020-01-29 1
1399 云南 2020-01-29 70
1411 贵州 2020-01-29 12 1
1420 新疆 2020-01-29 14 0
1426 青海 2020-01-29 6 0 0
1428 宁夏 2020-01-29 17
1433 四川 2020-01-29 142 1 1
1453 海南 2020-01-29 46 1 1
1464 澳门 2020-01-29 7
1465 湖南 2020-01-29 277
1480 香港 2020-01-29 10
1481 广西 2020-01-29 78 2
1493 广东 2020-01-29 311 6
1513 河南 2020-01-29 278 2 2
1531 山东 2020-01-29 145 1
1547 福建 2020-01-29 101
1557 安徽 2020-01-29 200 2
1574 海南 2020-01-29 46
1585 浙江 2020-01-29 428 4
1597 江苏 2020-01-29 129 1
1611 黑龙江 2020-01-29 43 1
1623 吉林 2020-01-29 14
1631 天津 2020-01-29 27
1632 北京 2020-01-29 114 4 1
1633 上海 2020-01-29 96 5 1
1634 广西 2020-01-29 78 2
1646 重庆 2020-01-29 165 1
1647 河北 2020-01-29 65 1
1658 山西 2020-01-29 35 1
1668 广东 2020-01-29 272
1688 江西 2020-01-29 162 3
1700 湖北 2020-01-29 4586 90 162
1718 宁夏 2020-01-28 12
1723 贵州 2020-01-28 9 1
1729 重庆 2020-01-28 147
1730 广西 2020-01-28 58 2
1740 河南 2020-01-28 206 1 2
1758 云南 2020-01-28 44
1769 河北 2020-01-28 48 1
1780 澳门 2020-01-28 7
1781 台湾 2020-01-28 8
1782 香港 2020-01-28 8
1783 甘肃 2020-01-28 24
1793 海南 2020-01-28 43 1
1804 上海 2020-01-28 80 4 1
1805 黑龙江 2020-01-28 37 1
1815 陕西 2020-01-28 46
1825 辽宁 2020-01-28 36
1837 内蒙古 2020-01-28 16
1847 天津 2020-01-28 24
1848 北京 2020-01-28 91 4 1
1849 新疆 2020-01-28 13
1855 福建 2020-01-28 82
1865 江苏 2020-01-28 99 1
1879 浙江 2020-01-28 296 3
1891 青海 2020-01-28 6 0 0
1893 四川 2020-01-28 108
1913 吉林 2020-01-28 9
1915 吉林 2020-01-28 3
1920 湖北 2020-01-28 3554 80 125
[ reached 'max' / getOption("max.print") -- omitted 211 rows ]

同样随手来一图:

d2 <- summary(x)[,1:5]

ggplot(d2,
aes(time, as.numeric(cum_confirm), group=province, color=province)) +
geom_point() + geom_line() +
geom_text_repel(aes(label=province), data=d2[d2$time == time(x), ], hjust=1) +
theme_minimal(base_size = 14) + theme(legend.position='none') +
xlab(NULL) + ylab(NULL) + scale_y_log10()

只看某个省的话,很容易,summary加个参数:

> summary(x, '湖北')[,1:5]
province time cum_confirm cum_heal cum_dead
3 湖北 2020-02-02 11177 295 350
533 湖北 2020-02-01 9074 215 294
689 湖北 2020-01-31 7153 166 249
1026 湖北 2020-01-30 5806 116 204
1700 湖北 2020-01-29 4586 90 162
1920 湖北 2020-01-28 3554 80 125
2049 湖北 2020-01-27 2714 47 100
2470 湖北 2020-01-26 1423 44 76
2733 湖北 2020-01-25 1052 42 52
2954 湖北 2020-01-24 729 32 39
3115 湖北 2020-01-23 549 31 24
3219 湖北 2020-01-22 444 17
3277 湖北 2020-01-21 375
3296 湖北 2020-01-20 270 25 6

随手又是一图:

ggplot(summary(x, '湖北'), aes(time, as.numeric(cum_confirm))) +
geom_col()

要画某个市,so easy:

ggplot(subset(x['湖北',], city == "黄冈"),
aes(time, as.numeric(cum_confirm))) +
geom_col()


关于这个包的安装和介绍,请移步《检索疫情数据的R包来了


往期精彩

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存