基于3500万兴趣点数据的防疫压力分析
元旦以来,一直在忙一个项目,至于具体是什么,还敬请静候个把月。期间抓下了高德3500万个兴趣点的数据,换言之,大部分在高德上能够查得到的商户、地点,目前都躺在我电脑里。武汉危机,湖北挺住,大年三十中午突发奇想,计算了几个指标,衡量一下各个城市医疗的压力。
事情的起因是三张图,
第一张图
标准的开局一张图,剩下都靠编,以我多年和蚂蚁合(dou)作(zhi)共(dou)创(yong)的经验来说,这个事情能做也可能在做,但中间结果流出来,那是真的不可能。一来涉及用户隐私,二来这东西必定和腾讯有数据融合,竞对的敏感性,也是要人命的。
第二张图
恰好,手上有抓好的高德的数据,餐馆全国有456万家,但是名字里有野味的,只有502个,根本无法作为有效分析的对象。确实这是网页搜索的结果,但是真的点开,会发现里面很多匪夷所思的匹配。
第三张图
出现这样的局面一点不意外,胡焕庸线本来就是人口稠密度的分界线,加上病情原发于武汉,在一个早期出现泾渭分明的感染情况,后期线东西也会有明显的区别。
一件很明显的事情,大城市会有更多的医院,但是人口也会相对更多,“两害相权”,究竟该如何评价评价各个城市面对疫情的压力?“半工半读”一个下午,做了一个简单的可视化,思路比较直白,分子是人口、经济、交通相关压力的指标,分母是相关医院的数量,这个比值越高,就说明当地(地级行政区)的医疗压力越大。
具体而言,衡量医疗能力的项目为:综合医院(含卫生院)、急救中心、传染病专科医院三项的数量和。需要说明的是,由于数据为兴趣点,一个医院可能会有数个兴趣点,比如一个医院可能有门诊楼、住院部、呼吸科等几座楼,在思考了一段时间后,我决定不对这种一对多做进一步清洗,一方面难度较大,用文本或者地理相邻的方法都不太合理,另一方面一个有10座楼的医院和一个只有1座楼的医院本来就不该是等量齐观。
在分子,即人口、经济压力方面,我选取如下几个指标:
第一个指标便是人口数据,但并不是统计局公布的人口,而是一套由哥伦比亚大学测算的2015年公里栅格级别的数据,类似的数据国家官方也有一套,但是在叨扰师兄师嫂拍了好几张手持身份证的强东照后,还是没能申请到,只能退而求其次用这个舶来品了。这套数据应当算相当靠谱,北京的人口是2370万,上海2709万,保定是1173万,都是异乎统计局而较符合事实,虽然2015年距今将近五年,但我们要分析的是横截面的问题,应当影响不大。
在后续各图中,我们按照分数的分位数将全国城市分为四个等级,红橙黄绿的安全性依次增高,即绿色医疗压力最小,红色最高。港澳台地区因为数据缺乏或者医院标准差异暂无数据。内地白色区域为当地没有合乎我们要求的医院(综合医院、卫生院、急救中心、传染病专科医院)。
此外,需要进行免责声明的是,下图只为示意图,并非经过国家相关部门核验的中国地图,已尽力将高德所提供的各省市边界坐标点按照WGS84坐标系进行投影,但是由于按照国家法律,高德提供的坐标点存在不可控的几十到几百米偏移,故存在一定程度的不精确,且绘图投影方式并非我国对于地图出版物的要求,如果引用此图,请明确相关风险、注明来源并进行类似免责声明。
从图中结果来看,较为明确的现象有三点,其一,江浙沪地区压力较小且是较为罕见的全省压力较轻,所以江浙沪能够有条不紊,武汉人往上海行进,都是有其合理性的;其二,各省省会集中了各省最好的医疗资源,这里医院的计数中将普通综合医院、三甲医院、卫生院合并计算,不难想象的是,如果只计算三甲医院,省会的优势会更为悬殊。其三,湖北、湖南、江西、广西、广东北部以及陕西为压力较大的重灾区,这些地方也与湖北交界,下一阶段压力可能相当大。
上文数据毕竟是2015年的人口数据,存在一定的时间滞后性,这里我们将分子换成了餐馆数量+便利店数量,某种程度而言,这类场所单个服务人数差别较小,可以在某种程度上作为人口,特别是含高流动性人口的代理变量,我们发现,上文的三个结论基本维持稳定。
疫情需要考虑的另一方面,是人流密集场所。这里我们将人流密集(封闭场所)定义为如下几类:博物馆、展览馆、会展中心、美术馆、图书馆、科技馆、天文馆、文化宫、学校、培训机构、娱乐场所(夜总会、KTV、迪厅、就把、游戏厅、棋牌室、网吧)、影剧院(电影院、音乐厅、剧场)、商场、家电卖场、超市、花鸟鱼虫市场、商业街、桑拿洗浴、运动场馆(含体育馆、保龄球馆、健身房、游泳馆等)
此图存在些微的差异便是,各省省会的优势有一定程度的减弱,但是京津冀依然是绿色为主,不禁让人陷入沉思,大概,京津集中的医疗资源足够面对再大的风浪,而河北已经被榨干到没有什么资源来养这些大型商业娱乐设施。
最后,我们将分子换成了地铁、轻轨、公交车站的数量,以衡量医疗机构面对城市内部公共交通的压力,这一次最明显的变化是,包邮区沦陷,京津的危险程度上升了一级,故而,可能一个并没有那么毫无根据的恐惧是,静态来看京沪地区医疗够用,但当春节假期结束,大量外部人口回流,开学开班后公共交通爆满,这些地区的防疫压力会上升一个级别。而继续的,华中华南依旧是重灾区。
因为原来项目的关注点不涉及跨城交通,这里没有准备跨市交通的相关数据,但武汉九省通衢的盛名,应当算是每个中国人的一个常识了。
亡羊补牢,为时未晚,一系列的数据一再表明,湖北乃至整个华中地区的医疗资源从各个角度来看一直是紧张的,目前出现的情况一方面可能确实有政府应急的问题,另一方面是长期未被直面的医疗资源不足、不均问题,可能接下来若干天我们会看到越来越多出征的白衣战士,另一方面,我们能否期待一些长期的、本质性的改变。
另一点,外部人口回流与内部交通带来的问题可能比想象中要大,这一点相信有更多的聪明人有更多更强的“活数据”可以分析,相信政府相信党,让专业的人去做专业的事,各自在各自岗位继续奋斗,不负韶华,共克时艰。
为了写这篇文章,错过了n多红包,取消了延续四年的语音拜年,权拿此篇,祝各位鼠年大吉,万事顺遂!
多难兴邦这句话我听着长大的,没什么好怕的。