查看原文
其他

面对疫情,政府数据开放能做些什么?

郑磊 复旦DMG 2020-02-03


面对新型肺炎疫情,

数据开放能做些什么?



作为一个老百姓,我想知道我所在的城市今天有多少确诊和疑似病例病人是多大年龄?他们去了哪个医院?那些疑似病例后来确诊了吗?如果确诊不是新型肺炎,他们得的又是什么病?


虽然我也从网上和身边的朋友那里得到各种“消息”,但这些消息是真是假?我难以确定,我想知道最新的、权威的、准确的官方数据


于是,我来到了国家卫生健康委员会的网站,看看这里有没有公开的官方数据。


打开这个网页,我在显眼的位置看到了领导的重要指示,然后又在下面看到了有关“新型冠状病毒感染的肺炎”横条。



我点进了横条,看到了卫健委宣传司发布的各种新闻、答记者问、政策和公告,但这里面都没有我想要的数据



终于,我找到了“肺炎疫情情况”这条内容,点进去后看到了卫健委发布的各省确诊病例和疑似病例数据


但是,这些数据只公开到了省一级,没有每个城市、每个区、直至每个医院的数据?也没有关于病人情况的数据。这些数据还不能回答我关心的那些问题。


而且,这些数据是以文字的形式展现的,并没有做成表格,不够清晰明了。我想用这些数据做一些分析的话,还需要自己手工从这些文字里提炼出数据,然后做成表格或图。



然后,我又来到了国家疾控中心的网站,想找找这里有没有我需要的数据。

这个网站也在显著位置展示了有关新型肺炎的知识和信息,但是我需要的数据在哪里



终于,在疫情动态这个栏目下,我找到了疫情情况这条内容。



点开后发现,和国家卫健委网站上发布的数据是一模一样的,并没有提供更多更细的数据



同时,我还在网上看到了类似“丁香医生”这样的民间机构和自媒体制作的应用。这些应用上展示的表格和可视化地图,比政府网站上的展现的文字要直观和清晰很多。




为了采集到这些数据并开发成应用,这些民间机构花了不少时间和精力。但是,由于政府开放出来的数据颗粒度不够,这些民间应用的数据展现方式虽然很不错,但在展现内容上并没有提供出更多更细的数据。我仍然不知道关于每个城市、每个区、每个医院、每个病人的数据。


最后,我来到了香港特别行政区政府卫生署的网站。在这个网站上,我也在显眼位置看到了“严重新型传染性病源体呼吸系统病“的模块。



点进这个模块后,能看到有关“严重新型传染性病原体呼吸系统病”的应对计划、新闻和指南。但是在最最上面的位置,显示的是有关疫情的“本地最新情况”。



我点进“本地最新情况”之后,终于看到了下面的这个数据表。在这个表格上,可以看到每一位疑似病人的急诊日期、性别、年龄、报告来源、医院名称、化验结果、患者状况,同时又删除了患者的具体姓名,保护了个人信息


这些公开的数据字段丰富,内容详细全面。朴素干净的一张表,却填满了细节温度




从表上还能看到,经过化验,绝大部分疑似病人感染的并不是新型肺炎病毒,而是其他的病毒,这些信息也都一一列明了,令人信服。

同时,这些数据还以结构化表格的形式公开,清晰明了,便于公众进一步分析利用。

唯一的遗憾是,这些数据还是以PDF的格式发布的,还需要人工做些处理后才能直接利用。如果能把这些表格转换成机器可以读取的excel或csv等格式,就更加便于进行再次利用了。

再畅想一下,如果类似丁香医生这样的民间机构能得到这样的数据,他们开发出来的可视化应用会不会更全更细?同时,他们也不再需要花很多时间去到处搜集数据,并对不符合标准格式的数据进行再次加工了,他们只需要集中精力把在数据可视化应用做得更直观更生动就好。而且,这些数据开放出来后,其他的机构也能利用这些数据开发出应用,可能还会比“丁香医生“做得更好。


发生疫情时,公众想知道的不仅仅是疫情防护知识、政府应急信息、国家相关政策,公众还想获得权威的、最新的、准确数据政府围绕公众对信息的迫切需求,将公共数据以公开可获取的、完整的、一手的、可机读的方式及时地开放出来,并通过社会力量来开发成各种应用,实现信息惠民,有助于提升政府公信力,消除公众恐慌,做好自我防护,消除谣言传播的空间

政府数据开放8项基本原则

政府布的疫情数据,在字段和颗粒度上需要做到多细才合适?怎样开放数据才能既满足公众知情权,有利于社会对政府数据进行开发利用,又能维护社会稳定和个人隐私,达到最佳平衡点?这些问题还值得进一步讨论。香港特别行政区政府卫生署的实践无疑值得内地的政府数据开放工作参考和开展研究。

面对疫情,
政府数据开放还有很大空间
可以有所作为和深入研究!


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存