三千多万建设的传染病直报系统存在的严重漏洞
这几天,我对2004年1月1日投入使用的国家传染病网络直报系统(NNDRS)做了一些了解和分析。这个系统仅硬件成本就三千多万,号称可以四个小时汇报到国家疾控中心,但是在这次疫情的汇报、预警方面,丝毫没有起到应用的作用。为什么?这是我希望了解的。
这个系统的起点,是地方医院人员,在发现传染病病例之后,需要填写报告卡:
在填写这个诊断卡时,医生需要报告病人的疾病情况,其中采用的病情描述和诊断信息,都必须按照ICD-10编码。这个编码的详细列表可以参考这里:http://chisc.net/doc/view/3391.html。
打开这个列表,可以看到总共12107个编码,类似下面这样:
问题就在于,这套编码只针对已知疾病。现在来了一个新的传染病,医生就不知道该怎么填写了。这不是我说的,而是疾控中心表示的。全文搜索这12107个编码,没有任何一项跟“肺”有关。可以想象首报病历的医生在填写报告卡时候的心情。
“新型冠状病毒感染的肺炎是一个新发疾病,在现有传染疾病报告目录里是没有的,调整网络直报系统设置、人员培训需要一个过程。”中国疾控中心副主任1月31日在接受《新京报》采访时表示。
新京报
另外,2008年开始CDC还建立了一套传染病自动预警和响应机制,数据来源就是上面提到的这个报告卡逐级上报的数据,其中采用的规则为固定阈值法和时间模型法。前者,是对15种重大传染疾病设定次数阈值,超出阈值就会触发报警。那么,问题来了:如果这个病,并不属于原有的15种重大传染病,这个阈值就始终达不到,预警就失效了。
时间模型法则是对18种传染疾病增加时间和空间维度的阈值,表面上更加全面了,但是同样存在上面一样的问题:无法应用于新发疾病。(这种漏洞难道需要设计者看不出来?没法理解啊)
另外,下面这张图是从基层上报疫情到NNDRS的流程,其中需要五级汇报机制,存在大量的人为干预、审批环节。这都导致了在大规模、爆发性疾病出现时,反应缓慢。(为什么不能在输入信息时,一方面进入这个分级流程,一方面迅速直接提交到NNDRS,虽然这个数据比较粗糙,但是一旦数据量达到一定规模,就能立即在NNDRS引起预警)。
再另外,在数据的关联、比较规则方面,只有纵向的关联(即从下到上申报),没有横向的对比。即使是在某个区域不严重的病例,如果多个地点同时爆发,这就应该触发更高级别警报。医院之间、地区之间,没有关联性。继续差评。
因为经常参与一些IT系统的构建和设计,所以对这个系统中存在的漏洞,相对于其成本,我对其设计方式感到非常的不可理解。这是我从技术工作者的角度,对该系统的一点观察。