查看原文
其他

如何利用大数据预防与控制疫情?

如何利用大数据预防与控制疫情?

文/ 王捷 资深出海法律顾问

 

2020年的新春佳节,注定会是一个会被历史铭记的一年。在九省通衢的武汉,又适逢在全中国人口流动最为频繁密集的时段,遇上了新型冠状病毒,武汉疫情,牵动着全国人民的心,也在直接或间接地影响着全国,乃至海外地区的每一个关联的个体。

 

灾难面前,除了戴好口罩,做好防护,还可以利用大数据做好预防以及控制疫情。

 

一、大数据可以为疫情防控做什么?


1. 提前预判及确定未知疾病,有利于做好疫情预警发布与控制


通过医院以及疫情防控中心共享的数据,并结合大数据公司,如谷歌、百度通过监控指定区域的用户频繁搜索的关键词信息,可以检测出某地区已经出现各种不明原因的未知疾病,再通过与病毒大数据库中的已有资料进行对比分析,尝试找出可能的病原,有利于及时做好疫情的预警发布与预防控制。


2. 掌握疾病接触人员的流动情况,有效控制疫情


(1)通过交通数据有效预测疫情


正值春运期间,全中国人口流动最频繁的时候爆发了武汉肺炎疫情,给全国各省市地区,甚至海外各国家地区都带来了明显的及潜在的疫情风险。因此,通过飞机、高铁、长途巴士、私家车以及高速收费站等各种公共交通工具与交通设施等大数据的分析和贡献,能有效帮助国家与政府部门进行准确的预测、评估和控制。


比如,通过某软件统计的航空信息分析出,从疫情发展开始之时到疫情升级,再到进入紧急状态的整段期间,从武汉机场到北京的人数最多,到广州的其次,而且有具体人数。


又例如,某数据公司通过大数据,勾勒出了很多11月去过武汉海鲜市场的人,画出了这些人后来去哪里的分布图。


其背后的原理大概是一种通过估计引入风险(import risk)的方法来量化该疫情或病毒对某一地区可能造成的影响。对于引入风险的估计,最核心的问题便是如何通过动态模型或是统计模型将风险量化。


(2)通过移动通信数据预测疫情


用户每次利用手机通话的过程中都会同时产生相应的通话记录数据,其中自然也包含了电话号码、通话时间以及大致的通信地点等重要信息。对于运营商而言,可以利用这些数据去进一步判断相关地区的人口迁徙数量以及流动情况,例如,通过对武汉地域追踪其人口的流动,从而可以比较好的估计和预测下一个最有可能爆发疫情的地点,继而提前展开合理有效的资源配置和疫情防控措施。同时需要注意的是,运营商在利用该部分大数据的时候要特别祝生意保护数据主体的个人数据权利以及相关的隐私问题。


又例如,可以通过移动支付的交易大数据,挖掘出更多人口流动的信息以及其他对于疫情防控有价值的信息。


(3)通过社交媒体数据预测疫情


例如,通过全球一线医护人员建立的社交网络等网络数据的搜集,有利于预测从和跟踪疫情的态势。(Health Map)是一个整合了全球不同传染性疾病资料并通过地图方式提供免费的可视化全球疾病爆发的自动化信息系统。它通过一定的算法来抓取以及过滤来自不同社交媒体网站的数据,包括新闻(如:Google News) 、个人医疗咨讯(如 :ProMED)及官方资讯資訊(例如:世卫组织WHO)等等,并结合领域内专家的帮助,再对相关的信息进行分类,确定疾病的类型并在地图上定位爆发地点,然后标注在地图上。


图片来源:全球疾病警报地图官网


3. 有助于建立合理的全民预警机制,防止疫情扩散


二、国外做法:谷歌如何利用大数据预测流感?


谷歌曾在2009年2月在国际学术期刊《自然》上发表了《利用搜索引擎查询数据检测禽流感流行趋势》的论文,并设计了流感预测系统“Google Flu Trends(简称GFT,流感指数)”。该系统据称能够提前两周提供精确度不低于疾控中心的结果。


它预测H1N1流感的基本原理是,如果在某一个区域某一个时间段有大量的有关流感的搜索指令,那么就可能存在一种潜在的关联,在这个地区就有很大可能性存在对应的流感人群,相关部门就值得发布流感预警信息。


虽然,该系统由于搜索关键词预计预测算法的问题在后来导致失效(例如,大数据分析中存在“预测即干涉”的问题;又例如,当该系统提到了有疫情,媒体的即时报道就会引发更多相关信息搜索,从而反过来强化了该系统对疫情的判定等等),谷歌的工程师们也在2013年于《自然》上发文指出该系统对某次的流感趋势不起作用。因为其预测结果比美国疾病控制与预防中心Center for Disease Control and Prevention在汇总各地数据所显示的实际情况多了近一倍。



但不可否认的是,利用搜索引擎的检索词以及相关网站的文本挖掘来提前感知流感的趋势,的确是一种有效防控手段,只是,该等大数据的利用,还需要不断优化,需要进行有效鉴别,却不阻碍它成为现有监测网络的有益补充。


又例如,2009年在墨西哥爆发的猪流感,科学人员利用了通信数据监测公众对于政府发布的健康预警信息的反应。


又如,2010年,海地地震爆发了霍乱疫情,科学人员基于手机通信数据建模并给出了最需要援助地点的最优估计。


三、利用大数据对疫情做防控与分析时,需要注意哪些合规风险?


在大数据时代,被称为“新石油”的数据是数字经济的核心生产要素,是国家基础性战略资源,也是互联网企业的核心资产和竞争力,正确获取并利用大数据可以有效帮助社会,贡献出自己应有的力量,但不正当的数据爬取与数据滥用行为却会阻碍数据的正常流通,破坏市场经济秩序,造成商业间的不正当竞争,甚至导致刑事法律风险。关于利用大数据做好疫情防控时候需要注意的合规风险,由于篇幅有限,仅做简要分析。


1. 数据爬取技术创新与滥用的判断


判断一个数据爬取行为是否触发刑事法律犯罪,可以从如何进入对方网站和系统,如何获取数据以及如何使用数据等环节进行综合分析。以“如何进入”为例作简要说明,例如,在使用爬虫技术进入对方的计算机系统的时候,即随时有可能存在并产生各种违法犯罪风险。这时候,需要考虑的因素包括,你所访问与进入的计算机系统的性质,你是否已经得到充分的授权,是否使用了非法爬虫程序,以及是否对对方的计算机信息系统的安全措施进行了技术性的规避或破解等。比如说,如果在未经允许的情况下,入侵了国家重要的计算机信息系统,或者通过非法手段获取口令或许可证明后冒充合法使用者进入国家重要计算机信息系统,或将自己的计算机与国家重要的计算机信息系统联网的话,则可能构成非法侵入计算机信息系统罪。这里所说的“国家重要的计算机信息系统”,是指国家事务、尖端科学技术领域等重要计算机信息系统。大数据公司千万不能针对此类网站的数据进行随意爬取。单位犯罪的,还会对其直接负责的主管人员和其他直接责任人员进行处罚。


除了上述罪名,其他与非法爬取数据或与不正当使用数据相关的罪名可能还包括,提供侵入、非法控制计算机信息系统程序、工具罪、破坏计算机信息系统罪、非法获取计算机信息系统数据、非法控制计算机信息系统罪、侵犯公民个人信息罪等等。


2.   政府公开信息与个人隐私保护的权衡


根据2019年《政府信息公开条例》的规定“行政机关应当及时、准确地公开政府信息。行政机关发现影响或者可能影响社会稳定、扰乱社会和经济管理秩序的虚假或不完整信息的,应当发布准确的政府信息予以澄清”。一方面,政府公开信息以及做到数据开放有利于在全社会层面,帮助更好地控制疫情和做好防控工作,另一方面,也有利于保护公众对疫情的知情权,了解事件发展态势,减少恐慌。政府在公开患者信息时候要特别注意做好匿名化处理,防止个人生物特征信息的披露与公开。


事实上,在越趋发达的大数据时代,在强调注重个人信息的保护同时,也意识到,个人信息和非个人信息在大数据时代背景下的边界是比较模糊的。这是因为,一方面,分析的数据种类和数据越多,各种信息的聚合可能会越容易与特定的个人信息相联系,另一方面,随着不断扩大与紧密联系的网络环境与越发增强的数据分析能力,以及实名认证制度的推行,关联的使用设备的个人将会不断被匹配对应。因此,真正地做好匿名化处理,哈希加密等个人信息脱敏与保护措施,才能更有效地保护公民的个人信息权利,避免不正当地泄露与公开。


3.   数据安全与合理利用


保障数据安全是数据控制者和处理者的必要义务之一,特别是掌握了特殊、重要类别数据的大数据信息企业。大数据也需要大安全,既需要建立并健全内部的数据保护与安全制度,数据泄露的应急处理机制、保密制度等等,也要有足够的技术安全措施,防止黑客攻击,避免用户隐私信息的泄露等。以数据存储的环节进行举例说明,当大数据公司大量收集不同的样本信息后,应立即进行去标识化处理,并需要分开存储去标识化后的数据与可用于恢复识别个人的信息,并确保在后续的个人信息处理中不重新识别到个人。特别是在存储个人敏感信息时候,例如,存储个人生物识别信息时,除了需要采取加密等安全措施进行存储,还应仅存储个人生物识别信息的摘要。


祈愿大数据技术能最大限度地发挥出其应有的价值,帮助国家和政府更有效地搭建疫情监控防治体系,提供更有准确的信息,同时,也能更好地兼顾和尊重用户隐私保护和个人信息的数据权利。春天已到,胜利的曙光也即将在眼前。




参考文章:

1.  环球时报:陈经:防控重大疫情,如何用好大数据

https://opinion.huanqiu.com/article/9CaKrnKp27c

2.   虎嗅:如果再有SARS,大数据可以做什么?

https://m.huxiu.com/article/32686.htm

3.   虎嗅:面对武汉疫情,这是大数据能贡献的力量

https://www.jiemian.com/article/3907284.html

4.   知乎—埃文科技:思考大数据---谷歌流感预测是如何失效的?| 小故事

https://zhuanlan.zhihu.com/p/28110315

5.   专注金融科技与创新:未央网大数据行业,最怕的法律风险是啥?

https://www.weiyangx.com/340495.html:

6.   阿里云:三要点告诉你如何降低大数据合规风险?

https://yq.aliyun.com/articles/215928




笔者简介


王捷,资深出海法律顾问,荷兰RuG国际经济法与商法硕士,曾任职阿里巴巴大文娱集团,深耕海内外多条业务线,业务领域覆盖国际浏览器、国际信息流、海外品牌营销、广告联盟、短视频、音乐互娱、应用分发、及各类创新与孵化业务与项目型法律工作;专业能力模块包括产品风险管控、业务流程搭建、风险分析评估、数据保护与合规、纠纷案件处理、竞对攻防布局、政府监管合规、海外公司治理、投资项目管理等。八年多的科技型公司实务经验与中外律所从业背景,能更准确理解客户核心需求,快速响应并提供基础到战略的有效支持,并为各类出海互联网企业拓展印度、东南亚、中东、非洲、欧美等新兴及重要市场提供有效的合规解决方案与落地支持。



联系方式:jie-72
添加微信,请备注来意,如“业务合作”,“学术交流”等等,感谢!


#近期出海业务精彩文章#【Fintech很火爆,落地有风险】——印度现金贷与P2P业务合规经营分析【深度分析】5.66亿互联网人口的印度会成为下一个中国吗?【值得收藏】中国跨境电商的商业模式与生态链条剖析【剖析】东南亚宗教国家如何界定“色情”——以印度法律为例印度个人数据保护法案(草案)解读【解密】印度版抖音被最高院封杀的灭霸武器——印度禁令救济【必读】你不可不知的互联网出海法律风险你真的读懂社交电商吗?——社交电商生态架构的合规设计(含海外社交电商专题)看完,谢谢点击一下“在看”↓



继续滑动看下一个
出海互联网法律观察
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存