其他

有序推进数据开放,共建数据生态圈

2017-07-12 蓝云 南方日报出版社

神探夏洛克,可以任意在自己的记忆数据库里抓取关联信息



大数据是一个新生事物,围绕其的概念认知、实践探索、各方利益博弈一直没有停止过。


其中一个最重要命题就是数据所有权。对于任何一批或一组数据,都可以提出六个疑问——是谁的,谁来保存,谁来用,怎么使用,为谁用,使用过程谁来监督。


数据主权是云时代国家主权理论的新发展。数据是国家权力的基础。数据是信息的载体,而信息就是权力。约瑟夫·奈认为,权力正在发生从“资本密集型”(capital-rich) 到“信息密集型”(information-rich) 的转移。他还指出,信息力是美国外交力量的倍增器(force multiplier) 。托夫勒也曾指出权力的三个支柱,即暴力、财富和知识。前两者是低质权力,而知识才是高质权力,它可使暴力和财富增值。


随着大数据重要性日益凸显,数据主权成为各方争夺的焦点。根据美国2001年《爱国者法案》(USA PatriotAct),美国政府可以获取任何存储在美国数据中心的信息或者是美国公司所存储的信息,这不仅不需要数据主体(data subject)的事先同意,有时数据主体可能根本都没有意识到。云计算的优点是低成本和灵活性,许多私营机构和公共部门或许会因此倾向于将其数据和信息系统都输送在云端。正如工业革命将工人与生产方式逐步分离一样,云计算使网络生产(如硬件、软件、内容和数据)越来越集中到少数互联网服务商手里。从主体方面看,处于网络空间不同行为能力层次的不同国家对数据主权的侧重有所不同。处于数据控制弱势的国家对数据主权更加敏感,如西方提倡数据主权的学者主要集中在欧洲而非美国,原因在于,美国在网络空间和数据控制上占有总体优势,相对而言不如欧洲敏感。与此同时,多数西方学者提到的数据主权多指个人数据主权,而中国学者更加强调国家数据主权。如有中国学者指出,数据主权的主体是国家,是一个国家独立自主对本国数据进行管理和利用的权力。


2015年,中国的多个专车出行平台发布了市民交通出行报告,还据此论证国家哪个部门的工作人员加班时间最长。以社交网站为例,数据所有权涉及多方利益主体,包括用户群体、互联网接入服务提供商及通信服务提供商、社交网站服务商等,而根据相关法律规定,国家可能拥有限制这些数据出境的权力。


对于某个滴滴出行用户、淘宝用户而言,他的每一次出行或购买,都留下痕迹,都是数据。那么这组数据属于谁,谁能使用?现在默认的规则是,如果站方提供便利,该用户可以查询其本人的相关记录;站方可以批量处置这些数据,在不侵犯个人隐私的情况下,可以得出一个整体的结论(类似上述滴滴出行的报告);国家拥有对批量数据的最终审核权。


南方舆情数据研究院曾专门到某通信运营商调研,谈及对公民电话通话记录的使用问题。该运营商介绍,对于具体某一位公民的某一个通话记录,将依据国家法律法规严格保护;如果公共利益有重要需求,通过一定的法定程序,可以提交一段时间内某一个区域50或60万居民的电话通讯统计结果。有了这种统计结果,我们可以得出特定时期特定人群的迁移、聚集结果,衍生其他重要价值,同时也可看出通信运营商对公民的隐私权益有完整的保障措施及机制。


由此得出初步结论,主权国家或主权机构行使数据主权并不意味着对数据实行完全控制,而是要在管制与开放之间实现合理的平衡。在中国语境下谈论数据所有权,比如谈论到某个政府部门设置数据壁垒,形成了数据孤岛、数据烟囱,各方数据是“川”字形,而不是“井”字形等不合理的现状。部门利益主义、对数据治理缺乏足够的认知是基本情况,另一个要理解并明确的是,数据就是权力的一部分,任何一个部门捍卫自身数据,是自我保护权力的必然冲动。能认知到这一点,再谈数据合作、数据开放、数据治理,就会更顺利一些。


数据开放与我们通常讲的信息公开又有什么异同呢?依据《中华人民共和国政府信息公开条例》,根据信息公开的程度,可以将政府数据划分为三种类型:对社会完全公开的信息,例如政府政策法规、政府采购信息等;不完全公开的信息,比如政府各部门内部管理使用的信息,例如税收征管信息、居民户籍信息;保密信息,涉及国家安全、商业秘密或个人隐私的数据,例如公民的通话记录和网络访问记录等。简要说来,政府信息公开对应于窄带电子政务,政府数据公开对应于大数据时代,两者有十年的时间差。


我认为,要真正做到数据开放,现有的《中华人民共和国政府信息公开条例》恐怕要适度修订。据公开的新闻报道,2013年3月全国“两会”期间,国务院总理李克强与浪潮集团总裁孙丕恕关于“加快政府数据开放”的一段对话吸引了各界注意。“随着电子政务建设的不断发展,各级政府积累了大量与公众生产生活息息相关的数据,掌握着全社会信息资源的80%,其中包括3000余个数据库。”在谈及加快政府数据开放的必要性时,孙丕恕曾列出一系列清晰有力的数据,“西方主要发达国家都将其政府数据开放作为国家战略推动,借助政府数据开放,美国的医疗服务业节省3000亿美元,制造业在产品开发、组装等环节节省50%的成本。”李克强现场给出了自己的回应:“政府掌握的数据要公开,除依法涉密的之外,数据要尽最大可能地公开,以便于云计算企业为社会服务,也为政府决策、监管服务。”


换一个角度讲数据公开。如果不讲对外完全公开,讲半公开,讲数据内部公开、脱敏后适度公开,就是在党政机构内部形成一个除非国家特别机密信息,一般性的数据在机构内部不同部门之间公开。上述“南海统筹局”的石破天惊的意义,以及“深圳坪山经验”的重要意义在于,相当一部分数据在部门内部已经公开,不同的部门之间可以相互调用数据。


数据公开还牵涉到部门博弈、城市竞争。大数据专家涂子沛在其微信公众号里曾写道,“几乎所有的市民服务中心,目前实现的,都仅仅是物理空间上的人员聚集,数据连通非常有限”,“政府部门数据连通问题,不是技术问题,而是利益问题、奶酪问题,也是官僚政治的基本问题”。贵阳大数据交易所2016年5月发布报告指出,可公开流通的政务数据包括:政府审批信息数据、财政预算决算和“三公”经费数据、保障性住房信息数据、食品药品安全信息数据、环境保护信息数据、安全生产信息数据、价格和收费信息数据、征地拆迁信息数据、以教育为重点的公共企事业单位信息数据。贵阳大数据交易所还规划了下述12类“可交易的数据品种及类型”:



在公共决策领域,党政部门是主力军,主体数据都在党政部门。数据公开的主体、带头人,必然是党政部门,这是义务、责任,也是权利、使命,也是实现中国梦、推进治理现代化进程的必然选择。公布数据的过程,也是公民权利的进一步争取、政府权力的进一步释放,其间过程漫长。


再换一个角度讲数据公开。谈谈公众对政府公开数据的接受或认可程度。南方舆情数据研究院曾向某市的49位企业家发出调查问卷,“您认为当地政府公开的数据准确度高吗?”有14.29%的人选择“非常准确”,另有51%的企业选择“无法判断,但选择相信”。



数据开放的主体一定是党政机构吗?也未必。脱敏处理后的数据,可以适度开放给公众。


在寻求数据助推社会建设的过程中,我们鼓励创新,鼓励试错,鼓励多种社会力量介入,鼓励有偿使用。数据治理的背后是机制、体制创新,也就是政治创新。大数据带来了“弯道超车”或重新制定游戏规则的机会。在此过程中,主流媒体可以担当一个社会先行者、机制探索者的角色。


我们也要避免“唯数据论”,避免庸俗化理解大数据,坚决避免大数据的过热化。在力图最优综合效益的进程中,还要注意数据安全、数据伦理、数据文化,共建有益的、可持续的、造福广大人民群众的数据生态。综合上述种种,我们才可以说,这才是一个完整的“数据最优化”进程。



上文选自《从1到π——大数据与治理现代化》↓ 有改动

《从1到π——大数据与治理现代化》

蓝云  /  编著

南方日报出版社2017年5月第1版



扫二维码,即可下单购买本书

点击“阅读原文”可在当当下单选购本书

亚马逊、京东及全国各地新华书店有售

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存