查看原文
其他

【原创连载2】何渊:论数据权的区分保护和利用制度——政府数据篇

2018-01-10 何渊 监管与合规

何 渊  上海交通大学法学院

【2018数据权元年原创栏目】是由上海交通大学法学院副教授、上海市行政法学研究会秘书长何渊博士主理的一个原创系列,研究目的是试图为大数据的国家治理提供一个整体法律框架。

如果说2017年是人工智能元年的话,那么历史会证明2018年则是数据权元年。可以这样说,如果法律不尽快在个人、企业及国家之间处理好数据权益配置的话,那么以大数据为基础的人工智能将有百害而无一利,技术创新难以维继,灾难性风险也会随之爆发。毕竟,不以人的自由和尊严为目的的大数据和人工智能都是耍流氓,全中国人民的共同福祉才是国家和法律的终极关怀。

引子:谈到“数据权”,现有法律理论一般都是直接指向“个人数据、个人信息”,抑或是“统称意义的数据”。在我看来,这种不加区分的数据权制度是有严重瑕疵的,是混乱不堪的非精细化法律治理机制。毫无疑问的是,没有建立在有效分类基础上的数据保护和利用的制度建构势必陷入一种“越理越乱”的自说自话的理论悖论,自然也难以达到预期的法律效果和社会效果。

 

我们应当把数据区分为“政府数据”、“涉及隐私的个人信息”、“不涉及隐私的个人数据”以及“平台企业聚合个人数据后形成的公共数据池”等四种类型。针对以上四个不同类别,我们应当建构不同且相对应的数据区分保护和利用制度,这样才能真正实现权利保护和产业创新之间的平衡。

 

本期我们先来谈谈“政府数据”的收集、利用及开放!

 

一、政府数据开放的核心问题

政府数据的核心在于行政机关收集、利用、开放数据行为的合法性与合理性,强调的是符合法律优先与法律保留原则,“法无授权不可为”;强调的是行政成本和行政收益之间必须成比例,“对公民自由限制和义务负担的最小化原则”。

 

二、政府数据开放的原则与例外

正因为有了法律的授权以及符合比例原则,政府代表公权力对公民数据的收集和利用也就具有了合法性和正当性。而政府数据的开放应当“取自于民,用之于民”,适用于“以开放为常态,以不开放为例外”原则。可以参照《政府信息公开条例》的规定,原则上说,除了涉及可能危及“国家安全、公共安全、经济安全和社会稳定(三安全一稳定)”以及“侵犯国家秘密、商业秘密以及个人隐私(两秘密一隐私)”之外的所有政府数据都应当开放。

 

依据“三安全一稳定”可以不予以开放的数据主要包括:1.公开后可能对国防、外交、国家安全、领土完整、民族团结等国家利益产生不利影响的数据;2.公开后可能影响重大经济金融政策的有效实施、信息安全或者造成经济金融市场异常波动的数据;3.经地方同级人民政府确认,公开后可能在一定范围内危害公共安全、社会稳定的数据,或者涉及民族、宗教、侨胞等事项公开后可能造成不利影响的数据。

 

依照“两秘密一隐私”可以不予以开放的数据主要包括:1.依法确定为国家秘密的信息和其他法律、法规禁止公开的数据不得公开;2.公开涉及商业秘密的政府数据;3.涉及他人身份、通讯、健康、婚姻、家庭、财产状况等个人隐私的政府数据。

 

但是,涉及“商业秘密”和“个人隐私”的政府数据,经权利人同意公开或者行政机关认为不公开可能对公共利益造成重大影响,可以予以开放。

 

三、政府数据开放的审查程序

1.行政机关应当建立健全政府数据开放的保密审查机制,明确审查的程序和责任。

 

2.行政机关在公开政府数据前,应当依照《中华人民共和国保守国家秘密法》以及其他法律、法规和国家有关规定对拟公开的政府数据进行审查

 

3.行政机关对政府数据不能确定是否可以开放时,应当依照法律、法规和国家有关规定报有关主管部门或者同级保密工作部门确定。


四、政府数据开放的组织机制——建设国家统一的政府大数据平台

国家统一大数据平台首先需要中央的积极倡导和推动,并有立法的足够支撑和可操作的实施方案,同时还需要首席信息官、首席技术官及首席数据官等专业组织机构的建设,最后还需要形成一种开放分享的执政理念和政府文化。显然,这样的国家大数据平台只能由中央政府来建构。这样的一个统一的数据开放平台,需要一个较长时间的积累和试错过程。以美国为例,1997年,联邦政府建立了首个侧重于公开联邦政府经济、人口趋势、教育、公共卫生等主题数据的网站Fedstats.gov;2006年,联邦政府依据《联邦资金责任透明法案》(FFATA)建立了旨在公开联邦政府所有公共财政支出原始数据的USAspending.gov网站;2008年,华盛顿特区推出了“城际数据仓库”(City Data Warehouse),提供了学区情况、青少年犯罪情况、交通事故多发地段和时间及公用设施使用情况等数据;2009年,联邦政府依据《美国复苏与再投资法案》(ARRA)建立了旨在公开经济复苏资助款使用信息的Recovery.gov网站。在此基础上,联邦政府依据《透明和开放的政府》最终建立了一个全球最为完善的统一数据开放门户网站Data.gov网站。


从地方实践到中央统一的路径是可取的,上海和北京在2012年就相继建立了数据平台,但是我国的地方平台从数据量、时效性、数据集可视化、互动分享等方面与美国相比,还存在巨大差距,其中一个重要原因在于各自为政下形成的“低法治”的数据割据。由此,一个旨在全面提升数据的有用性和易用性的全国性数据开放平台的建设必须提上议事日程,应当将中国最重要的政府数据统一集中到一个网站,为全国所有公众无差别地提供一站式的、便于再利用的数据群,而这个工作只能由中央政府来完成。正是这样的背景下,深改组最近通过的《国家信息化发展战略纲要》明确提出“推动重点信息资源国家统筹规划和分类管理,增强关键信息资源掌控能力。……统筹规划建设国家互联网大数据平台”。


五、政府数据开放实施过程中的主要争议点

(参考涂子沛:《大数据》p204-206,仅供学习之用)

1.原始数据还是加工数据之争。主流意见是直接开放机读的原始数据,而反对意见主要有两个:一是认为不同人对同一原始数据可能会分析出完全不一样的见解,也可能得出与政府官方观点完全相反的结论,从而影响到法律在全国的统一实施,甚至影响政府的公信力;二是很多原始数据涉及高敏感指标,对它们的不同解读,可能会影响到社会稳定及经济发展。

2.数据安全之争。反对者认为,数据聚合往往会产生“核聚变”的效果,除了带来大家都熟知的经济社会效应之外,也可能会威胁国家安全,影响国家控制力,使国家利益在不知不觉之中受到巨大损失。

3.数据质量之争。政府部门因为职能交叉,可能收集相关数据,如果他们之间的数据不一致,或者完全相反,应该以谁的数据为准?又应当如何向公众解释呢?如何通过制度设计来保证数据的质量,将是非常重大的工作!如果政府发布了相互矛盾的原始数据,数据开放带来的将不是透明和信任,而是民众的质疑和失望。 

4.数据粒度之争。对于同样的数据,是开放粒度低的粗线条,还是粒度高的精细化数据?是遵循“宜粗不宜细”原则吗?

5.数据价值之争。必须首先开放社会最需要的高价值数据。那标准是什么呢?到底哪些数据应当最先开放。

6.网站虚实之争。统一的政府数据开放平台是一个真正的数据仓库,还是一个数据索引库,源数据依然保存在各个部门?

 

 由于对于以上6个问题存在巨大的争议,短期以内难以形成共识,美国决定采取“搁置争议,先行开放”和“成熟一批开放一批”的务实性策略,认为开放政府数据是正确的发展方向和趋势,应当”快刀斩乱麻”,立即采取行动。于是,美国先进行重点突破,从一些没有任何争议的数据开始开放,距离奥巴马签署《透明和开放的政府》仅仅120天后,Data.Gov上线发布了,按原始数据、地理数据和数据工具三个门类组织开放数据。虽然第一批仅仅只有47组数据和27个数据分析工具,但这绝对是跨时代的进步,“美国的一小步,人类历史的一大步”!

毫无疑问的是,美国的经验非常值得我们学习。虽然政府数据开放的实施过程中依然可能会遇到很多的阻力和反对意见,也会有这样那样的问题!但由于我们国家和民众已经受到政府信息公开制度的深刻洗礼和精准教育,作为自发性革命的政府数据开放的实施将是水到渠成的事情。

 

【2018数据权元年原创栏目】第三期预告论数据权的区分保护和利用制度——个人数据篇

【2018数据权元年原创栏目】是由上海交通大学法学院副教授、上海市行政法学研究会秘书长何渊博士主理的一个原创系列,研究目的是试图为大数据的国家治理提供一个整体法律框架。后续研究将涉及个人隐私与数据权、被遗忘权与隐私保护的现行立法和司法困境——以案件为例、匿名化的破产与数据权利保护范式的革新、从个人安宁的隐私概念到财产权主导的数据权、剥削与反异化:个人数据权的可能性、劳动成果理论:企业数据权的可能性与法律边界——基于案件的思考、竞争法意义上的企业数据权、公共数据池私人化的悖论与法律出路、国家数据主权与国家能力的关系、政府数据开放的整体法律框架、政府决策算法的透明度与政府信息公开、自动驾驶的政府监管体系、机器人的民法规则体系、算法的法律伦理规则体系化、数据平台自我规制与国家规制的关系、大数据平台自我规制的限度——以互联网法院为例、国际关系与国家数据权的关系等等。敬请持续关注!也欢迎大家踊跃投稿!您的支持对我们很重要!

相关部分(点击阅读)

【原创连载1】何渊:2018数据权元年——从炮轰支付宝开始 

何渊:欧盟议会全球首个“关于制定机器人民事法律规则的决议”(介绍部分)

 何渊:2018数据权元年——从炮轰支付宝开始

 何渊:政府数据开放的整体法律框架

 何渊:人工智能时代“大数据”加上“差异化算法”带来的身份歧视,就是商业领域隐匿的穷人与狗不得入内!

【前沿7】可识别个人信息、隐私以及新概念

【前沿6】打破匿名化的迷思:数字时代的匿名化挑战

【前沿5】美国布鲁斯的经典隐私理论和德国的人格权理论:四种类型的隐私侵权体系比整体保护体系更好吗?

【前沿4】这是私人的,但归我所有吗?—走向财产权的个人信息

【前沿3】关于马的法律—网络法到底该教些什么?

【前沿2】《自动驾驶的监管挑战:面对悲剧性选择人工智能如何决策》

【前沿1】监管人工智能系统:风险、挑战、能力和策略



诚意推荐 欢迎关注


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存