查看原文
其他

互联网法治 | 公共数据使用的质量保障及其限度

郭兵 陈程程 中国审判
2024-09-16

点击上方“中国审判”可以订阅哦!


文 | 浙江理工大学数据法治研究院 郭兵 陈程程


2021年9月和10月,《中华人民共和国数据安全法》(以下简称《数据安全法》)、《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)相继实施。其中,《数据安全法》对政务数据开放进行了专门规定,不少地方也出台了专门的公共数据立法。然而,现有立法侧重数据安全的制度设计,尚未为公共数据开发利用中的数据质量保障界限明确清晰完整的规则。如何进一步明确公共数据使用的质量保障及其限度,仍是大数据产业深入发展所迫切需要解决的难点问题。本文拟以J公司、M公司诉L公司商业诋毁纠纷及不正当竞争纠纷案为切入点,对公共数据使用的质量保障及其限度进行分析。


公共数据使用质量的争议


2019年5月5日及5月6日,L公司通过其运营的甲平台发布并向特定用户推送了M公司(J公司的子公司)的清算信息。该清算信息来源于国家企业信用信息公示系统,但并非该系统于2019年5月5日新增或变更的信息。M公司的清算信息属于历史信息,由于甲平台未进行特别说明,导致平台用户将历史清算信息误认为新发生的清算信息,并引发了广泛关注,大量媒体围绕M公司是否存在清算行为进行了报道。


J公司、M公司认为,L公司通过甲平台发布、推送了误导性的清算信息构成商业诋毁,损害了J公司、M公司的竞争利益和消费者利益,破坏市场竞争秩序,应当依据《中华人民共和国反不正当竞争法》第二条认定为不正当竞争行为。因此,J公司、M公司向杭州互联网法院提起诉讼。


一审法院经审理认为,L公司的行为构成不正当竞争,应承担相应的民事责任;同时,考虑到大数据行业还处于起步阶段,相关的行业规则、技术能力尚未成熟完善,需要给大数据产业发展提供适度的张力,为其发展营造一定宽松的发展空间,不宜苛以过重的责任。最终一审法院判决L公司赔偿J公司、M公司经济损失及合理费用60万元,并为其消除影响。L公司不服,提起上诉。二审法院经审理,最终判决驳回上诉,维持原判。


本案中,一审、二审的争议焦点均涉及L公司公共数据使用行为是否构成不正当竞争行为,其核心在于L公司在涉及M公司的误导性清算信息的发布、推送方面是否存在主观过错。由于缺乏公共数据合法使用方面的明确法律规则,一审法院通过确定数据来源合法、注重信息时效、保障信息质量及敏感信息校验四个基本原则来具体评价L公司行为的正当性。其中,数据来源合法是公共数据使用的前提要求。一审法院认为,互联网征信机构从公共领域采集企业信息的行为具有合法性,无须征得信息主体的同意。因此,法院对L公司通过数据爬取技术从国家企业信息公示系统等渠道获取公共数据并未作出明确的否定性评价,这一问题未成为本案的争议焦点。针对一审法院所确定的注重信息时效、保障信息质量以及敏感信息校验等三个方面的基本原则,L公司在二审时均提出了异议。正因如此,二审法院将本案仍然定性为大数据生态系统中公共数据使用者与数据原始主体之间因数据使用质量引发的纠纷。


公共数据使用的利益平衡机制


在上述案件中,一审法院认为公共数据是促进经济发展的重要生产要素,应当鼓励市场主体积极利用并深入挖掘数据价值,并在此基础上为公共数据合法使用初步确定了四个方面的认定标准;二审法院在一审法院所确定的四项基本原则的基础上,进一步将互联网征信企业公共数据合法使用的认定原则概括为“鼓励流动共享、兼顾各方利益”,体现了公共数据开发利用各方的利益平衡,有利于更好地保障数字经济下新型商业模式的创新发展。


公共数据往往包含着数据原始主体的个人信息、商业信息等内容。公共数据使用涉及相关主体的人格权益、商业利益、社会公共利益等多元利益诉求,公共数据使用者难以避免对数据原始主体的合法权益产生影响。2015年国务院发布《促进大数据发展行动纲要》以来,我国公共数据开发利用的实践长期处于“地方立法先行”“政策支持为主”的状态,缺乏对公共数据使用的具体法律制度保障。因此,笔者认为,对公共数据开发利用过程中不同主体之间的交错复杂的利益冲突,需要通过利益平衡机制加以调节与指引。


首先,是公共数据使用与安全保护之间的利益平衡。公共数据开发利用的功能定位和制度安排一般要求充分挖掘和发现公共数据中蕴藏的社会经济价值,激发和驱动数字产业的发展活力,但公共数据的开发利用往往也意味着风险的转移和交织。在面对算法技术迭代创新和数据量级不断积累的多重因素下,公共数据开发利用对个人信息权益、社会公共利益、国家安全利益的潜在风险冲击不断提升。对公共数据是坚持开发利用为先还是安全保护为重成为利益平衡机制所面临的挑战,这既需要顶层设计的统筹安排,也需要充分考虑数据产业发展不同阶段的特殊性和需求,在不同场景下确定对经济社会发展最有利的平衡点。


其次,是公共数据使用者、数据原始主体等利益主体之间的利益平衡。当前,围绕公共数据已形成了以数据开发利用为核心,由数据使用者、数据原始主体、数据存储发布者、数据消费者等多元主体构成的数据生态产业链条系统。公共数据的生态产业链条中牵涉多个不同利益主体,不同利益主体之间的价值定位、利益诉求、竞争关系等均存在较大差异和分歧,如何在公共数据开发利用中协调多方数据主体的行为,平衡不同利益主体的矛盾冲突需要重点关注和解决。公平合理的利益平衡原则和精细化的制度设计安排,对于多元数据主体之间的利益冲突的化解、数据正义的实现具有重要意义。


最后,是保障公共数据使用质量与追求商业利益之间的利益平衡。鼓励并引导公共数据商业化利用,是当前推动数据要素市场化配置的重要举措之一。对数据使用者而言,保障公共数据使用质量与追求商业利益最大化的抉择往往具有挑战性。公共数据使用质量的要求限制越低,数据使用者开发利用的自由创新的空间就越大,也就越容易形成更具创新性的数据产品或服务模式。然而,低质量的公共数据开发利用也会损害数据生态系统的其他数据主体的合法权益,进而影响整个数据要素市场化的持续健康发展。反之,公共数据使用质量的要求限制越严,数据使用者的创新动力就可能越不足。因此,就公共数据开发利用和数据要素市场化配置而言,合理确定公共数据质量的边界具有重要意义。


公共数据使用的数据质量保障


在上述案件中,除了数据来源合法外,法院确定的注重信息时效、保障信息质量及敏感信息校验三项基本原则,实质上都属于保障数据使用质量的原则性要求。根据法院的认定,信息时效包括信息更新的及时性和信息变动时间的准确性。及时性为互联网征信机构带来竞争力,而准确性则兼顾信息主体企业利益;信息质量包括推送信息的真实、准确和完整,高质量的信息既可以避免因征信行为给企业带来负面影响,也为信息使用者的科学决策带来价值;敏感信息校验主要针对敏感数据而言,互联网征信机构应当通过改进算法技术、数据复核、交叉验证等手段,提高数据推送质量。


(一)数据质量保障的正当性基础


公共数据开发利用的核心价值在于充分挖掘数据的潜在价值和经济效益,激活数字经济和数字社会的活力。公共数据在数据资源存量和数据种类覆盖面的突出优势可以推动公共服务更高效、更智能化地治理决策和公共资源配置,促进新技术的应用和商业模式的创新,推动数字经济与传统产业的深度融合,实现各行业数字化转型应用。公共数据使用中保障数据质量的要求具有一定的正当性基础。


第一,公共数据开发利用制度的基本要求。通过整合优化公共数据资源,推动公共数据最大限度地开发使用、激发数据要素市场的活力,是当前公共数据开发利用制度的基本要求。数据使用是公共数据开发利用的核心环节。为了更好地实现数据使用的社会经济价值,数据使用者一方面需要“善用”公共数据,充分挖掘数据资源,创新行业商业模式;另一方面,还需要重视数字经济商业模式的可持续健康稳定发展,“善待”公共数据,保证数据使用的完整性和可靠性。公共数据开发利用的目的在于推动散乱、无秩序的单个数据通过聚合、挖掘、整理形成具有商业效益和社会价值的数据产品,但低质量、有残缺、不及时、有偏见的数据不仅无法实现公共数据开发利用制度的价值目标,也无法挖掘出公共数据中蕴藏的真实数据价值。


第二,公共数据开发利用信任机制的实现需要。相较于个人数据和企业数据而言,公共数据因其数据形成和管理主体的权威性、数据形成过程的合法性、数据开放平台的规范性等,使得社会公众对公共数据具有更高信赖利益和期待价值。在上述案件中,数据使用者从国家企业信用信息公示系统等国家官方数据平台抓取、收集公共数据,再经过整合、挖掘、加工,使得公共数据实现了从政府数据开放平台向企业商用数据平台的数据再现和数据改装。在数据使用过程中,企业等数据使用者对公共数据更新滞后、恶意解读等不当使用行为会导致社会公众对商用平台数据来源,即公共数据本身的权威性和可信度产生质疑,从而动摇公共数据开放共享机制的稳定运行。此外,在数据驱动的数字经济时代,数据使用者保障数据质量也是提升其产品竞争力的重要措施,有利于其在同质化类型企业共同竞争的数字经济市场环境中提升竞争优势,也有利于其数据产品或服务更好地赢得数据消费者的信任,增强消费者对数据产品或服务的黏合度和忠诚度。


第三,权利与义务相一致性的要求。尽管当前理论界与实务界对公共数据的权属问题均争持不下,但对数据使用者享有数据使用/利用权的态度较为一致。中央“数据二十条”中也提出建立数据资源持有权、数据加工使用权、数据产品经营权“三权分置”的数据产权制度框架。公共数据的使用者可以享有对公共数据资源的自由开发、合法处理等数据权利。但是,权利与义务相辅相成。数据使用者在享有对公共数据自由开发与商业收益权利的同时,也需要履行相应的数据安全与数据质量的义务和责任,确保使用的数据具有高质量和可信度,对数据的准确性、完整性和可靠性进行评估,避免使用不准确、不完整或质量低下的数据。


(二)数据质量保障的基本内容


学理上,保障数据质量原则要求数据的使用应当保持高质量,做到及时、真实、准确、完整。就公共数据而言,数据使用者对公共数据的整合、加工、挖掘等处理活动在满足正当合法的数据处理目的的同时,也应当保障数据及时、真实、准确和完整。在上述案件中,法院对保障数据质量的具体要求进行了明确,即数据使用者在公共数据的合法使用过程中,应当确保使用数据的时效性、真实性、准确性及完整性。


具体而言,数据时效性要求数据能够及时地反映当前的真实状态或最新变化,确保数据反馈的实时性;数据真实性要求数据具有可验证和可审计的特征,不能捏造、虚构、变造源数据的内容,也不能虚构、捏造数据的来源;数据准确性要求数据准确地反映所描述的对象或事物的特征和属性,对既往历史数据的抓取和使用行为应尽到合理的注意与提示义务;数据完整性则要求数据的收集、展示应当完整、全面,没有遗漏和缺失。值得注意的是,数据完整性对不同程度使用行为的要求有所区别,直接使用数据应当保证最终展示、呈现的数据完整不缺失;增值性使用数据应保证数据在加工、整合过程中使用的数据不存在偏差与遗漏。


公共数据使用者的数据质量保障边界


在上述案件中,当时的法律并未明确数据质量方面的要求,司法是否能够直接创设相应的义务性要求存在一定争议。该案之后,《数据安全法》第四十一条对国家机关开放政务数据的准确性、时效性等数据质量要求进行了明确,《个人信息保护法》第八条也对个人信息处理者处理个人信息时的个人信息的质量要求进行了明确。然而,在数据质量要求之下,如何确定公共数据使用者的数据质量保障边界仍是难题。


尽管现有法律对保障数据质量原则进行了明确,但如果对公共数据使用者施加不合理的数据质量保障义务,数据使用者对公共数据开发利用的积极性或者创新动力将会受到负面影响。因此,有必要对保障数据质量要求进行合理限制。这种合理限制并非对数据使用者使用公共数据行为的特权豁免,而是在尊重技术和产业发展规律的基础上,对可能存在的当下无法克服、无法预见的现实矛盾作出的必要的利益协调。具体而言,保障数据质量要求的合理限制主要包括技术限制、成本限制、源数据的使用限制等方面。


就技术限制而言,公共数据使用者采取的数据处理技术措施无法保障绝对数据安全或高质量要求,即便已经采取了全流程的技术措施,但在面对外界更高技术维度的安全攻击时并非一定可以实现完全有效的防御。此外,即便公共数据使用者采取了当下行业领域内最先进和最具代表性的数据处理技术方案,依然无法完全有效克服和解决受历史局限性所导致的数据质量问题。


就成本限制而言,对数据质量保障成本的合理界定是对公共数据开发利用中存在实力差异的数据使用者作出的矫正保护。在数据要素市场化改革背景下,公共数据使用者的规模与实力同样存在差别,头部互联网企业与中小企业在数据质量保障方面的成本控制能力存在显著差异。在具体个案认定中,公共数据使用者对数据质量保障所需支出的成本应当成为限制因素之一。


就源数据的使用限制而言,不同来源的公共数据也会影响数据使用者对数据质量保障方面的要求。在数据开放场景下,公共数据一般划分为无条件开放、有条件开放和不予开放三类,不同的开放类型蕴含着对数据敏感性和数据安全性的风险考量。不同开放类型的公共数据要求数据使用者采取的技术措施并不一致,对有条件开放的公共数据往往还需要受到数据开放部门的数据利用协议的约束。因此,源数据的适用限制也应当成为数据质量保障的合理限制因素。


(本文为国家社科基金青年项目“政府数据开放的隐私保护研究”、浙江理工大学研究生课程建设项目“《网络安全法》案例库建设”的阶段性研究成果)



本期封面及目录

<<  滑动查看下一张图片  >>

《中国审判》杂志2023年第20/21期

中国审判新闻半月刊·总第330/331期


(关注“中国审判”微信号,获取更多精彩资讯)

编辑/徐畅

继续滑动看下一个
中国审判
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存