学术视界 | 知识产权数据治理研究
The following article is from 管理世界杂志 Author 董涛
知识产权数据治理研究
作者:
董涛(北京第二外国语学院)
文章刊发:《管理世界》2022年第4期
摘要:数据化进程给知识产权的治理结构和治理模式带来了较大变化。知识产权数据治理就是用数据技术将现实世界中知识产权的运行投射到数字空间中,将背后的隐藏信息提取出来,尽可能准确地刻画知识产权的运行规律,为知识产权政策决策与行为规范提供数据支持,以提升知识产权治理的能力与效率。在知识产权数据治理的建构过程中,还面临着制度数据刻画不足、算法伦理与数据正义、数据产权的法律属性以及数据平台行为规制等障碍与挑战。要从信息采集、处理、分析与应用等技术赋能与理念、制度、组织、法律、伦理等多维度的协同支撑与规范制约两方面完善知识产权数据治理。要立足于数据时代的客观要求,在知识产权数据治理中确立新型价值观,构建更加合理的知识产权数据治理架构,进一步扩大知识产权数据供给,加大知识产权数据的国际合作,以推动知识产权治理体系的完善与治理能力的提升。
关键词:知识产权 数据 数据产权 数据治理
一、引言
当今社会,随着数字生活方式普及,数据业态不断涌现,催生了图像识别、视频监控、人群画像等数据治理手段的出现,数据治理全方位赋能国家治理体系,驱动数字经济、数字政府与数字社会协同发展。互联网将“事”数字化,物联网将“物”数字化,数据世界因此成为物理世界投射到数字空间中的镜像(罗纳德·巴赫曼等,2017)。根据国际标准化组织等机构的观点,数据治理指建立在数据存储、访问、验证、保护和使用之上的一系列程序、标准、角色和指标,以通过持续评估、指导和监督,来实现数据的高效利用。这种技术性用语在治国理政的场景下,实际上就是全社会的数据互通、数据协同及跨部门流程再造,形成用数据说话、决策、管理、创新的治理范式与治理机制。数据治理可从三重范畴来理解:对数据的治理,即对作为治理对象的数据要素的所有权、使用权、监管权等生产、收益、归属等内容的规范;用数据来治理,即运用数据资源与数据分析来优化治理体系,改进治理模式,提升治理能力;数据环境治理,即对数据运用与数据资源共享的空间的规范,包括数据伦理与算法正义、数据安全等方面的治理(孟天广,2021)。
知识产权是国家治理体系的重要组成部分,对一国的发展具有十分重要的意义。知识产权的客体是人的智力成果。这类客体具有信息的属性,天然适于利用数据来表征。在“0”与“1”的数字转换中,波普尔所设想的作为人类知识宝库的“第三世界”得以更加完整、有序地保存与延展。知识产权数据包含法律、经济、技术、市场趋势等多重信息,具有极为重要的价值。用数据说话、用数据决策、用数据管理,是加快知识产权数字化转型,促进知识产权治理体系与国家治理体系深度融合的前提条件。知识产权数据治理就是采用法律、政策、标准、技术等一系列措施,通过数据赋能与数据赋权的双重机制,将数据嵌入到知识产权管理的不同层级之中,扩大公共参与,优化政策制定与公共服务水平,推进知识产权治理结构再造、业务流程重塑和服务方式变革,提升知识产权治理的能力与效率。知识产权数据治理是实现知识产权治理体系和治理能力现代化的基础支撑。实际上,在所有的财产权制度中,知识产权也是较早使用电子化、数据化手段来进行治理的领域,成为国家治理体系中的一个新的、重要的场景。
二、数字刻画:数据世界中知识产权治理的变革与转型
数据化进程给知识产权的治理结构与治理模式都带来了较大变化。知识产权的数据化治理就是试图使用一种“数字孪生”(digital twin)技术,把现实世界中知识产权制度的运行状况投射到数字空间中,用数据分析的方式把隐藏在背后的信息提炼出来,尽可能准确地刻画知识产权制度的运行规律,为知识产权的政策决策与行为规范提供数据支持。
(一)知识产权治理结构的变化
1.治理目标与治理基础
知识产权治理的目标是基于一种权利法定的准则主义,以“授权/救济”的二分形式,围绕特定客体(技术创新、版权作品、商业标记等)的生产(版权中的创作、专利中的发明、商标的设计)、分配(版权中以“作者—版权人”、专利中以“发明人—专利申请人—专利权人”、商标中“设计人—商标申请人—商标权人”)、消费(权利人—许可人—侵权人)关系展开的规范与管理活动。通过知识产权治理,以确保创新成果获得利益,吸引创新资源与人才流转,实现一国科技创新能力的提升与经济的良性循环(Greenhalgh and Rogers,2010)。知识产权数据治理在此之上确立自己的治理目标。
第一,以数据赋权,确保知识产权的顺畅运行。通过汇聚专利、商标、地理标志、集成电路布图设计等不同类型的知识产权数据,加强知识产权数据与经济社会各领域的数据,包括科研、工商、教育、财税、外贸、执法等方面数据的融合,能够更加充分、准确地发现知识产权运行的内在机理及运行中的问题。
第二,以数据赋能,进一步提高知识产权治理能力。2019年11月,中共中央国务院印发的《关于强化知识产权保护的意见》指出,加强基础平台建设,建立健全全国知识产权大数据中心和保护监测信息网络;加大信息集成力度,提高综合研判和宏观决策水平;加大科技研发,通过源头追溯、实时监测、在线识别等技术手段,强化知识产权保护。通过完善知识产权的数据治理,实现知识产权的政策决策能力、政务协同能力与监管协作能力等能力的提升。
第三,以数据赋责,形成便民利民的知识产权公共服务体系。2020年11月,在中央政治局第25次集体学习时习近平同志指出,要形成便民利民的知识产权公共服务体系,及时传播知识产权信息,让创新成果更好惠及人民。知识产权数据治理通过加大知识产权信息集成与开发力度,实现多元数据汇聚、融合、关联、分析,提升知识产权服务精准性,为产业发展与社会应用提供更加便利的服务。
知识产权数据的治理基础也表现出新的特征。知识产权数据治理基础可以分为法律基础与数据基础两个方面。
首先,从法律基础看,传统知识产权治理遵循的是一种法定准则主义。知识产权各分支法,如专利法、商标法等,都对数据披露有专门的要求。这些法律要求知识产权数据须以一种结构化的形式展现出来。知识产权数据治理除了要遵循这些规定外,同时还必须遵循政府信息公开、信息安全及个人信息保护等数据管控方面的法律法规,如《中华人民共和国政府信息公开条例》《中华人民共和国网络安全法》等。根据2018年欧盟GDPR规定,个人信息享有知情权、访问权、删除权等。我国2021年通过的《个人信息保护法》规定,数据的收集应当具有合目的性、相关性,并征得个人的同意,个人对数据收集享有知情权。
其次,从数据基础看,知识产权数据治理覆盖的数据基础更为广泛。知识产权数据治理的数据基础不仅需要包括各国知识产权管理机构及通过国际渠道授权的专利数据、商标数据、版权登记数据、植物品种登记数据等知识产权基础数据,同时还关注在这类基础数据基础上衍生出来的表征知识产权在经济生活中运行的数据。这类数据包括R&D的投入与产出绩效、知识产权对国民经济的贡献度、知识产权产业发展状况、知识产权产品类型数量占比等。
2.治理主体与治理客体
随着数字技术的发展,各类新型主体不断涌现。知识产权数据治理表现出一种政府、平台、企业、个人共同参与的主体多元化的状态,相应的法律关系也随之变革。首先,在知识产权数据治理中,政府占据着主导地位。统计显示,政府拥有全社会80%的数据资源(张莉,2019)。政府机构由于负责知识产权的审批、确权、保护等职责,因此也掌握着主要的知识产权基础数据。我国采用了不同政府机构负责不同类型知识产权的单行法模式,导致我国知识产权数据供给出现分散的态势。其次,“数字化+智能化”的加速融合,大数据与算法将网络平台塑造成知识产权治理中另一个重要主体。这类新型治理主体具有此前法律关系主体所不具有的“准立法权”“准行政权”“准司法权”等特征,在某些时候甚至承担起公法审查权,在知识产权数据治理中起着重要作用(马长山,2018)。再次,作为申请与拥有知识产权的个体,个人在数据权利方面的内容逐渐丰富起来。个人对知识产权数据的保护、使用及自动化决策权(数据画像)等方面的话语权越来越大,成为参与知识产权数据治理的一个积极主体。
知识产权治理主体之间通过数据共享、交换、链接等方式,构建起一个不同层级、不同极点的相互支持、相互协调的数据治理体系。国家部委之间、国家部委与地方知识产权部门、执法部门之间,国家机构与其他主要的知识产权机构,如EPO、USPTO、JPO、KIPO以及WIPO、WTO等国际组织之间,国家机构与主要的数据平台之间,通过数据交换与共享、多维度数据分析与业务协同等方式,形成一个巨大的“数据议事场”。在其间,不同的知识产权数据系统,包括知识产权执法支撑信息系统、知识产权注册登记簿信息系统、知识产权行政执法协同信息系统、知识产权权利人画像系统、知识产权市场监管信息系统、知识产权实时信息监测系统、知识产权行政复议系统、知识产权失信行为监管系统、知识产权经济数据统计共享系统、知识产权保护监测信息系统等,互相进行数据交换与共享,共同提升政府知识产权治理的能力与效率,为创新创业主体和社会公众提供高水平的知识产权数据服务。
随着电子技术将各种交易模式融入到一个巨大的系统之中,作为知识产权数据治理客体的知识产权数据开始展现为海量化与复杂化的趋势。根据WIPO的统计,截至2019年,全球约有1500万件有效专利,其中美国占310万件,中国约270万件,日本约210万件。全球约有6000万件有效商标,中国约2500万件,美国约280万件,印度约200万件,日本约190万件(WIPO,2020)。此外,还有工业品外观设计、集成电路布图设计、地理标志、商业秘密等类型的知识产权数据,加上之前已经失效的知识产权数据。总数量应当是在亿级的级别。知识产权数据治理就是希望汇聚起全球的各类知识产权数据,实现与经济、科技、执法、市场主体等信息的互联共享,打破数据壁垒,解决数据分散化、碎片化信息孤岛现象,构建起庞大的知识产权数据体系与多元化的应用场景,促进知识产权数据的有序流通与价值增值,满足社会公众对基础性、权威性、安全性数据的需要,通过各种数据与信息公共服务平台,为政府政策决策、企业投资与经营决策、科研机构研发决策提供各类型数据服务。
(二)知识产权治理模式的转型
经过一系列技术手段和程序处理的数据,最终将以一种被清洗过、结构化,甚至可视化的分析结果呈现出来,这些数据结果会被直接用于各种用途,包括商业决策、公共政策、行动干预等(林曦、郭苏建,2020)。随着数据化进程的展开,传统知识产权法律关系也面临着冲击与挑战。知识产权的治理模式,包括政策决策、创造模式、审查审批、商务交易、保护模式、公共服务等,都展现新的特征,出现转型。
1.知识产权政策决策
实际上,从施奇穆克用专利来表征创新水平开始,知识产权几乎就成为创新的代名词(Schmookler,1966)。全球创新指数(GII)、洛桑报告(IMD)、全球竞争力报告(GCI)、欧洲创新记分牌(EIS)等测量全球创新能力与布局的报告以及国际创新调查标准规范《奥斯陆手册》中,均有大量的知识产权指标。一国决策者可以根据创新测量的相关数据,来观察全球及本国科技研发水平及产业结构与市场竞争态势,调整国家创新政策及研发投入的规模、重点与方向(Karen,2007)。知识产权的政策决策转变为注重以知识产权数据的获得与分析为基础的决策模式。通过从技术情报、市场价值、法律稳定性、产业竞争等多维度及特定区域、特定产业、特定创新主体等多口径的分析挖掘,形成对知识产权运行状态的总体画像,从而为知识产权政策决策提供支撑。
2.知识产权创造模式
数据化时代,知识产权的创造模式也产生了极大的变化。随着数据技术的发展,人类提取、生成、存储和处理文化元素的能力大幅提升,出现了各种新型的作品创作范式,智能化创作、机器翻译、短视频、数字化作品等形式不断涌现。同时,也出现了利用机器、软件进行剪接、拼凑的“洗稿”等新型侵权形式。在数据环境中,以作品数字化为起点,形成从“书籍出版—游戏软件—影视作品—其他衍生产品”的全面辐射,包括从版权交易到影视内容的制作发行,再到游戏、电商、实景娱乐、玩具等实体物品的销售,艺人经纪、粉丝经济等一系列衍生产品的开发,进而构建起以新型消费结构、生产结构与市场结构为特色的整体优化升级的文化产业生态体系(江小娟,2021)。数据技术也推动了技术研发模式的转型。在技术研发立项之前,几乎都需要事先搜索并分析全球相关主题的专利数据,才能对人类已有知识宝库有比较深入的了解,从而对技术必然性趋势做出预测,确定研发方向。技术创新领域因此也流行一种TRIZ理论,即“发明问题解决理论”。基于在先知识产权数据蕴含的丰富的市场竞争、法律状态、技术路线等信息,寻找并确定未来的研发方向。
3.知识产权审查审批
随着搜索引擎、图像识别、机器翻译、文字语义分析等数据处理技术的突破,知识产权的审查审批模式也产生了革命性的变革。数据技术极大提高了审查效率,现代审查模式不再是审查员根据主题词逐一检索、汇总、阅读、比对相关文献,而是先由智能搜索引擎使用文字比对、语义分析等方式,在包括多语种的全库进行对比分析,然后将相关文献提取出来。在先技术范围在实质上已经扩展到全球范围了。而图形识别技术的发展更是极大提高了商标、外观设计等标识、图形类的审查精度与审查效率,有效缩短初步审查时间,提高审查的客观性。由于数据技术的发展,能更好地掌握全球技术发展态势与知识产权布局,通过针对不同技术领域的技术特点提供相应的审查审批服务,如比对范围、创造性高度等,可以更好地发挥一国知识产权审查审批政策的引导作用,从而更好地促进一国创新事业的发展。
4.知识产权商务交易
知识产权客体具有信息隐蔽性与不对称性特征,再加上技术淘汰与更新率等因素影响,使得知识产权价值难以评估。但是,不管是使用市场法、收益法、成本法等模型,都需要搜集大量有关技术、研发、市场、财税、法律、产业发展等数据与信息,使得知识产权价值评估既费时耗力,又难以确保精确性。随着数据技术的发展,一方面,可以通过与不同部委之间,以及国际其他组织之间大规模的数据交换,获得全球范围的知识产权审批、信贷、税务、海关、裁判、执法等数据;另一方面,可以通过数据捕获,或者使用传感器、视频监控等智能设备收集用户在使用知识产权制度过程中产生的各种经济数据信息,或者使用编程软件等在网络平台上自动抓取、汇编的各种数据信息,知识产权的数据范围得到前所未有的扩展。在前所未有的海量数据基础之上,使用不断自我优化的价值估价模型,知识产权的价值评估能够更加精确,从而改变知识产权许可交易、投资入股、融资担保、证券保险等商务交易模式。
5.知识产权保护模式
数据技术极大地改变了知识产权的保护模式。区块链、时间戳等分布式数据存储技术的发展,能够有效解决版权作品与商业秘密权属证明困难的问题,有效降低知识产权确权成本(董美根,2016)。图像识别、水印追踪、鹰眼系统等技术改变了知识产权市场侵权监测的模式。阿里巴巴、腾讯、京东等大型电商都提供专门的知识产权投诉与维权平台,并构建自己庞大的知识产权数据库、商品数据库及专业化的图形识别、文本分析等数据分析工具软件,对市场信息源进行实时数据流收集和监测,以发现来自公开市场和供应链的不可见风险,如假冒商品、侵权品、灰色市场等。一些专业平台,如厦门公信云等,开始提供知识产权侵权的网上取证与公证服务。最快捷、最有力的知识产权惩戒手段开始由行政机关的处罚与法院裁决转为数据平台的删除、屏蔽,以及对违规账号警告、限制功能、封禁、注销等处罚。知识产权保护模式因之产生了根本性的变化。
6.知识产权公共服务
数据技术的发展使得知识产权公共服务变得更加快捷、更加便利。国家通过构建基础、权威、安全的数据平台,形成知识产权数据汇聚与传输的枢纽,地方构建专业、特色的知识产权数据库,形成多层次、网格化的知识产权数据服务体系,成为为创新与市场竞争服务的新型基础设施。在此基础之上,建立起知识产权数据公共服务和共享交换通道,为社会提供数据共享、业务协同、信息查询等服务。依托现有的专利、商标等电子申请系统,以通道链接等方式构建业务通道,实现商标、专利、地理标志等知识产权统一服务门户,为知识产权业务服务提供便利化;构建政务通道,通过与相关部委加强数据共享与业务协同,对接国家统一政务服务平台、国家“互联网+”监管系统及企业信用信息公示系统,实现政务服务一体化。完善知识产权注册申请与事务办理两个通道,实现知识产权注册申请、缴费、查询,在线申请副本,投诉咨询等各类事务全流程电子化、无纸化、代码化。构建信息检索查询一体化服务,为社会公众提供知识产权数据信息多样化、一站式的检索查询服务。
三、问题透析:知识产权数据治理的障碍与挑战
数据的嵌入既大大提升了知识产权的治理能力,又给知识产权治理的建构带来了新的问题与挑战。问题一方面似乎飘散到遥远的地方而显得更加抽象了,另一方面又被推到了每一个人面前,从而显得更加具体(张康之、向玉琼,2015)。归纳起来,知识产权数据治理建构中面临的障碍与挑战主要包括四方面,制度数据刻画不足、算法伦理与数据正义、数据产权的法律属性,以及数据平台的行为规制。
(一)制度数据刻画不足
知识产权数据治理就是要使用数据技术,把知识产权运行状态投射到数字空间中去,准确刻画知识产权的运行规律。不过,目前知识产权数据在对制度运行进行刻画时,还存在数据供给能力与数据刻画能力两方面的不足。
1.数据供给能力不足
知识产权制度的基本理念是通过向社会公众事先告知知识产权权利边界的方式,使社会公众预知知识产权的布局,发现其中可自由行动的空间,获得对权利的稳定预期。在网络时代,这种告知方式主要通过知识产权机构向社会公开披露知识产权基础数据的形式来实现的。不过,虽然国家知识产权机构定期向社会提供大量的、丰富的知识产权基础数据,但仍存在着数据供给能力上较大的不足。这种不足主要表现在两方面。
一方面,虽然目前国家知识产权机构提供的知识产权基础数据数量上看似较多,但知识产权基础数据开放的口径与范围还需扩大。此外,更为重要的一点是,在版权数据供给方面还存在着严重的缺陷。由于版权采用的是自动生成原则,这一原则在早期版权客体比较单一的时候,法官只需要比对作品的表达形式,尚还能应对。但是,随着今天版权的保护客体日益复杂,例如软件保护对设计架构、算法等的诉求,改编权对作品主线的把握,以及形象化权对作品形象的保护等,其实质上都将版权的保护突破“思想/表达”的二分界限,将版权客体一定程度扩及内容之上。由于缺乏“入口端”的审查,那么在涉及这类作品效力时,需要法官在涉诉时先行判定。而目前的版权登记制度只是形式审查,并不对作品内容进行抽象界定,因此也就缺乏一个在先作品相关权的数据库支持。法官在认定时,无论是在先作品的范围也好、在先作品的内容也好,都只能凭个人的学识积累与主观判断来进行认定,导致版权的保护范围难以理性预期,从而带来比专利制度更为严峻的稳定性危机。
另一方面,与相对于较为丰富的知识产权基础数据相比,与知识产权运行有关的经济数据供给明显不足。知识产权基础数据必须与各种有关的经济数据相结合,才能深刻地反映知识产权制度运行的轨迹、效用与规律。目前,我国国家统计局仅提供R&D方面的总量数据,具体、细化的数据并不提供。涉及市场主体利用知识产权产生收益的数据分散在不同机构手中,如市监局掌握着与知识产权有关的市场数据,商务部掌控着与知识产权有关的贸易数据,人民银行掌控着与知识产权有关的金融数据,国家税务总局掌控着企业使用知识产权获得收益的数据,工信部管理着知识产权相关的行业与产业数据,国家网络监管部门掌握着各大平台以及网络中的知识产权相关数据。由于数据资源部门化、专属化、利益化的思维与保护隐私、商业秘密等原因交互影响,出现比较严重“数据割据”的现象,导致知识产权经济数据总量供给上还呈现出严重不足的状态。
2.数据刻画能力不足
索洛在1957年使用了一种“剩余法”的方法来计算技术对经济的贡献度。这种方法有点类似于一个“黑匣子”,也即将劳动与资本投资等能够确定的贡献刨除以外,其他无法确定的部分都归功于技术创新的贡献(Solow,1957)。这种计算方法相对而言比较粗糙。随着制度经济学的发展,认为应将制度变迁与技术变迁对经济的促进作用区分出来,构成推动生产力发展的独立变量。这就意味着,要对知识产权制度进行准确地画像,至少要从三方面认识:首先,打开“黑匣子”,将技术创新与制度变迁的作用区分开来;其次,将知识产权的促进作用与其他制度的促进作用区分开来;再次,避免将知识产权的作用简单局限于经济收益的做法,认识这一制度带来的经济方式转型、社会文化思维转变、企业家精神培育、全新生活方式养成等更广泛的社会收益。
根据联合国与欧盟委员会等所编写的《国民经济核算体系2008》(SNA2008)(UN.,et al.,2010),对原来称为“无形生产资产”的资产进行了新的核算处理,改成更为直观的“知识产权产品”,并进行了扩展,放在固定资产名下。通过调整在GDP中的核算方法,从国民经济总量的角度来对知识产权进行了刻画。根据鲍莫尔(Baumol,2002)的计算,1870年至今,美国GDP增长的90%归功于创新。在这其中,以知识产权法为主的利益机制对创新做出直接贡献的人回馈了约20%的收益,而80%以上则贡献给了社会。通过这种计算技术外溢的方式,从社会对技术创新带来的总体收益进行分配的角度对知识产权进行了刻画。Ginaete和Park(1997)使用一种G-P指数的方法,从5个维度对122个国家(地区)的知识产权保护强度进行衡量。这种定量研究从整体保护水平角度对知识产权进行了刻画。WIPO(2015)通过一种与受版权法保护客体关联性程度为标准,对版权产业进行了计算。2019年,我国国家统计局发布了关于知识产权密集型产业分类的方法,即《知识产权(专利)密集型产业统计分类(2019)》(国家统计局令第25号)。这些测量方法从社会大的产业结构角度对知识产权进行了刻画。
以上是目前利用数据对知识产权进行制度画像比较成形、比较权威的做法。除此之外,学界还从其他角度进行描述,如知识产权内部结构的交替关系、知识产权与外国投资的关系(Glass and Saggi,2002)、知识产权与国际技术转移的关系(Arora,2009;Maskus,1998)知识产权与研发创新绩效(李平等,2007)等,但总的看,目前知识产权的数据刻画能力仍有较大的不足。归纳起来,起码包括以下方面。
(1)对知识产权制度的数据刻画需要更加体系化与精细化。尽管目前对知识产权的定量化研究较多,但总体看,这些刻画尚缺一种体系化的考量。知识产权并不是一个独立自主、自给自足的系统,而是“嵌入”到社会治理技术大系统下的一个子系统。决定这一制度运行与变革的力量很多,这一系统能否良好运行,取决于与外部社会大系统协调与否。因此,这种体系化的数据刻画要考虑正反方面,既要刻画知识产权系统对创新资源的引导力、吸引力,也即从研发投入到转化为现实生产力的全流程,更要刻画其他力量,如政治寻租等,对创新资源的干扰力、扭曲力,从而导致对知识产权运行理想状态的悖离。知识产权的数据刻画也需要更加精细化。以G-P指数为例,尽管我国学者韩玉雄和李怀祖(2005)观察到立法和执法间的不匹配,加入了“执法力度”,对G-P指数进行修正。但即便如此,这种修正仍然离对中国现实国情的准确刻画还有较大的差距。在大数据背景下,需要刻画的更加精细。
(2)知识产权技术分类与产业、产品分类的对应。知识产权数据刻画是以分类为基础展开的。知识产权数据采集时,首先需要根据不同技术类别、不同商业标识的应用范围进行分类、标记与索引。以专利为例,在申请时依据技术领域,结合专利著录项目信息,确定国际专利分类号(IPC),归类于相应的技术领域中。但专利技术在现实中则是以生产方法或产品的形式产生作用的。以技术领域为基础的IPC分类与国际标准产业的ISIC分类和产品的CPC分类之间不存在一一对应关系,导致知识产权数据分析,如专利布局、商标态势等,与产业结构与产品结构存在脱节与偏差,从而使得知识产权数据刻画难以具有针对性与实用性。
(3)对知识产权的评估定价亟需权威的定量化刻画。知识产权评估定价,既是知识产权运行中面临的一个重点问题,也是一个对数据刻画能力要求极高的难点问题。尽管存在诸多模式与算法,但这仍是一个困扰众多知识产权法专家、技术与财务专家、投资专家多年未能解决的“世界级难题”,缺乏权威性的解决方案(Berman,1999)。在寻求通过使用长期积累的各种经济数据对知识产权进行价值评估外,一个目前比较现实的思路是利用司法“定价”来确定,也即以司法机关判定的赔偿数额为基础来计算市场价值(孔祥俊,2014)。这也对利用海量的知识产权判决案例进行数据分析的能力提出了更高的要求。
(二)算法伦理与数据正义
知识产权数据治理涉及到一个知识产权数据的采集、分析与应用的过程。这主要借助算法来进行的,算法在数据治理中起到了极重要的作用。但是,数据的分配与算法的设计也可能带来诸多的社会问题。因此,知识产权治理中,有必要从正义伦理的维度对其中的算法进行价值检视(Dencik et al.,2019)。
1.数据分布的不均衡性
目前,知识产权数据一个比较显著的特征就是分布上的不均衡性。从地缘分布看,目前全球大概有1500万件有效专利,再加上之前失效的专利,数据总量大体在2000万件以上。但是90%以上集中在USPTO、EPO、JPO、KIPO与SIPO这五大知识产权局中。其他如商标、版权等的数据分布大体类似。这种分布上的不平衡性反映了背后巨大的技术鸿沟。在这种结构下,知识产权数据匮乏地区的研发活动处于一种相对的劣势地位。而从供给结构看,以我国为例,呈现一种基础数据集中供给的卫星状布局。以生产基础数据的知识产权审批机构、审判机构为中心,周围分布着这些机构附属的数据处理加工机构,再外围则是众多的市场化数据机构。这种格局中,与生产基础数据的政府机构附属数据加工机构相比,在获取数据的便利性、全面性与及时性方面,一般的市场性数据机构处于一种相对不利的地位。
从数据种类看,随着全球网络互联互通,尤其是智能机器翻译技术的发展,专利审查中的数据范围得到了前所未有扩展。专利中的在先技术范围从实质上已经扩展到全球范围了。从代际正义的角度看,这实际上使得今天申请专利中的新颖性要求比前代高出了不少。同时,正如前面所讨论的那样,与专利商标的数据支持相比,版权作品的数据库建设存在不足,导致版权审判者获得的数据支持力度较弱。因此,从一国大的知识产权体系看,对软件保护中设计架构、算法等诉求,改编作品主线的把握,以及形象化权中作品形象的保护等,都处于极不利的状态,版权保护范围难以理性预期,带来比专利商标制度更为严峻的稳定性危机。
在某些领域还存在着较大的数据垄断现象。以网络音乐流量为例,2016年,腾讯收购中国音乐集团后,网络音乐曲库流量市场占有率超过80%。此外,随着新版权法的对技术措施规定的修改,也引发了版权数据分配上新的不平衡。在传统传播媒介时代,版权法基本上都规定了合理使用的相关规定。这种情况下,版权的作用一定程度上类似于栅栏,虽然社会大众不能未经许可为经营目的复制使用,但是还能在栅栏外欣赏。数字时代,随着保密措施的合法化,使得版权保护成为了高墙,将版权作品的数据包围在内,版权保护转变为商业秘密的保护,切断了社会公众合理使用的可能,带来了版权数据分配上新的不平衡。
2.算法权力的应规制性
数据世界中,算法借由评级、分类、预测等处理,实际上做出决断、选择方向,管理着信息、劳动力和各种资源的分配,行使着对其他主体的影响力和控制力(周晖,2019)。但是,算法也容易出现崩溃、失灵的问题,出现侵害个人权利等影响经济社会发展的情形。因此,欧盟委员会、美国等都要求算法应当遵循以人为中心、公开透明、稳健安全等原则。我国网信办等九部委2021年9月联合印发的《关于加强互联网信息服务算法综合治理的指导意见》中,提出了算法公平公正、透明可释、安全可控、保障权益的原则。知识产权数据治理中,同样存在算法歧视等不公平现象。因此,需将伦理准则植入算法设计之中,基于安全、秩序或个人权益保障的需要,对算法进行引导、规范或监管,确保算法向善。
例如,随着数字技术发展,不少知识产权机构开始采用机器申请的策略,短时间内堆积了大量的商标申请。据IPRdaily统计,2020年,全国商标申请总量约950万件,仅阿里巴巴一家的商标申请量就达到将近100万件左右,意味着每天申请量在3000件左右。其次的权大师约占34万件,之后的中细软、猪八戒等均在10万件以上。但商标需要审查,审查人员的精力和时间都是有限的。这种利用机器算法轰炸商标审查员的模式,本质上类似于侵占国家通讯信道资源的行为,在很大程度上挤占和浪费了全社会应平等享有的公共行政资源。
又如,“视觉中国”采用了一种整合全球优质版权素材,以大数据、搜索与图像识别技术为上下游供稿方和使用提供交易服务的经营模式。视觉中国早期以图库授权为主,后来则转变为以诉讼推动图库销售的策略。但是,“视觉中国”采用的水印标注与鹰眼图像追踪技术却引发了较大的争议。在“哈尔滨正林软件公司”案中,最高法院确认了提供网上图片截屏水印就可以证明是图片著作权人的做法。2019年,“视觉中国”将史上第一张人工技术成像的黑洞照片打上水印,标注为其版权所有。实际上,“视觉中国”利用水印技术,从黑洞照片到中国的国旗、国徽、知名企业商标、logo等,都纳入其版权图库。这是明显将社会资源据为己有的侵占社会公共资源的行为。此外,其利用自动全网爬虫构建的无限追踪技术算法,也呈现出积极、攻击的态势,违背了版权技术措施应当保持消极、抑制的原则,引发了业界广泛争议。
再如,目前一些媒体机构常实施一种“洗稿”行为。所谓洗稿,就是利用机器算法对他人原创作品进行篡改、删减、拼凑,看起来与原作区别不小,但其实最有价值的部分还是抄袭的。“洗稿”形式大体有这样几种:同义词替代,近义词、否定+反义词替换;调整句子顺序,变化词语顺序,变化句式、颠倒句子。与搬运式抄袭相比,洗稿更加隐蔽,更加高级。目前,自媒体行业已形成了庞大的洗稿产业链。一些公众号后面存在的是洗稿工厂,洗稿行为开始流水线作业,越来越产业化、规模化。这些利用算法进行“洗稿”赚取点击量的行为,都极大损害了原创者的利益。
(三)数据产权的法律属性
数据治理中面临的第三个核心关键问题是数据的产权问题,即数据归谁所有、谁可以使用、数据收益如何分配等问题。数据的产权归属涉及到是否将数据产权纳入知识产权范畴?知识产权相关数据的归属,以及某些新型的数据,如AI成果等的产权归属问题。
1.数据的权属问题
目前,关于数据的财产保护立法尚处于空白地带,在《民法典》起草过程中,对数据采用何种产权保护路径存在较大争议。这主要集中在两方面,一是通过既有财产权保护来吸收,主要如所有权保护、知识产权保护等;二是以新型数据财产权保护方式(文禹衡,2020)。《民法典》对这一问题没有表态,而是采取了一种模糊处理的方式,既在第123条规定知识产权,又在第127条对数据进行了规定,保留了以一种专门数据产权保护的可能性。数据具有财产的特性,即效用性、可控性、稀缺性,可以带来预期收益(文禹衡,2020)。从目前的主要判例看,司法态度基本上偏向于将数据产权分配给开发利用数据的收集、加工者(张莉,2019)。不过,《民法典》第11条明确规定了个人信息权利的保护,导致数据产权又会受到个人信息权利保护的影响。例如,在“新浪微博诉脉脉”案中,确立了一种“用户+平台+用户”的三重授权原则。虽然数据产权保护的特殊性导致其法律属性存在争议,但将数据产权纳入知识产权大的范畴从理论上看也是没有什么问题的。
从《民法典》第123条下的种类来看,知识产权并不是个建构在公认的共同特征之上闭合的概念,相反,是通过列举式建构起来的具有包容性的概念。例如,专利与商标而言,专利保护的技术方案,更符合智力创造的定义,而商标保护的则是标识,更重在传递信息;再如,专利与商业秘密而言,专利的基本特征在于信息的公开,而商业秘密的基本特征却是保密。两者截然相反。但是即便具有这些相悖的特性,仍然都能统括在知识产权大的概念之下。数据与知识产权的客体相比,具有同源性。根据美国管理思想家罗素·艾可夫的理论,人类的知识体系分为4个层级,数据、信息、知识和智慧,即DIKW体系(Data-Information-Knowledge-Wisdom)。可以分别对应数据、商标、专利(版权)的架构。数据权受到的侵害也与其他知识产权类似,都是以拷贝、复制为主要形式,保护手段也大体类似。基于这种同源同构的特征,使得将数据产权纳入知识产权并无不妥。那种将知识产权视为封闭概念,因数据产权保护中的局部特殊性就意图建立一种与知识产权相排斥的数据产权的做法,实际上是没有多大的意义的。
此外,对于知识产权基础数据的权利归属问题,也是一个需要讨论的问题。知识产权基础数据,例如专利、商标等,是由申请人申请,政府审批机构审批公告后形成的。但是,在目前没有司法判决的支持下,作为数据的生产主体的政府审批机构是否可以成为数据所有者是存疑的。知识产权数据公司在对知识产权相关数据进行收集、清洗、加工后,根据目前司法判决的原则,可以成为其加工后数据及所做的分析成果的拥有者。知识产权人作为个体,在申请专利或商标时,提供了自己的数据,是否也可以适用前面提供的三重授权原则,对数据公司加工的数据产权提出诉求?这在法律上没有明确规定。不过,从理论上说,三重授权原则是以《民法典》第111条个人信息受法律保护为基础的,这一原则主要适用于那些从个人处收集涉及隐私信息的情况下,如身高、体重、血型、电话号码、身份证号等。而知识产权信息则不同,专利商标在申请时本来就需要公开,申请人知道信息需要公开而仍然作出选择的,这可视为一种附条件契约或使用的默示许可。基于此,三重授权原则似乎不应适用于知识产权基础数据加工的数据产权。
2.AI成果的适格性问题
2017年,微软人工智能“小冰”创作诗集《阳光失去了玻璃窗》出版,成为第一部完全由人工智能创作的诗集。这也引发了一个新问题,即人工智能生成物是否可以享有知识产权。这从主体上与客体上都提出了一个适格性问题(吴汉东,2017)。就主体而言,自笛卡尔主客观二分法确立以来,只有具有道德伦理与自由意志的自然人才能成为法律的主体。虽然后来通过法律技术创设了“法人”这个拟制人的概念,但人工智能的法律主体地位一直存在争议。根据知识产权法,知识产权的成果一般指人类智力创造的成果,人工智能不能成为知识产权意义上的权利主体。在1997年的“神圣基金会”一案中,法院指出只有“人”创作的作品,才能获得版权保护。而在最近美国法院的裁定中,也指出法律仅允许个人拥有专利,人工智能不能成为专利的发明者。尽管目前知识产权法未认可人工智能的主体地位,不过在知识产权侵权中或诉讼等情形下,为加强对权利人的保护,在人工智能拥有自己财产(例如拥有账号或可以随时转换为金钱的积分)等情形下,是否可参考英美法上的对“物”诉讼,赋予其独立的诉讼主体地位,从而免去通过繁琐程序寻找其拥有者而直接予以执行,也是一个可行的方案。
智能技术的发展,创造了新的知识产品,丰富了知识产权的客体范围。但是,机器作品的“可版权性”、机器发明的“可专利性”问题,也存在争议(吴汉东等,2018)。2018年,腾讯机器人写作助手Dreamwriter创作完成了一篇财经报道被上海盈讯公司网站转载,引发争诉,法院认定腾讯写作软件生成的作品满足著作权法保护条件,属于版权作品。同年,北京菲林律所使用法律统计数据分析软件生成了影视娱乐业司法数据的分析报告,被百度平台发布。但法院则认定计算机软件生成文章不构成作品。尽管两家法院各有自己的说理,但在大数据时代,人工智能具有极强的学习能力,也许在某种程度上还无法触及人类最深沉的意识、最微妙的情感,但其生成作品从外观看与自然人作品相比很多时候并无二致,有的甚至更好。因此,满足版权法上的独创性要求应该说还不成问题。就专利而言,由于人工智能具有的强大的运算分析能力,可在更大范围更精确地将自己的技术成果与在先技术进行对比和筛选,有效规避在先技术,满足专利的实质条件并不难。可以说,即便人工智能在知识产权法上的主体地位还不能确定,但起码犹如一种相机般的高级工具,其生成物具有知识产权客体的适格性应无不妥。
(四)数据平台的责任与规制
大数据时代,网络空间成为大众参与公共活动的重要场域。大量的版权作品、商业标识与专利方案都以数据流的形式在这一空间流转。网络平台,以高效的算法匹配双边或多边市场,成为数据聚合与扩散的中心。由于技术能力等原因,行政机关难以直接对平台上行为进行规范,转而对平台课以义务,要求平台代为行使监管职责,淘宝、京东、腾讯等都建立自己的查处机制,每年处理大量知识产权纠纷,一定程度上具有规则制定权、执行权与司法救济权。相应地,平台责任与规制也成为一个重要的话题。
1.平台的责任与豁免
网络空间中,信息载体数字化。面对海量的数据,公共部门无法通过传统的审查方式对信息内容进行规制,而需诉诸于平台的力量。平台采用关键词过滤、删除、屏蔽、封停账号等技术手段控制信息数据的流通。平台不再是传统的私的主体,而是被赋予了监控质量、打击侵权、披露信息、管制价格的市场规制者责任。我国以《网络安全法》和《互联网信息服务管理办法》为基础,辅之以大量的规章和规范性文件,构建起了一个以平台为中心的规制体系。在该体系中,要求平台发挥在发现、寻找、处理违法信息方面的优势,承担审查注意义务,积极展开规制活动。若平台未按照法定要求处理违法行为,则可能需要承担相应的法律责任。网络空间因此改变了以往国家与社会、权力与权利的关系结构与功能,形成一种政府管平台、平台管网店的“公权力—私权力—私权利”的新型治理格局。
网络空间中,对知识产权的保护是其中一个重要的内容。目前,各大平台基本上都建立起了自己的知识产权保护机制,以履行监管职责。如淘宝的“假货模型系统”,从账号、商品、交易、物流等多个维度对涉嫌售假的商品和账号进行排查。再如京东的“护宝锤”、腾讯的微信维权平台等,都为知识产权人的保护提供了救济机制。不过,如何科学地确定平台的责任,是关涉平台是否良性发展的核心关键。目前各国基本上采用了一种责任豁免机制。美国经历了一个从“通道原则”到“避风港原则”再到“红旗原则”的历程。我国《电子商务法》与《民法典》在“通知—删除”原则的基础上,构建了一种更为精细的“通知—转通知—反通知—删除”的规则,以平衡电商平台、知识产权人与经营者三方的利益。2019年国务院办公厅发布了《关于促进平台经济规范健康发展的指导意见》的38号文,明确指出既强调平台的监管责任,又强调政府的监督执法职责,不得将本应由政府承担的监管职责转嫁给平台。但是,如何科学地设定平台的责任仍是一个需要深入探讨的难题。
2.平台的监管与规制
平台从本质上说仍是商业企业,为追逐利益,有可能出现滥用私权力的行为。平台权力滥用的现实风险存在于制定规则、审核卖家资质、设定搜索排序、评价信用、实施惩戒措施等诸多环节。例如,为争取更多的消费者用户,平台可能对平台内经营者提出过高要求;为谋取眼前利益,平台又会对平台内的违法经营行为视而不见(刘权,2020)。平台作为私主体身份,其对平台内的审查活动可能会存在突破比例原则、缺乏正当程序保护、合法性约束淡化等现象。由于缺乏正当程序装置的保障,用户权利被侵犯的可能性大幅增加。例如,前面提到的平台利用算法轰炸审查员、利用电子水印无限追踪用户等。再如,有的平台在网规中规定,其有权不经通知随时对相关内容进行删除、屏蔽,并视行为情节对违规账号处以警告、限制功能、封禁、注销等各类处罚(孔祥稳,2020)。此外,平台的员工也可能受利益驱使,利用平台管理权限谋取私利。如采用删差评、刷信誉等手段与商家私下交易,利用知识产权投诉规则对季节性商品进行要挟,形成“私设公堂”的局面等。因此,有必要加强和完善对平台滥用权力行为的监管与规制。
网络平台在经营过程中,产生和存储了大量的数据资源。平台通过数据收集,能实时分析商家与用户的状况,在激烈的市场竞争中获得竞争优势。但是,近年来,平台开始频繁使用数据进行垄断与歧视等行为,引发广泛关注。这些行为包括平台基于数据优势滥用市场地位拒绝竞争对手获取数据资源,如2017年菜鸟跟顺丰之间为争夺物流数据控制权而相互关闭数据接口的行为,以及最近期的湖南蚁坊软件公司诉新浪微博数据垄断案等;也包括基于数据画像对消费者进行差别待遇的大数据杀熟,或基于数据优势搭售等行为,如携程等在线旅游、网约车、网购等平台都曾对客户采取差别定价的策略。2021年初,国务院反垄断委员会发布了《关于平台经济领域的反垄断指南》,对网络平台的垄断行为进行了界定。2021年初,国家市场监管局对美团立案调查,认定美团以实施差别费率、拖延商家上线等方式,并通过数据、算法等技术手段,实施“二选一”行为,排除、限制了相关市场竞争,予以行政处罚。此外,国家市监局也对阿里巴巴滥用市场支配地位的行为予以行政处罚。尽管国家对平台垄断行为重拳出击,但传统垄断法对数据垄断行为的适用还比较困难,对平台数据垄断行为的规制仍任重道远。
四、应对之策:知识产权数据治理的完善路径
知识产权的数据治理,不仅需要信息采集、处理、分析与应用等技术的赋能,更需要理念、制度、组织、法律、伦理等多维度的协同支撑与规范制约。具体而言,应立足于数据时代的客观要求,在知识产权数据治理中确立新型价值观,构建更加合理的知识产权数据治理架构,建立全面的知识产权数据调查统计制度,加大知识产权数据的国际合作,扩大知识产权数据供给,形成对知识产权制度更精确的数据画像,以推动知识产权治理体系的完善与治理能力的提升。
(一)知识产权数据治理中价值观的变革
制度的价值观是所处时代价值观的折射,为制度的治理提供必要的指引。随着网络的飞速发展,普遍性、一致性、抽象化的生活方式逐渐消失,根据特定情形、地域和对象的数据分析、场景定制、程序建模等,逐渐成为趋势(马长山,2018)。在知识产权数据世界中,治理的价值观也需要在这种定制场景中展现和考量,并根据所处形势进行相应的变革。知识产权数据治理价值观的变革应体现在以下3个方面。
数据正义观(data justice)。在知识产权数据供给方面,应统筹整合知识产权数据资源,解决数据供给不平衡、不充分带来的供需矛盾,实现数据供给均等化,避免类别间、地区间、产业间差距过大现象。国家应侧重考虑如何扩大基础数据供给,地方则要突出特色化、专业化数据供给,构建起国家、地方、社会共同协作的局面,让全社会能够享受到充分、全面、便捷的数据服务。在数据采集与分析过程中,要遵循透明而负责任的算法原则,高标准的信用义务,以及保护弱势群体的责任,避免出现数据不公与算法歧视。
数据效率观(data efficiency)。知识产权进行数据治理的目的就是通过数据赋能,用数据说话的形式,提高决策的科学性与管理的高效性。因此,效率观是知识产权数据治理的应有之意。针对知识产权数据碎片化较重的现象,应该通过知识产权数据开放共享与高效配置,有效增加涵盖创造、运用、保护、管理、服务各环节的数据供给,推动各方协作,实现知识产权业务、政务与信息服务一体化建设,打通知识产权全链条,降低数据加工使用的资金与成本,助力社会公众与创新创业主体提高创新效率,加速创新成果的产业化进程,充分释放数据生产力,为创新发展增添新动能。数据效率观尤其体现在网络平台知识产权侵权审查义务的认定当中。由于平台每天需要处理海量的数据,因此要合理确定平台的责任,既不过高(过高可能会降低平台治理效率,抑制平台活力),也不过低(过低将放大与滋生各种问题)。
数据安全观(data safety)。知识产权数据治理中,不仅要注重数据的正义观、效率观,同时还要注重数据的安全观,正确处理好数据产权归属与数据安全之间的平衡。因此,知识产权的数据治理不仅要防止数据泄露、黑客入侵等知识产权数据安全的管理,更是指要以高效的知识产权数据治理为国家科技创新活动的信息安全提供保障。通过构建自主可控知识产权数据库与安全防护体系,在确保信息安全的前提下为科研创新提供知识产权信息与检索、分析工具,提升科技创新中的信息检索与利用效率,支撑创新主体在关键技术领域与卡脖子技术领域中的科技攻关,把握发展与安全的主动权,避免核心关键技术受制于人。
(二)构建更合理的知识产权数据治理架构
随着数据成为重要的生产要素,数据空间的活动秩序将由代码来设定和维护。莱斯格认为,网络数字空间的治理主要依赖法律、社会规范、市场与代码4种手段(劳伦斯·莱斯格,2009)。知识产权数据治理也必须利用好这4种力量,兼顾技术路线与法律规制并重的策略,构建一个更加合理的治理架构。这一治理架构可从技术支撑与运行机制等层面来考察。
从技术层面看,通过网络、专线等方式,构建起基础设施层、数据资源层、应用支撑层、业务应用层、用户访问层等不同层级在内的知识产权数据资料与交换通道,建设知识产权概要数据库、侵权判定信息数据库、重点产品与服务数据库及相关市场主体数据库,通过侵权假冒线索智能监测与取证、存证系统,建立起知识产权侵权假冒线索在线识别、实时监测、源头追溯、维权指导管理在内的线上线下快速协查的技术支撑体系。
从运行机制看,要建立不同部门与机构之间、不同层级之间的侵权假冒线索监测启动与推送机制、信息共享机制。充分利用知识产权审查机构、公安执法机构以及司法审判机构在侵权判定方面的专业技能,建立起智能监测与人工判断的信息交互机制。建立知识产权授权、产品销售、维权救济各环节电子化标识与信息追踪的数据管理机制。建立以国家发展改革或网信管理机构为核心,以知识产权基础数据、经济、科技、财税、金融等方面数据相互关联的国家知识产权数据中心。建立知识产权数据服务统筹机制,推动地方知识产权数据中心、服务平台互联共享、覆盖广泛、层级合理、功能强大、服务规范的知识产权数据服务体系。
从治理重点来看,针对知识产权数据来源的部门与口径较多的情况,应当统一知识产权数据的管理格式与规范,进行标准化管理,确保各类数据有效地汇聚、整合与关联。加大对网络平台的治理力度,合理界定平台责任。在适当的时机建立算法审计制度,促进知识产权治理中的算法向善。深入研究数据产权的法律属性,尽快建立明晰的数据产权制度,将数据产权纳入知识产权大的保护框架。尽快破解作品版权自动取得制度带来的问题,在恰当的时机以适当的方式建立起版权作品审核制度,弥补在先作品、版权保护范围等数据库建设严重不足的弊端。选择特定省份、城市与单位,以及信息易溯、社会关注度高的电子商务、大型展会、进出口环节等领域作为试点,实现技术手段与治理机制相融合,探索案件信息在线移送、专家在线咨询、结果在线反馈的线上线下协同监管机制。
(三)建立健全的知识产权数据供给制度
知识产权治理的不同阶段、不同环节,包括申请审批、市场监测、侵权认定、技术路线确定等,都需要相应的数据予以支持。但是,这一数据支持在很大程度上受制于一国知识产权基础数据供给。当前,国家主要的知识产权机构,包括知识产权审批机构与审判机构,都提供了大量、丰富的知识产权基础数据。虽然知识产权基础数据数量上看似较多,但开放的口径与范围还需扩大。实际上,目前世界各国都出现扩大知识产权基础数据供给的趋向。在新近发布的国家知识产权强国纲要与十四五规划中,也明确提出了要加强资源供给,全面开放知识产权基础数据。因此,要进一步扩大基础数据的供给途径与范围,在确保数据安全的基础上,全面开放知识产权基础数据,实现基础数据的“应开放尽开放”。
进一步完善知识产权数据交换机制。通过对接国家统一政务服务平台,国家“互联网+”监管系统及企业信用信息公示系统,与相关部委加强数据共享与业务协同,扩大经济、信贷、税务、海关、法院等机构之间的知识产权政务类,以及经济、科技、法律类数据的交换,同时又要促进世界各大知识产权局及WIPO之间进行的知识产权基础数据的交换。
进一步完善知识产权数据的推送机制。知识产权数据的推送主要是知识产权审批、裁判、执法这些数据生产系统定期产生的数据的推送,包括全球专利、商标、版权登记、地理标志、集成电路布图设计、植物新品种等知识产权数据在内的知识产权业务数据、登记簿数据等数据的推送。
进一步完善知识产权裁判文书数据的供给形式。最高人民法院通过中国裁判文书网提供知识产权裁判文书的全文数据,并根据案由、案号、案件名称、法院、审判员、当事人、律师等关键词提供检索端口。但是,这一数据的公开还存在着一些不足,例如无法批量下载、版权数据积累、裁判文书分析系统欠缺等,需进一步予以完善。
建立起权威的知识产权调查统计制度。相比于相对丰富的知识产权基础数据,与知识产权运行有关的经济数据供给明显不足。目前,国家机构掌握的知识产权经济数据处于分散割裂的状态,亟需建立一套权威的知识产权统计调查制度,改变这种“数据割据”的现象。此外,随着传感器、视频监控等智能设备与网络平台自动抓取等数据捕获技术的发展,也需要一套权威的知识产权统计调查制度来对数据捕获行为的属性予以明确与规范。因此,国家知识产权保护和运用的“十四五”规划也提出要尽快建立知识产权统计调查制度。
(四)推动并扩大知识产权数据的国际合作
虽然目前全球范围内大多数司法管辖区原则上都允许数据的跨境流动,但是大多又会以国家安全、个人隐私保护、数据本地化要求等理由附加某种措施限制。随着数字经济的发展,数据的跨境流动已经成为推动国际贸易中货物、服务、人才、资金流动的重要组成部分。各国纷纷开展数据跨境流动方面的合作,例如CPTPP就强调了数据必须伴随商品与服务的自由流动而流动。知识产权数据作为国际数据合作的重要组成部分,不仅是国际技术、商品与服务能否顺利跨境流通的基本条件,同时也是国际知识产权的规则制定、审查审批,以及执法司法合作的前提保障。知识产权数据的国际合作既包括国家知识产权机构间及与WIPO之间知识产权基础数据的交流合作,也包括与其他国家以及世界海关组织、世界贸易组织、世界刑警组织、世界卫生组织、国际标准化组织等国际机构在与知识产权有关的经济、贸易、信贷、税务、边境执法等方面数据的交流合作。
较长一段时间来,我国大力推动知识产权的国际合作,积极参与知识产权国际规则的制定。从2007年开始,美中欧日韩五大知识产权局开展审查业务合作,构建“专利审查高速公路”(PPH)。这实际上就是一个以知识产权数据合作、共享为基础的加快审查合作机制。此外,随着IP5、TM5、PCT等合作项目的发展,全球主要的知识产权审查机构在知识产权数据交换、共享方面已经有了较好的合作基础。根据知识产权中美欧日韩五局间国际协议,中国将进一步扩大专利数据的开放范围。根据与EPO签署项目协议,我国也首次实现商标数据的国际交换。我国国民经济和社会发展的“十四五”规划在第五章建设数字中国部分提出了要营造良好数字生态,积极推动数字和网络空间国际规则制定,构建网络空间命运共同体。新近发布的国家知识产权强国建设纲要提出要加强与各国知识产权审查机构合作,推动审查信息共享。知识产权十四五规划提出要积极研究与参与数字领域等新领域新业态知识产权国际规则与标准的制定。我国也正式提出申请加入《数字经济伙伴关系协定》(DEPA)。这些都要求我们有计划、有步骤地进一步推动并扩大知识产权数据的国际合作。
五、结语
在一国所有的财产权制度中,知识产权是较早使用电子化、数据化手段来进行治理的领域,因此成为国家治理体系中的一个新的、重要的场景。数据化进程给知识产权的治理结构和治理模式带来了较大变化。知识产权数据治理就是用数据技术将现实世界中知识产权的运行投射到数字空间中,将背后的隐藏信息提取出来,尽可能准确地刻画知识产权的运行规律,为知识产权政策决策与行为规范提供数据支持,以提升知识产权治理的能力与效率。在知识产权数据治理的建构过程中,还面临着制度数据刻画不足、算法伦理与数据正义、数据产权的法律属性以及数据平台行为规制等障碍与挑战。要实现知识产权领域良好的数据治理,不仅需要信息采集、处理、分析与应用等技术的赋能,更需要从理念、制度、组织、法律、伦理等多维度的协同支撑与规范制约。要立足于数据时代的客观要求,在知识产权数据治理中确立新型价值观。要构建更加合理的知识产权数据治理架构,建立全面的知识产权数据调查统计制度,加大知识产权数据的国际合作,扩大知识产权数据供给,形成对知识产权制度更精确的数据画像,以推动知识产权治理体系的完善与治理能力的提升。