其他
原文刊载于《版权理论与实务》2023年第4期,原标题为《著作权侵权认定视角下“海量”内容的比对方法——以导航电子地图为例兼顾其他场景》,转载请注明出处。文章注释从略,完整原文请见《版权理论与实务》纸质版。【扫描下方二维码即可订阅2023年全年《版权理论与实务》杂志。欢迎订阅!欢迎投稿!】【朱晓宇丨北京嘉观律师事务所律师】【内容提要】涉及“海量”内容的著作权侵权纠纷,通过鉴定对全量数据进行比对存在技术、时间和费用等多方面困难;暗记比对在图形作品、美术作品等领域不可靠;法庭和当事人迫切需要可行的“全面”而非“全量”的比对方法。笔者通过对“海量地图数据”比对的思考和实测,提出适合权利人初步举证的全面抽样“勘察”思路,以及适合被告抗辩和法庭调查的全面抽样比对方案。“无歧视概率比较法”符合统计学原理,比对结果具有一定科学性,且思路可以灵活拓展、移植到“海量”图片、音乐、视频、文章、词条、评论等场景,有效解决人工比对需求,有利于原被告双方展开诉争抗辩,有助于法庭推进庭审调查。【关键词】著作权;海量内容;比对方法;全面比对;抽样比对近年来,从“海量图片”“海量音乐”“海量视频”“海量文章”“海量词条”“海量评论”……到备受关注的某导航电子地图数据供应商诉“某地图”未经许可使用其“海量地图数据”[1](简称“地图数据案”),法庭在著作权侵权纠纷或不正当竞争纠纷中,不断面对权利人针对“海量”内容主张权利的考验。部分判决书往往止步于“大量”或“少量”的主观评判,缺少从“定量”到“定性”的可靠论证,在判赔层面也缺乏从“定性”再到“定量”的精细裁量。法庭认定有否使用权利人界定的“海量”内容,在遵从“实事求是”原则的基础上,必然存在着“全量”使用和“没有”使用两种极端可能,以及从0.01%到99.99%区间“部分”使用的可能。权利人如何证明被诉对象“全量”使用或“大比例”使用;被诉对象如何反驳证明“没有”使用或“小比例”使用,以及针对“大比例”或“小比例”尽可能精准的论证,是摆在法庭和当事人面前的重要课题。笔者有幸全程参与“地图数据案”二审阶段,[2]在委托人法务团队和技术团队的全力支持下,对涉案“海量地图数据”的比对方法进行了深入思考和多轮实测,向二审法庭提供了可行的比对方案,能够有效解决“海量地图数据”的全面比对问题。该比对方案的思路可以拓展、移植到“海量”的图片、音乐、视频、文章、词条、评论等场景,有效解决人工比对需求,也可作为计算机比对程序设计的逻辑模型,对海量内容在更大基数和范围内开展机器选样和比对。本文将介绍针对“海量”内容在争议范围内进行全面比对的需求和意义,以及针对“海量地图数据”设计的比对方案,并将思路拓展应用至其他场景,为涉及“海量”内容的争议提供可行的比对思路,供有机会面对此类场景的法官、律师和学者们参考、验证,并期待读者们进一步的指正和完善。一、导航电子地图中的海量数据(一)导航电子地图数据是复杂版权客体导航电子地图的“数据包”,通常包括国界、省界、市县区界、道路、铁路、公交线、水系、绿地、模式图、实景图、市街图、语音等数据,还有数以亿万计的兴趣点(POI)、红绿灯、车站等信息,以及相关规格说明书等各类文档。这些数据中,除了道路等需要通过识图软件读取并显示出来的“点、线、面”数据外,还有大量以独立的文件夹和独立文件形式存在的其他数据,例如,绿地、水系、模式图、实景图、市街图等“图形”类内容,用户协议、规格说明书等“文字”类内容,公交线、POI等“文字”类信息,关联文件等“软件”类内容,大量录制好的语音等“音频”类内容。这些数据按文件夹分类存储,在使用过程中按用户发出的使用指令,被识图软件或导航软件读取和调用,并分层叠加显示。相对于传统地图、电子化地图,导航电子地图“数据包”不再是单一维度的图形作品,而是涉及软件作品、文字作品、美术作品、图形作品、汇编作品、数据库和一般数据等多维度客体的“集合类”作品。[3]“数据包”中,众多线条连接的整个“瓦片”路网,亦或是乡、县、市、省乃至全国的连片路网,基于线条的选择、组合、链接、整体视觉差异等因素,可能构成“图形作品”;绿地、水系等每一个“形状图”及所在图层的众多“形状图”组合,基于在绘制过程中的取舍、整体视觉差异等因素,也可能构成“美术作品”或“图形作品”;“模式图”属于“数据包”中多个独立的视图文件,在导航过程中遇到相应路口时被选择调用。每一个“模式图”的内容包括绘制的天空、绿地、道路及相应的颜色选择,基于其绘制过程中的构图、线条、颜色等方面的差异,可能构成“美术作品”;POI、红绿灯、限速牌等信息则是“数据包”中数量最多的信息集合。包含这些信息的文件夹可能构成“数据库”,其编排方案、调用模式等技术细节都可能成为著作权法、专利法或竞争法保护的对象。另外,用户协议、说明书等文档,提前录制好的“前方路口向右转”“驶入辅路”等音频文件都可能构成著作权法保护的文字作品、录音制品。[4](二)路网“图形作品”下的海量内容在类型多样、体量庞大的导航电子地图“数据包”中,仅以最直观、侵权争议多发的路网“数据”为例,在针对路网“数据”的著作权纠纷中,就不可避免的涉及海量内容的界定和比对。结合既往案例和行业调研,导航电子地图“数据包”中的路网“数据”通常以省级行政区划作为文件夹分类单元,实际存储和下载数据又以地级市行政区划为独立的文件单元。结合我国当前有330余个地级行政区划考虑,如果路网“数据”构成图形作品,整个中国境内的路网“数据”则是330余个独立图形作品单元组合而成的图形作品集合。仅就我国疆域,导航电子地图需要覆盖960多万平方公里的面积。导航电子地图显然不是在960多万平方公里的幅面上一蹴绘就,也不是在一个地级区划幅面上直接绘制的。根据行业通识,导航电子地图是由一个个“图幅”组成,地图行业内称之为“瓦片”。每一个“瓦片”的幅面是“10公里×10公里”(即100平方公里)。按此标准,仅我国疆域就涉及多于9.6万张“瓦片”。权利人在取证过程中,往往要对其认为构成近似的路网进行“截图”比对。如果以“截图”作为图形作品的构成单元,考虑到“截图”画面远远小于一个“瓦片”的情况,以每个“截图”约1平方公里计算,仅中华人民共和国疆域就涉及多于960万张“截图”大小的图形作品。二、针对导航电子地图数据的侵权主张和比对需求(一)复杂客体场景下侵权主张的差异面对导航电子地图“数据包”这样的复杂客体,“侵权人”当然可能完整复制并使用“数据包”,也可能按省份、城市、瓦片(10×10公里图幅)等不同幅面的地域范围,复制并使用“数据包”中的一部分数据;还可能只复制“数据包”中道路、行政区划、水系、绿地、POI等某一类或多类数据的全部或部分;也可能在复制全部或部分基础上,对复制内容进行了少量修改或大幅替换,甚至是全量、分步替换后仅存少量遗漏……在如此复杂多变的情况下,权利人在主张权利之前进行调查评估的细致程度,以及采样、取证和比对校验的思路方法,将直接影响其对实际侵权情况的预判。对侵权情况的预判则直接影响对主张权利客体的选择和固定。选择和固定客体是主张权利的第一要务,也是被告抗辩和法庭审理的基础。权利人基于完整“数据包”主张著作权,并主张被告持续使用其完整“数据包”,与基于“数据包”中某一类数据内容(例如,道路、模式图、音频文件)主张著作权,主张被告使用了某一类数据内容中的全部或部分(例如,某省、某市),在举证方法、证明责任转移等方面,存在巨大差别。[5]因此,查清侵权状况并做好取证准备,是准确提出侵权主张、完成初步举证责任并促成证明责任转移至被告的重要前提。(二)针对“海量”内容的比对需求北京知识产权法院在“地图数据案”一审判决(尚未生效)中认定被告全量持续使用原告地图数据,并认为“本案是图形作品著作权侵权纠纷,比对对象是图形作品的表现形式,而非计算机软件代码,应进行人工肉眼比对,而非数据鉴定”“本案不具有比对的基础”“三被告主张进行全面比对,由于电子地图内容过多,全面人工比对不具有可行性和操作性,三被告也未提出原告和本院认可的比对方案。因此本院对三被告提出的鉴定和全面比对的要求不予支持”。[6]据此可知,一审合议庭在认为涉案地图数据没有比对基础、内容过多、人工比对不可行、被告未提出比对方案的情况下,仅基于原告举证的四类、共计二百余处比对点,“推定”了被告全量持续使用原告的地图数据。抛开全面人工比对可不可行的问题,以及法院、原被告谁有责任提出比对方案的问题不论,相对于导航电子地图“数据包”中任何一类“海量”内容,在原告仅举出几十处比对点的情况下,法庭是否应当主动调查并确认,在原告举证的“相同”比对点外,有否不相同的内容?笔者认为,“全量持续使用”的事实需要“随机选择一处比对,即大概率得出相同结论”这样的验证结果支撑。如果原告认可存在“不同”点,或者被告举证存在“不同”点,显然不具备“推定”全量持续使用的基础。在原告主张“海量”内容被全量使用的背景下,如果被告能够举证存在等量的“不同”点,考虑原告和被告均是“随机”选点比对,就已经动摇了“推定”全量使用的基础;如果被告能够举证十倍于原告“相同”点数量的“不同”点,显然可以进一步稀释原告举证“相同”点的推定作用。此情况下,原告没有完成其主张被告全量使用的举证责任,被告当然也没能证明自己从未使用原告某类内容。在数以千万计的内容单元、数以亿计的可比对图形画面背景下,仅靠原告选择出几十处“相同”点,又没有要求原告进一步增加随机选点来验证“处处相同”,就“推定”被告全量持续使用,在事实认定层面明显是草率的;仅凭原告举出100处相同,被告举出100处不同,就“推定”被告使用了原告内容的“50%”,亦或原告举出100处相同,被告举出10处不同,就“推定”被告使用了原告内容的“90%”,则是缺少总量基数前提的逻辑错误(总量是200处?还是960万处?)。因此,在前述场景下,为了进一步查明有否相同及相同比例,迫切需要一种可行的比对方法。(三)通过鉴定对双方全量数据进行比对存在困难在“地图数据案”中,有效固定原告和被告各自使用的全量“数据包”,委托法庭和原被告双方认可的专业机构,对双方“数据包”是否存在相同内容及相同比例进行全面鉴定,在不考虑时间和成本的情况下,只要技术上可行,当然是最有利于查清事实的方式方法。但是,由于地图数据体量的巨大,即使法庭组织双方委托机构进行鉴定,也需要考虑针对数据进行全量、无死角比对的技术可行性,以及所需的时间长短和鉴定费用高低。假设在全面比对技术可行的情况下,针对一个地级行政区划的道路数据进行比对,需要鉴定机构连续工作一个月时间,申请方先行支付10万元费用。如果原告要求针对330余个地级行政区划进行全面比对,这意味着一个鉴定机构要连续工作长达330个月,且申请方先行垫付3300余万元的费用。除非法院同时委托上百家鉴定机构,否则,仅就鉴定时间一个维度,法庭和原被告双方都是无法接受的。(四)暗记比对针对图形作品、美术作品不可行软件、数据库的权利人为了防止软件源代码、数据资源被盗用和复制,通常会在软件源代码编写过程中故意植入不影响软件功能的错误、冗余“字符”,或者在数据资源中埋藏一些不为外人所知的“标记”。因此,针对暗记的举证和比对也是软件侵权纠纷、数据库侵权纠纷中权利人比较常用的方法。针对源代码或数据相同的场景,被告有可能证明使用相同编程工具或采集方法可能产生相同代码或数据的情况,原告进一步举证被告代码或数据中存在被告无法合理解释的相同“暗记”,才具有证明被告代码或数据“复制”自原告的意义。而对于其他类型作品,在满足“接触+相似”的条件下,不需要“暗记”作为证明要素的。图形作品、美术作品的实质性近似认定,更是不能仅依靠个别暗记来推定。针对这类可以通过人工肉眼比较出异同结论的作品类型,受画幅和比例尺影响,需要在固定作品幅面和比例尺后,具体比较构成作品表达方式的线条、形状、颜色、综合画面等内容是否存在相同、近似。举一个夸张的例子,如果两幅图形作品,一个是圆形,一个是三角形,线条、构图完全不同,仅在原告举证的相同定位点上存在两个“黑点”,原告将其主张为“暗记”,即便被告没有合理理由说明为什么在相同位置存在两个完全相同的“黑点”,笔者相信法官也不会因为存在无法合理解释的“暗记”而认定被告图形作品构成侵权。再考虑两幅水墨中国画的情况,原告在其绘就的“山水画”中埋藏了只有用放大镜才能找到的一个人名,被告的一幅同尺寸“人物画”,也在相同位置埋藏了一模一样的人名,原告主张被告作品中存在相同“暗记”,这两幅美术作品能认定抄袭吗?显然不能。针对图形作品、美术作品,即便是直接对在先作品进行修改,如果改大了,改到只剩下暗记相同,那还是复制、抄袭、借鉴吗?显然不是。因此,对于“海量”内容的比对和侵权认定,暗记比对仅是在已经认定内容相同基础上的额外“加分”条件,可以进一步证明“相同”内容来源于原告。三、针对导航电子地图数据的比对方案对于导航电子地图数据这类含有“海量”数据的复杂版权客体,在针对“海量”数据进行全量、无死角比对,在数据基础、技术、时间、费用等方面不可行的情况下,迫切需要一种方法可以针对“海量”数据进行比较“全面”而非“全量”勘察。就像我们探查某地的矿产资源,不用将矿产实际开采出来逐一过秤统计,仅需要进行科学的选点采样并计算得出预估储量(不一定准确,但有一定科学依据),针对导航电子地图数据的“勘察”,也可以参照该思路,设计出比较可靠的评估方法。就导航电子地图数据而言,权利人有必要通过认真的前期“勘察”,来确定被告有否使用数据;仅使用道路数据,还是涉及其他类型数据;使用了全国数据,还是仅涉及个别省市区数据……进而基于“勘察”结果,确定蕴藏何种矿产(主张权利的数据类型,是道路、水系、绿地、模式图)、矿产储量(主张权利的数据范围,是全国、部分省市区、个别地点)、如何开采(主张复制权、信网权、改编权等)、开采预估(索赔金额、合理开支等)。(一)勘察:适合权利人初步举证的全面抽样比对思路在权利人不掌握目标全量“数据包”的情况下,想进行数据层面的全量、无死角比对是不可能的。但是,针对使用目标导航电子地图数据的产品,进行符合统计学原理的抽样比对则是可行的。权利人有必要基于其怀疑目标使用其数据的类型、范围进行比较细致、全面的“勘察”。通过勘察结果夯实或者消减对于侵权情况的怀疑。就导航电子地图数据而言,“勘察”涉及数据类型和地域范围两个并行维度。首先“勘察”数据类型。权利人的全量“数据包”通常包括:国省市县区划界、道路、铁路、公交线、水系、绿地、模式图、实景图、市街图、语音等数据类型。权利人可以根据怀疑点和相关线索,在排除无权利的数据类型(国家标准、采购自其他来源等)后,从其最有价值、最有把握的数据类型查起。例如,通过少量的随机选点,核查道路是否有完全相同(重合)的地点。第一轮勘察结果可能是“处处相同”“部分相同”“没有相同”。根据不同的结果,尤其是“处处相同”和“没有相同”两个极端结果,有必要增加选点量再行核验测试,初步保障“处处相同”和“没有相同”两个极端结果的可靠性。在“勘察”道路数据后,可按相同的方式初步核查其他类型的数据。其次“勘察”地域范围。针对某一得出“处处相同”“部分相同”结论的数据类型,权利人的选点应该覆盖34个省级区域。如果针对每个省区选点都能够得出“处处相同”的结论,在增加一轮选点后,仍没有推翻“处处相同”的结论,则可以初步推断目标产品全量使用了权利人数据;如果部分省区出现“没有相同”的结论,则需要针对该省区专门增加选点,以核查该省区是“部分相同”,亦或经过多轮验证后坐实“没有相同”。在勘察基础上,可以初步判断目标导航电子地图数据,是全量使用权利人“数据包”中的各类型数据,还是仅使用部分类型数据;是使用全国范围内的数据,还是仅涉及部分省市区。当然,对于指示路口样态的“模式图”、导航中各类提示语音并不涉及地域的维度。根据“谁主张,谁举证”的基本原则,权利人如果主张目标使用了其全部或部分导航电子地图数据,有义务加以证明。如果权利人通过勘察结论确信目标使用了其导航电子地图数据,则应该根据勘察结论,设计恰当的取证方案,进而证明其“处处相同”或者“部分相同”的主张。在此基础上,权利人主张目标使用某一类数据,其取证至少要覆盖该类数据。权利人主张目标使用其全部数据类型,却仅针对部分数据类型取证的,不能推定目标使用了未取证的数据类型;权利人针对某一数据类型,主张目标使用其全国数据,却仅针对部分省区选点取证的,也不能推定目标使用了未取证的其他省区数据。权利人基于勘察结论设计的取证方案,在能够全面、恰当地覆盖其主张权利的数据类型和地域覆盖的情况下,有助于权利人完成初步的举证责任。而没有统计学依据和科学方法的“随机”选点,很容易被反证稀释,不足以推定“海量”数据相同,从而导致权利人没有尽到举证责任。(二)适合被告抗辩和法庭调查的全面抽样比对设计如前所述,导航电子地图涉及“海量”数据,少量举例方式不能解决定性和定量问题。即便是法庭主持或第三方鉴定机构进行的随机抽样,结果不利的一方都会就“随机”提出质疑,不认可人工的随机方案或是软件的随机机制。原告起诉时证明“相同”的对比点,被告不认可“随机”。被告抗辩时证明“不同”的对比点,原告不认可“随机”。在被告提出的“不同”点稀释了原告举证的“相同”点的情况下,迫切需要一种对原被告双方均公平且有效率的全面“抽样比对”方法。在“地图数据案”二审阶段,笔者向法庭建议一种迫使双方被动抽样且具有较强对抗性的比对方法,暂命名为“无歧视概率比较法”。笔者认为,“抽样比对”不应该是一方按有利于己方结果的“挑拣”。双方均应该在法庭主持下,按照无歧视的标准,坚持不规避的原则,遵循固定的逻辑,进行公平的选样和比对,从而解决定性和定量的需求。“无歧视概率比较法”的具体操作方案如下:(1)【固定比对内容】针对大画幅单一图形作品和小画幅海量图形作品。(2)【提出选样标准】各方提出各自的选样标准,在已经固定的比对内容中选样,不挑拣,不回避。结合导航电子地图特点,原告、被告、法庭均可以提出多个具体的选样标准。例如:以省会命名的火车站(31个);以省级行政区命名的大学(30个—无“陕西大学”);各省车牌B城市的电视台(31个);各省车牌C城市的市政府(31个);各省车牌D城市的图书馆(31个);各省车牌E城市的中级法院(31个);各省车牌F城市的火车站(31个);各省车牌G城市的第一中学(31个);各省车牌H城市的人民医院(31个);各省车牌J城市的中国移动分公司(31个)。(3)【选样标准的数量和抽取样本的数量】结合比对内容的特点、总数等情况,由双方协商并由法庭决定首轮提出的选样标准的数量和抽取样本的数量。法庭、原告、被告可分别提出N个(例如,5个)选样方案,总计3×N个(例如,15个)选样方案。各方基于选样方案查找到具体的比对点,进行近似判断。(4)【进行比对】原被告双方按专业常识或法庭指导的认定标准,就各自选样的内容进行比对,得出比对结论,并交付对方核验。各方就比对结论意见不一致的,法庭综合各方意见,给出比对结论。(5)【结果统计】基于法庭认可的结论,就每一组样本中,目标结论数量(例如,构成实质性相似的条数)占该组选样总数量的百分比进行统计,得出结果百分比;再综合各组下的结果百分比,计算平均百分比,作为该轮比对的综合结果。例如,第一组80%、第二组90%……第十组80%、第十一组90%、第十二组85%,经计算12组平均值,得出综合结果为85%。(6)【增加选样和停止选样】如果一方对首轮综合结果不认可(不满意),并主张增加选样标准或样本数量后,综合结果可能变化,各方应当在选样方案的边界内再提出与首轮数量相同的选样标准,并据此补充选出样本。如果后续轮次比对得出的综合结果与前续轮次比对的综合结果差距不大,则停止比对,并将各轮次综合结果的平均值作为贴近事实的比对结论。如果后续轮次比对得出的综合结果与前续轮次比对的综合结果均有较大差距,则应当再行考虑增加选样标准和选样数量,补充比对。(7)【比对效果】相对于通过鉴定进行“全量、无死角比对”,前述被动对抗性抽样比对,在“处处相同”和“没有相同”两个极端结果以外,就“部分相同”情况不能保证呈现出绝对的客观真实情况,但可以保障抽样的公平性,且随着选样方案的增加,逐步接近客观真实情况。笔者在“地图数据案”二审阶段,基于前述“无歧视概率比较法”,向法庭提交了11组共计330余选点比对。被告可以充分利用该比较方法针对原告“全量使用”的主张进行抗辩,法庭也可以利用该比较方法就原告主张被告使用其某一类地图数据的情况,基于相对公平的选样,得出符合统计学原理的计算结果,进而得出争议数据内容“整体(100%)近似、大比例(30%—99%)近似、小比例(1%—29%)近似、不近似(0%)”的结论。四、“无歧视概率比较法”在其他场景的应用除“地图数据案”二审阶段首次应用了“无歧视概率比较法”外,笔者尝试将该方法应用到其他涉及“海量”内容比对的场景(例如,海量词条、海量图片等),同样可以将其作为原告举证、被告抗辩和法庭调查的引导思路和比对方法。(一)针对“海量”词条比对的应用在一起涉及数十万“词条”近似比对的案件中,笔者作为一方当事人聘请的独立专家,再次应用了“无歧视概率比较法”,向法庭提交了“词条”内容查验和比对方法的建议。“词条”内容及其保存形式,与导航电子地图数据差异很大,但仍可以延续“无歧视概率比较法”的思路,提炼选样方案。首先,原告取证保全的“词条”内容以电子文件形式保存在特定的文件夹中。经查验可以发现,电子文件至少存在名称、修改日期、大小三个信息维度,可通过计算机进行快速排序,并可以快速查找定位的具体文件(示例如下表)。词条数量1,234,567个名称(首字母音序)符号、A-Z修改日期(生成时间起止)2021年7月16日11:062021年7月17日13:27大小(文件大小起止)21KB到237KB其次,笔者基于上述信息维度进一步提炼针对“词条”的选样方案:(1)【名称排序】即词条按名称正序或倒序排列后,在起始为符号或首字音序从A到Z的全部词条中,选择任意符号或音序的第N个词条。例如,首字音序为Y词条中的第7个词条;如果首字音序没有Y,则顺延至下一个音序(Z);如果词条数量不足的,选择该音序最后一个词条(首字音序为Y词条只有5个,则选择第5个)。(2)【生成时间排序】即词条按修改日期正序或倒序排列后,在最早生成时间到最末生成时间内,选择任意生成时间的第N个词条。例如,选择2021年7月16日21:07分生成词条中第7个词条;如果没有指定的时间点,则顺延至下一个临近且有文件生成的时间点;如果词条数量不足的,选择该时间点排序的最后一个词条。(3)【大小排序】即词条按大小正序或倒序排列后,在最小数值到最大数值内,选择任意数值的第N个词条。例如,选择文件大小100K的第7个词条;如果没有指定的大小,则增大(或减小)至下一个临近且有词条的文件大小数值;如果词条数量不足的,选择该文件大小词条中最后一个词条。选样方案示例如下:[1]正序排列:首字音序为B词条中的第5个词条;[2]正序排列:首字音序为D词条中的第6个词条;[3]倒序排列:首字音序为F词条中的第7个词条;[4]正序排列:(结合起止时间)XX年X月XX日XX分生成的第3个词条;[5]正序排列:(结合起止时间)XX年X月XX日XX+1分生成的第6个词条;[6]正序排列:(结合起止时间)XX年X月XX日XX+2分生成的第9个词条;[7]正序排列:(结合大小区间)XXKB的第1个词条;[8]正序排列:(结合大小区间)XX+10KB的第2个词条;[9]倒序排列:(结合大小区间)XX+20KB的第3个词条。原被告双方、法庭可在前述方案内,提出任意选样标准,据此选定比对样本,再进行比对和结果统计。最后,基于选样比对,分组统计比对结论,进一步计算出平均结论,作为双方词条近似数量在统计学意义上的参考结论。原告可以据此提出诉讼请求,被告可以据此提出抗辩主张,法庭也可以取得做出裁判所需的“定量”参考。(二)图库、曲库、文库等其他场景结合“无歧视概率比较法”在“海量”地图数据和“海量”词条对比场景下的应用经验,笔者进一步思考,该比对方法的思路也可以灵活地应用到“海量图片”“海量音乐”“海量视频”“海量文章”“海量评论”等有比对需求的场景。原被告双方和法庭都可以结合涉案客体的类型、存储和查找条件、数据体量等因素,设计合理的选样方案,针对“海量”内容进行全面的选样比对。针对涉及“海量”内容的图库、曲库、文库等场景,原被告和法庭均可以考虑涉案图片、音乐、文章的特点,灵活地设置和建议选样方案。例如,按拍摄对象(花、鸟、鱼、虫、人物、建筑……)设计,按作品、作者名称分类,按作品风格、流派、类型等考虑,按国籍、地区、省份划分,按文件大小、年代时间等维度排序,等等。综上,“无歧视概率比较法”可以在“海量”内容比对场景下成为法庭推进庭审调查,以及原被告双方展开诉争抗辩的工具。有效利用“无歧视概率比较法”的思路,原告可以完成初步的“全面”举证,据此提出可靠的诉请主张;被告则可以有针对性地进行抗辩和举证,配合法庭逐步查清事实。更有意义的是,类似导航电子地图数据、大型图片库等高价值版权集合的权利人,在拟提起维权诉讼之前,可以依据“无歧视概率比较法”提供的思路和方法,进行比较可靠的前期“勘察”,据此制定妥当的取证计划,进而提出相对准确的诉请主张,并在庭审初期完成举证责任,将反驳证明责任稳定地转移至被告。通常情况下,涉及“海量”内容的高价值版权集合的权利人,应当具备强大的技术团队和专业的法务团队。权利人在提出维权主张之前,有能力对维权目标及其行为进行比较细致、全面的调查评估,也有必要、有责任向法庭如实陈述其调查了解到的实际情况。仅凭少量相同主张就维权目标“全量”使用是不负责任。在涉及“海量”内容比对的场景下,笔者建议权利人尝试应用“无歧视概率比较法”的思路和方法,作为夯实或消减“侵权怀疑”的工具,通过科学的前期“勘察”确认侵权状况和维权需求,较为准确地提出维权主张,避免因为前期判断失准而浪费巨额的维权成本和宝贵的司法资源。同时,也建议被告积极应用“无歧视概率比较法”,以实事求是的态度,积极提出选样方案,认真配合比对工作,助力法庭查清事实、高效裁判。原文刊载于《版权理论与实务》2023年第4期,原标题为《著作权侵权认定视角下“海量”内容的比对方法——以导航电子地图为例兼顾其他场景》,转载请注明出处。文章注释从略,完整原文请见《版权理论与实务》纸质版。【扫描下方二维码即可订阅2023年全年《版权理论与实务》杂志。欢迎订阅!欢迎投稿!】【往期精彩内容】