其他

专家 | 彭辉:大数据时代数字出版的版权保护研究

2017-10-20 彭辉 网络空间治理创新

点击上方“网络空间治理创新”可以订阅哦


引言

当前,以数据挖掘和数据应用为目的的大数据时代已经来临。在大数据背景下,数字出版的版权保护面临良好发展机遇,同时也面临更为严峻的挑战。在大数据时代数字出版传播过程中,各阶段版权的核心内容各有侧重,在信息采集阶段,应引进默示许可制度以应对网络海量授权;在数据管理阶段,数据库应被整体纳入版权的保护范围;在数据运用分析阶段,应遵循个人信息条款的“告知与许可”规则;在数据传播阶段,应加强深度链接行为的法律规制。



问题的提出


从2012年至今,“大数据”一词成了各界讨论的话题,随着智能手机、电脑以及各类智能产品的普及,逐渐拉开了“大数据”时代的序幕。“大数据”虽然未有统一公认的概念,但是其海量性(Volume)、多样性(Variety)、高速性(Velocity)、价值性(Value)等特点是显而易见的。基于上述特点使得大数据对各行各业的影响日益凸显,在数字出版领域,其运作模式表现为互联网信息服务提供者将自己创作或他人创作的作品经过选择和编辑加工,登载在互联网上或者通过互联网发送到用户端,供公众浏览、阅读、使用或者下载的在线传播行为。在目前阶段,数字出版的形式不仅包括书籍、杂志、报纸等传统出版物的网络版,还包括网络新闻、各网站的网络服务信息等内容。


而现代信息技术的发展和互联网的普遍使用使得每个人于何时、何地、做了何事都在网络中形成记录,这些记录共同构成大数据的基础信息,网络技术与服务提供商可以利用这些数据分析得出其所需的有用信息,例如消费者偏好。以盛大文学为例,在其举办的国内首届网络文学游戏版权拍卖会上,一共拍出了6部作品的“手游”改编版权,累计拍卖价格达到2800万元,单件作品版权费最高则达到810 万元。盛大文学商业模式取得成功的关键在于大数据运用:在销售每一个版权作品的背后,都已经对该版权作品相关的数据,例如小说受众是什么年龄层次、购买力如何、消费行为有何规律等进行了提炼和分析。厂商可以利用这些数据为玩家量身打造游戏、为观众制作影视剧,进而为非知名版权作品提高价值、开拓市场。


从这个角度而言,大数据技术手段的利用可以产生许多有益效果,但同时,其也是一把双刃剑,例如,引发了不少版权问题。本来,信息技术的发展与互联网的普及就导致了新旧媒体的利益失衡,大数据时代这种失衡进一步加剧。因此,如何在大数据时代构建版权内容提供商、数字出版商、版权消费者与社会公众的版权利益均衡体系,这是无法回避亟待解决的新问题和挑战。


大数据对于数字出版的影响


(一)大数据对于数字出版的积极作用


大数据时代是在网络时代、信息时代的基础上发展而来。在大数据时代,信息高度个性化是一种最明显的特征,信息是针对个体的要求,经过数据采集、存储、传输、分析的过程,由大数据的运算模式专门配送的个性化的数据信息。例如,在网络时代,我们如果想要阅读某一作者的作品,可能要借助于搜索引擎进行搜索,网页返回的可能是所有关于搜索内容的网页内容,然后我们还要进行人工筛选进行选择,因为这些返回的网页是通过网络爬虫抓取的所有关于搜索词条的结果,这些结果按照一定的规则进行排列,但很多网页并不是你想要的。


在大数据时代,搜索返回的结果可能就是更加具有针对性的内容,某一作者的作品就会只包括他的作品,不会再有相关评论的网页、销售的网页、科幻迷们的网页等等。你可以只在他的作品中选择喜欢的进行阅读,这样作品的传播更加有针对性、传播速度更快。从这个层面上讲,作品的传播效率更高,对于版权的促进作用更加明显而有效。


(二)大数据对于数字出版的潜在挑战


联合国发布的《大数据促发展:挑战与机遇》白皮书预测,2017 年,全球大数据市场收入将达到500亿美元。中国市场情报中心有关统计显示,到2018年,中国大数据市场规模将达到463.4亿元。在市场茁壮成长的同时,大数据相关纠纷也层出不穷。问题的根源在于,在互联网时代,随着海量信息的到来,几乎每家网站都积累了大量的大数据信息。这些大数据主要是互联网平台在提供服务的过程中沉淀下来的数据,包括用户的个人数据,以及一些可以与大众分析的个人资料等。这些信息很容易被其他网站抓取。


北京搜狐互联网信息服务有限公司法务经理马晓明对此也深感无奈:“我们APP上,娱乐新闻的内容被第三方网站未经授权转载,转载的同时,客户端底下的用户评论也一并被抓取了。这些评论被实时抓取,并且是一个不断扩充的过程。”北京市海淀区人民法院中关村法庭和中国互联网协会调解中心联合发布的《大数据与知识产权司法保护的现状及展望调研报告》公布的数据就显示,在国内,大数据与司法实践相关案件当中,涉及版权的为23%。



分析框架设计


我们认为,在大数据时代数字出版传播过程中, 各阶段版权的核心内容分别围绕着阶段Ⅰ(信息采集),阶段Ⅱ(数据管理),阶段Ⅲ(运用分析)及阶段Ⅳ(数据传播)展开,并相应地表现为数据采集与预处理、数据存储和管理、数据处理和安全、数据成果及运用等不同形态。然而,从版权的角度来看,这一价值链形成同时也是由版权创造到版权开发、版权管理及版权消费的过程。因此,版权保护不仅应贯穿于整个数字出版传播链的始终,而且针对各阶段的不同活动特点,所采取的版权保护重点也应有所差异和侧重。


图1 大数据时代数字出版价值链各阶段版权保护重点


(一)第一阶段:信息采集与预处理的版权保护


出版商的数据服务会利用大数据分析的手段对用户的行为进行追踪与分析,在用户偏好的基础之上向其提供其心目中的“产品”。与传统搜索引擎不同的是,数据服务商并不需要用户提供关键词进行检索,出版商的客户端会根据客户需求主动提供版权作品内容的链接。如果将其定性为搜索引擎,而搜索引擎是互联网的生命,其行为应被鼓励;而如果将其定位为网络内容提供商,其想要提供经过“二次加工”的数字出版内容,如果该数字出版构成可版权性的作品,便需要经过版权内容提供商的许可,否则将构成版权侵权行为。


思想表达两分法是版权法的基本原则,意指版权法保护的是思想的表达,而并非思想本身。作者的创作成果受版权法保护,而信息则应当自由传播。对于出版商数据服务抓取对象而言,在我国版权法中,与出版有关的法律术语基本有三类:时事新闻、时事性文章及版权作品三类。时事新闻不属于版权法保护的对象;时事性文章虽然属于版权作品,但应属合理使用的范畴;具有原创性的作品应受版权法保护。因此,如果出版商数据服务客户端抓取并呈现的是时事新闻与时事性文章,应属合法行为;反之,如果其所抓取并呈现的是具有原创性的作品,则有侵犯版权的嫌疑,其抓取行为有可能构成版权侵权或不正当竞争行为。


为保障社会公众接触信息与咨询,促进新闻传播固然重要,然而,如果欠缺新闻内容的生产者,仅存空壳媒体,便没有内容可以传播。因此,保护原创、保护新闻内容的生产者的合法利益是保障社会公众获取新闻资讯的大前提。实践中,传统媒体便扮演了版权内容生产的角色,即使是网络新闻内容提供商提供的新闻服务,例如,新浪新闻,也必须建立在新闻生产的基础之上。网络技术的发展促进了新兴媒体的出现,加速了新闻资讯的传播速度;大数据分析的出现,又提升了新闻咨询传播的质量,出现了个性化的新闻内容服务。这对社会公众来说,确实是件好事。然而,即使是再为个性化的服务,也应该以尊重与保护版权内容提供者的合法利益为前提。


(二)第二阶段:数据存储和管理的版权保护


在完成信息采集与预处理之后,就涉及数据存储和管理,数字版权出版商的数据存储和管理的前提是构建数据库,数据库,也称为信息集合体,是指由有序排列的作品、数据或其他材料组成的,且能以电子或非电子方式单独访问的集合体。数据库有传统数据库和电子数据库两类型。数据库具有集合性、有序性、可访问性以及信息容量的庞大性等特征。《欧盟数据库指令》的第一条第二款规定:“数据库是指按系统或有序安排, 并可通过电子的或其他手段单独加以访问的独立作品、数据或其他材料的集合。”


只要数据库的内容选择或编排构成智力创作,即受到版权保护,但这种保护是以独创性为前提,也恰是数据库版权保护取舍两难的症结。在传统技术条件下,非作品的数据收集数量不可能很大,传统数据库的价值主要体现在选择和编排材料上,因而传统数据库受版权保护的可能性较大。在大数据时代,计算机和网络的运用使得信息量激增,数据库更多的是体现出一种实用性特点。数据库对资料进行分类、编排和设计检索的目标是信息全面、方便查寻,而不是要体现与众不同的个性。很多数据库要求相关的信息必须齐全,这种数据库的开发基本上不涉及选择的问题而只是搜集。数据库对某类搜集越广,信息量越大,其价值就越高,但其个性越弱化,得到版权法保护的可能性就越小,结果导致数据库制作者的合法权益受到极大威胁。


(三)第三阶段:数据处理与安全的版权保护


为了对数据库版权进行有效保护,法律有必要对技术保护措施予以规范,对此理论界与实务界已经达成基本共识。大数据时代,任何人都可以对计算机软件及其他数字化作品进行低成本、高质量和无限制的复制,并将其传送给其他用户或上载至网络站点供人自由下载。社会公众对作品的利用,已经从间接获取载体(如购买书籍、唱片)到直接欣赏作品(如浏览网页)的转变,社会公众无需占有作品就能“接触”作品从而实现作品的使用价值。虽然各国的版权法都赋予版权人以排他的专有权利,如复制权、发行权、信息网络传播权等,但是,若法律只制裁侵权行为,那么法律救济只能是一种“事后救济”。数字化作品一旦被非法复制并在网络上进行传播,就可以极短的时间形成成千上万份的非法复制品,且侵权者往往是众多缺乏经济赔偿能力的个人用户,逐一寻找这些侵权用户并追究其法律责任并不现实。从这个角度而言,在网络新闻内容数据库构建之后,版权人就使用技术手段保护自己的版权权利和其他经济利益,这些技术手段是一种“事前预防”的措施,对于维护版权人权益可谓意义重大。


但与此同时,版权技术措施先天的技术特征,使其在保护版权作品的同时,具备了收集、获取作品消费者个人信息的超强能力。这种能力与大数据时代版权产业发展模式创新的数据需求不期而合,成为版权人整合作品资源、最大限度实现作品版权价值的新途径。甚至可以毫不夸张地说,通过版权技术措施的技术手段整合各种作品使用信息,将会开启大数据时代版权产业的掘金之路。但在这一过程中,版权技术措施却存在着侵犯隐私权的风险。主要表现为三个方面:一是通过接触控制的版权技术措施来收集作品消费者的个人身份信息;二是通过使用控制的版权技术措施来收集作品消费者的个人消费信息;三是通过版权技术措施收集的个人信息针对作品消费者开展大数据预测。目前,我国版权法对于技术保护措施进行了较为明确的规范,但是关于如何规制大数据时代版权技术措施的隐私侵权问题却鲜有规定。如何从个人信息保护的角度完善版权技术措施的限制制度,从而应对大数据时代版权技术措施的隐私风险是摆在我们面前的突出问题。



(四)第四阶段:数据传播与运用的版权保护


大数据时代网络内容提供商的信息采集、数据管理、运用分析的最终目的是进行数据传播从而实现版权收益,在大数据时代,通过数据挖掘技术,在用户打开APP客户端使用的短暂几秒内,根据用户的个人兴趣、性别、位置、社交网络使用习惯等进行分析,为用户推荐符合其兴趣的作品集成。从其网络链接的推送行为属性来看,可分为浅层链接与深层链接,其区别在于浅层链接将原页面的内容完全再现,包括广告、目录等与目标文本无关的内容,而深层链接则去除了与目标文本无关的内容,仅链接纯文本。通常而言,浅层链接属于合法行为,深层链接有可能构成不正当竞争行为。


随着智能手机的普及,手机阅读越来越普遍,但互联网的网页编码一般是设计给PC端用户浏览使用的,当用手机直接打开这些网页时就会出现乱码,手机屏幕小、操作系统也不一样,想用手机进行正常的阅读需要把来源于网页中的内容“转码”成适合手机阅读的格式,这就必要要求将转码后的网页存储在了自己的服务器中向用户提供,用户在APP客户端点击新闻标题之后,不发生跳转也就是不再从信息来源的原网页服务器中获取作品,而是直接从网络内容提供商的服务器中获取。该行为既属于未经许可复制,也属于未经许可通过信息网络向公众提供作品,对此应承担侵权责任,如腾讯旗下新闻平台“天天快报”与“今日头条”之间的287起侵权纠纷案件,法院已全部作出判决,曾自称新闻的搬运工的“今日头条”全部败诉,总计需赔偿腾讯方面27万余元。


政策与建议


(一)引进默示许可制度以应对网络海量授权


版权默示许可制度是指作品使用人虽然没有得到版权人的明示授权,但是通过版权人的行为可以推定版权人不排斥他人对其作品进行利用,作为一种补偿,使用人应当向版权人支付报酬的一种版权许可使用方式。在大数据时代,类似于搜索引擎性质的网络聚合应用,更急切地呼唤默示许可制度在网络传播中的普及。网络聚合要涉及到对各类媒体的文章的转载,如果都要经过被转载者的授权许可,那互联网的传播效力就会大打折扣,对此可以在《著作权法》中作如下规定:“搜索引擎服务提供者可以对网页内容进行抓取、复制和链接,除非网页的作者已经采取特定技术措施排除网站的内容信息不被检索。权利人有权利书面要求搜索引擎服务的提供者按权利人要求删除或者断开链接。”


(二)数据库应被整体纳入版权的保护范围


在大数据时代,数据库的索引已经创造出很多重要的独创性基础新技术,比如云计算在分布式处理、并行处理和网格计算等技术的基础上发展起来的,是一种新兴的共享基础架构的方法;虚拟化技术是云计算所有要素中最重要的部分,主要包括计算虚拟化、存储虚拟化和网络虚拟化;数据存储已经出现了大容量、高可靠性、高可用性、高性能、高度自治、高成本、访问接口的多样化;数据分析既要能处理高速的数据,又能实现实时的分析。从这个角度而言,大数据时代数据库的内容选择或编排能够满足智力创作的最低要求,具备一定的独创性特征。而对数据库的复制则轻而易举,成本极低,如不加以保护,必将挫伤数据库开发者的积极性,进而影响版权产业的发展。因而,版权法应发挥其应有的作用,将数据库整体纳入版权法保护的范围。


(三)遵循个人信息条款的“告知与许可”规则


在大数据时代,基于数据类型的非结构化和大量化,版权人无法告知作品消费者其信息的具体使用用途,但至少在信息收集层面做到让其知情。只有遵循“告知与许可”规则,作品消费者才有可能拥有对个人信息的控制权,进而要求版权产业利益人安全、负责地使用其个人信息,“告知与许可”规则可大致设计以下三方面的内容:一是设定时间,可与版权技术措施同步设定;二是内容,包括被收集的个人信息种类、使用目的等信息;三是方式,应当以醒目的方式提醒作品消费者。只有满足上述三个方面才是符合隐私权的基本权利要求。


(四)深度链接行为的法律规制


深度链接行为是大数据信息技术发展的结果,对于用户快速获取信息来说至关重要。伴随着大数据时代的来临,深度链接的花样越来越多,给法律工作者带来了巨大的挑战,对于深度链接行为的性质认定及其法律规制,在立法、司法和理论界等层面存在着不同的声音。但就我国目前现有的版权法律体系来看,信息网络传播权就是将作品储存在网络存储介质中,使得公众可以获得该作品的权利,即信息网络传播权控制的信息网络传播行为一定要存在将作品存储到网络存储介质当中这一行为,对此完全可灵活适用《著作权法》和《反不正当竞争法》对深度链接的侵权行为加以规制。


(为便于排版,省去原文注释)



编辑 | 叶雪枫

作者


彭辉

上海社科院法学所,副研究员,博士


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存