深柳读书|算法新闻的可版权性质疑及邻接权保护
深
柳
堂
编者按
“闲门向山路,深柳读书堂”,语出(唐)刘昚虚《阙题》。深柳掩映下的清净书堂,最是读书人向往的治学之所。由是,我们用“深柳堂”来命名《新闻与传播研究》论文推介栏目,以期让同好慢慢品读,细细体味。
本栏目期待能够成为学者们田野归来坐而论道的一方宝地,将理论与实践结合起来,切之,磋之;也欢迎各位读者向作者提出问题,琢之,磨之;我们会精选问题予以回应,奖之,励之。
算法新闻的可版权性质疑及邻接权保护
作者 | 赵双阁 艾岚
内容提要
人工智能生成算法新闻,是自我推演逻辑规则下对挖掘的数据进行持续“榫接”和匹配最终产生的结果。这种新式的、无人参与的新闻生产方式,对著作权法意义上的作品认定、权利保护模式、归属规则都带来了挑战。虽然由于算法新闻生产过程中缺少人类思想的表达,而难以将其认定为著作权制度中的“作品”,但其在法理上具备客体性和财产性,获取一定程度的法律保护很有必要。将算法新闻纳入邻接权保护,设立“数据智能聚合权”,倡导“投资原则”为主、“意思自治原则”为辅的权利归属规则,不仅符合邻接权制度价值追求和扩张规律,而且为破解当前算法新闻所面临的法律保护困境提供了一条路径。
关键词
人工智能 算法新闻 可版权性 邻接权
正文
一、问题的提出
人工智能与基因工程和纳米科学并称为21世纪的三大尖端技术。作为大数据时代的产物,人工智能至今尚无统一定义,但通常认为它描述了计算机模拟人的某些思维过程和智能行为(如学习、思考、推理、规划等)的过程,是一种人为的智能化程序或机器。各行业依托人工智能技术,生成了诸如算法新闻、诗歌、小说、论文、画作等各种人工智能内容成果。包括算法新闻在内的人工智能生成物繁荣了文化市场,促进了文化产业的快速发展,但它的出现和广泛应用也对现有著作权制度提出了挑战,产生诸多法律问题。其中,有关人工智能生成内容可版权性及其归属在国内外相关学界引发了激烈的争论。不同的学者和国家根据不同的理论和人类、人工智能在生成内容过程中贡献大小、方式不同,从不同角度做出了自认为最为合理的“独创性”判断和最为合适的权利保护模式选择。纵然每一种学说、每一种模式都在一定的框架和观点层面存有自洽性和合理性,但是如何从技术逻辑、法教义学以及法律实践操作的便利性和合理性出发,选择更为合适的权利保护模式和权利归属规则值得进一步研究。尤其是,作为人工智能生成物的一种类型,算法新闻的权利保护问题被裹挟在人工智能生成物探讨之中,没有引起大家的特别关注。但是,算法新闻无论是在生成过程中的模板选择、数据挖掘、数据选择等方面,还是在传播领域满足社会的需求方面,如真实性、及时性、传播性等,同其他人工智能生成物,如小说、诗歌、音乐等相比都有非常大的不同。算法新闻作为新闻的一种,最大的特性就是传播性和公共性,即通过传播在价值导向上为公众服务和目标追求上促进公共利益、满足公众知情权的属性。可以说,算法新闻生产的出发点和落脚点,在于通过传播及时满足新闻消费和使用,而其他人工智能生成物初心在于生产而非一定要传播,如有些诗歌创作并非为了与他人分享,而是为了自我欣赏和保存,但任何新闻从来都不是为了自我欣赏而生产的,其基因里内含着传播与分享。可以说,其他人工智能创作物的生成属于成果“产生-传播-使用”链条上的“产生”环节,并不必然涉及两人的双向性或两人以上的广泛性,若为其创设一种传播者享有的邻接权必然存在逻辑漏洞。基于算法新闻不同于其他生成物的独特性,对算法新闻的权利保护进行独立探讨也就具有了必要性和重要性。但是,截至目前,在知网“题名”条目下同时搜索“算法新闻”和“版权”,结果显示只有《人工智能时代算法新闻的版权保护机制研究》一篇文章,此文认为应当明确符合作品构成要件的算法新闻在法律性质上应当认定为作品。
为此本文拟从技术逻辑入手,对算法新闻生产过程和基本原理进行剖析,结合并立足于“独创性”、“智力成果”法律上的概念内涵,对算法新闻的版权性保护进行判定。在否定算法新闻“作品”属性的基础上,从客体性、财产性及其权利化等三个方面对算法新闻“数据属性”进行定位,分析算法新闻权利保护模式选择及其权利归属,尝试在现有版权法框架下为算法新闻权利保护提供法理基础,希冀这一研究有助于充实著作权法的理论内涵,对司法实践处理类似案件有所裨益,促进相关利益主体之间的利益平衡和智能时代传媒产业的健康有序发展。
二、算法新闻“作品属性”的考察:
缺失人类主体和智力难称作品
(一)算法新闻生产机制的考察:逻辑推演
人工智能采取RNN语言模型方法,将大数据中现有的作品输送给RNN语言模型进行训练、学习,不仅在整体上会形成一类作品的写作规律模型,而且在语句生成方面形成概率分布函数,实现根据给定或已有语言字符即可预测最符合逻辑推演的下一个语言字符,即按照语言模型输出的概率分布产生下一组词汇,循环往复直至完整的算法新闻产生。因此,算法新闻生产的核心内容就是一套适用于新闻生产流程的算法机制:检索与辨认、逻辑与控制。可以说,该机制在算法新闻生产过程的三个阶段里得到了贯彻:首先,联通互联网、数据库,挖掘、抓取各种数据信息。由信息检索程序通过网络针对各类数据库、新闻网站、社交媒体等挖掘、抓取、识别符合既定主题、新闻价值的各种可用数据作为写作素材,比如世界杯比赛的比分、球员进球统计、历史记录等,完成“颗粒数据”(granular data)的收集和分析,为后续的关联和重组做好准备。其次,对挖掘、抓取的数据进行切割、结构化处理和分析。基于每次新闻主题的要求构建相应的算法模型,以期对以上抓取到的数据进行计算、分析、切割形成高匹配度、相互关联的颗粒化与结构化的元数据,分析、统计这些数据之间的语法变化规律与趋势,将处理结果与已确定的新闻主题进行实时比对,除去冗余,循环往复。最后,将颗粒化、结构化数据内嵌入选定新闻模板,生成完整的、符合规范的新闻稿件。换言之,就是通过算法和模板规则(逻辑规则的优先级分类排序)将原初分散的颗粒化、结构化数据重新进行关联、匹配进而聚合起来,合成、创作出一篇整体新闻文本。
由此可见,人工智能生产算法新闻实际上是运用了一种编程,呈现一种创作的能力,即获取信息、提炼知识、创生策略和执行策略的能力,该能力并未超出解决问题能力的范畴,恰如人工智能在艺术品领域的运用,“其实分析这些创作艺术品的智能程序可知,它们是利用了专家系统和机器学习技术,存储并分析大量艺术家作品,寻找其中有规律性的特征,然后再加以重组,而基于神经网络的深度学习技术能够让计算机程序实现不断积累和更新,从而掌握更好的解决问题的方法。”因此,人工智能生产算法新闻就是先行设计一个为了解决新闻生成问题而能够自我推演的逻辑规则,然后在要求和指令加持下,对挖掘的数据进行持续精准“榫接”和匹配,最终获取逻辑推演的结果。这个过程中的分析、思考以及最终的表达基本都是基于框架的推演,而非对内容本质的考量。
(二)算法新闻表达形式方面的考察:非独创
“独创”(originality)一词,在汉语语境中可以分为两部分:“独立”和“创造”。对于著作权法意义上的“独创”,一方面强调作品是创作主体在构思状态上属于独立完成,当然独立创作并非指单人创作,也可以合作创作;另一方面强调表现形式是从无到有或在他人已有作品基础上进行创作。但是作为一个法律概念,各国版权法都没有对其进行准确地表述,很难确立一个客观性标准。根据前述算法新闻的生产机制,算法新闻的产生首先需要通过可感知原材料识别的感知技术,将大数据挖掘出的原材料进行识别,并经历神经网络的深度学习和原材料特征分析,实现原材料专有性特征的反复提炼,直至新闻模板的形成,最后按照生成的新闻模型输出算法新闻。由此可见,算法新闻的生成过程完全是由人工智能机器的“独立”完成,在逻辑构思方面完全依靠神经网络技术的深度学习进行推演,没有外在的人类或者其他智能机器对算法新闻的生成进行干涉。尤其是,算法新闻的素材不仅来源于大数据,挖掘原始数据或信息一般不存在违法行为,而且算法新闻与大数据中的先有作品之间并不存有实质性相似,从这些方面而言,算法新闻的生成符合“独创性”中“独立”的要求。
虽然各国版权法对“创造”并无明确的判断标准,但是,从内容上来看,无论是英美法系还是大陆法系,在版权法中都有一个共识即创造性并非一个很高的标准。英美法系国家对“创造性”要求比较低,曾确立“额头出汗”和“最低创造性”等创造性认定标准,要求作品必须具有最低限度的劳动或努力投入,强调非抄袭即可。除此之外,美国第二巡回法院在“百特琳案”中还曾确立“实质性相似”认定标准,强调只要在表达形式方面能够满足与其他作品较低重复率,即可被称为作品。换言之,美国司法对作品“创造性”的考察主要侧重作品的“客观表达”不允许存在相似性,对于表达的思想并无特殊要求。但是,《美国版权局实施纲要》(第3版)第313.2条又规定:“任何作品都必须由人来创造,才有资格成为作者的作品”、“版权办公室拒绝注册仅由机器或机械程序任意或自动生成、缺乏人类创造性投入或干扰的作品”。由此可见,算法新闻即使在满足与其他作品表达不重复情况下,在美国也是不受版权法保护的。大陆法系国家对“创造性”的认定标准相对要高一些,不仅在表达形式上要求有所不同,而且主要侧重强调作品的内容是否反映作者的个性,比如,德国《著作权法》第2条第2项规定:“本法所称之著作,只指个人的智力创作。”虽然并无“独创性”概念,但是从条文原意考察,对作品的创作程度都做出了必要性要求,要求作品内容必须体现出作者的个性才能获得版权法的认可和保护。不过,日本《著作权法》第2条第1项第1款规定:作品指表达思想或感情之创作,而属于文艺、学术、美术或音乐之范围者。对“创作”做了明确要求,强调作品必须是人类之精神成果,确立“个性”为创造性核心要素。依据上述法律规定,在大陆法系国家,由于人类参与度较低或者没有,人类的精神或者个性也就无从谈起,算法新闻的作品属性也就不存在了。
(三)算法新闻创作“智力”方面的考察:非智力
智力(intelligence)也称为智能,通常被认为是生物一般性的精神能力。具体而言,智力是指主体认识客观事物并运用知识或者经验解决实际问题的能力,通常包括多个方面,如观察力、记忆力、想象力、分析判断能力、思维能力、应变能力等。对于作为智力成果的作品而言,就是作者充分运用自己的记忆、观察、想象、思考、批判等方面的能力,主动通过语言或非语言符号将自己的情感、精神、观点表达出来所生成的个性化、艺术化的产物。
算法新闻是人工智能技术产生的成果,其实现的基础在于人工智能程序所体现出来的一种能力,这种能力在一定程度上体现出与人类智力相似的“智能”。但是,人工智能所体现的这种能力并非“智力”。即便人工智能程序每一次运行所产生的算法新闻都具有不可重复性和不可预测性,但是,从本质上而言,算法新闻是人工智能技术通过算法、大数据挖掘、模板匹配、语言结构化生成,对已有的作品及作品外的数据和信息进行挖掘并整理和学习,按照人类语言的表达规律,甚至体现某人言论个性的表达方式而做出的排列组合。易言之,人工智能在生成算法新闻过程中虽然也需要遵守一定的表达规则,但是,人工智能程序基于程序算法进行机械性、非情感地表达,并不能像人类一样将思想、情感、立场等融入个性化表达的创作之中。因此,在算法新闻的产生过程中,人类的贡献或者人类的智力仅仅体现在对所提供的算法程序的创造方面,而作为一种“排列组合”的算法新闻,鉴于没有人类的参与就无法被视为对人类思想的表达,也就很难成为受著作权法保护的智力成果。
有学者认为“自动新闻写作”是综合运用算法与模板的结果,其关键在于针对某一类型文章,如财经新闻、体育新闻等开发出针对原始数据进行分析的算法,再将其分类套入内置的各种模板。由此可见,人工智能对算法新闻的生成,实质上是对一套优化后的算法的运用,“属于执行既定流程和方法,并通过计算获得确定的结果”。该算法无论是被人工优化还是通过深度学习自我优化,作为一种软件程序,在任何一个电脑上输入相同指令、运行相同算法生产算法新闻,除非软件程序本身缺陷造成算法出现错误,这些被生产出来的算法新闻在表达形式方面都是别无二致,个性化智力创作无从谈起。即使后来出现随机性算法以及备选各种固定模板,生成内容表达上充满“个性”,但是,限于“新闻”本身对真实、客观、全面等特性的要求,基于同一事实所生成的算法新闻都会在5W方面(when、where、what、why、who)保持一致,机器表达形式不可能多到无限而是只能在预设的空间内变化。有限的变化空间就会造成不同算法新闻在基本表述方式或风格上出现较高的相似性,存在着模仿、复制等重复性现象,体现不出创造的实质要件。
根据前述“智力”概念可知,智力是一种主体依据经验或知识而解决问题的能力,那么智力成果就是指人们通过有意识地智力劳动,为解决或说明某种问题而创造的精神财富或精神产品。由此可见,受著作权法保护的智力成果,是著作权主体与客体相互结合的统一体,是在主体创作意识的指引下产出的结果。对于算法新闻而言,能不能成为智力成果,不仅要看人工智能生成过程是否体现出“智力”来,还要考察该过程是否存在创作意图。设计人工智能技术的主创者必定希望能创作出一套自动生产“作品”的技术,该技术被自己或者他人利用后能创作出“作品”内容来。这种创作意图在作为产品或作品的人工智能技术受到著作权法保护中得以体现。但是,能不能将这种主创者在人工智能技术中的“创作意图”和人工智能依靠算法规则“主动”进行“创作”所体现出的意图相提并论呢?答案是否定的。因为前者是人类的创作追求、创作目的,而后者却是算法规则的逻辑推导或者逻辑追求,本逻辑中难以体现对每次生产的具体意图。易言之,人工智能在生成算法新闻时,不存在“创作意图”,难以满足“创作”的主动性要求。
三、算法新闻“数据属性”的定位:
客体性、财产性及其权利化
(一)算法新闻具备权利客体性
1.算法新闻具有民事客体须有的确定性
算法新闻是在各种新闻模板基础上产生的成果,表面上与人工新闻作品没有什么区别,不仅具有特定的“整合”形式,也有特定的“整合”内容。作为一个有意义的确定性存在,在传播领域民事主体对其可以享有流转性的独占和控制,这也就奠定了算法新闻具备民事客体特定性的基础。大数据、人工智能技术下的算法新闻遵循信息作品的生成和传播规律,自逻辑起点始就具有传播与分享的特性,在后续发展、流转过程中就像人工新闻作品一样被上传、下载、删除、复制、传递、扩散等。若赋予算法新闻以民事客体地位,虽然基于其复制或删除的特性,会出现不同主体对算法新闻同时占有或者随机灭失的情况,但是,根据民法对“无形性”客体的规范规律,只能由一个主体对其在流通领域享有一定时期独占性的流转控制,从而将客体置于一个稳定的状态,即该稳定不局限于算法新闻本身有多少人占有或者分享,而在于对算法新闻流转控制的确定性,且该种确定性以法律对其地域和时间的规定为准,契合客体确定性的内在规律性。
2.算法新闻具有民事客体所要求的独立性
在现实物理世界中,民事客体是民事权利的附着对象,它必须是能实际控制的并能划分与他人利益范围的独立载体。虽然算法新闻是由大数据“聚合”而来,但是,其并不具有数据无法脱离载体而存在的那种特性。算法新闻一旦产生,作为一种数据成果在表达边界上就具备了清晰性,区别于现实或者网络中已有的数据、作品、非作品,可以以多种形式存在于新闻市场之中,通过署名,民事主体可以对其进行直接控制,无需在意算法新闻承载于何种电脑终端或者存储设备,也无需关注算法新闻使用何种代码对其加以呈现。在此意义上,算法新闻作为无形物,其物性表明了其内存的管理与控制的自然关系,其客体性是依无形物的占有而成立,无形占有通常表现为内容控制和署名,当被法律赋权而表现为占有权利时,该自然关系中的算法新闻与占有都体现了法律意义上的独立性。进一步而言,作为权利客体的算法新闻当然也就具有了排他独占性,如若算法新闻对他人人格权或著作权造成侵权,权利人就应该独立承担侵权责任。
3.算法新闻体现了民事法律关系中无形物的物性
建立民事法律关系的目的在于获取、保护或者分配转移某种利益,因此,民事法律关系客体所承载的利益,就成为民事权利和民事义务联系的中介。民事法律关系的客体,依利益的表现形式,可分为物、行为、知识产品(无形物)、人身利益四类。民法理论中,物就是那些占有一定物理空间,能够被人力所支配或者移动并能解决人类所需的物体。而算法新闻作为一种主要存在于网络中的信息或者数据,“它往往并非事物本身,而是表征事物或者通过事物发出的消息、情报、指令、数据或信号所包含的内容。”这样就说明,信息或者数据虽然是以一种不占空间的无形物体而存在,但是,其物性之存在及物权之个性不容置疑,相较其他民法中的物,只是在物的存在规律及物权的表现规律方面不同而已。那么,算法新闻能否类似知识产品作为无形物成为权利的客体?算法新闻无论是最初以比特形式存在还是以语言符号形式存在的物质介质,在外观上都具有无形性的表征,也符合客体意义上无形物的要求。原因在于“作为无形物的智力成果是以其信息内容的专属性和垄断性来表彰知识产权的”,而算法新闻就是以其所承载的信息内容来界定权利义务关系,算法新闻本身就具有类似著作权所具有的信息垄断性的内在特征。由此可见,算法新闻在物理性的客观存在方面体现出的是无形物的物性,在满足人们信息需求方面体现的是稀缺性、独立性和特定性,完全符合知识产品无形物的著作权法客体要求。
(二)算法新闻具备财产性:独立经济价值和独立可控性
1.算法新闻本身具有独立的经济价值
算法新闻是人工智能将原始数据聚合而成的成果,虽然需要依赖载体、代码和其他诸种要素而呈现,但其拥有完整的意思表达,可以独立于信息市场,与其他作品或者非作品的信息明显区分,能够满足人们某一方面的信息需求(娱乐、教育、知识、生活等),因此并非作为系统性元素而存在。算法新闻的复制、转载、传递并非必须依附于代码、平台、交易合同、服务协议等这些技术和法律关系才能实现,而是可以依据自身的价值、功能、性质进入财产关系领域,在完成对价的前提下或者法律规定的合理使用情况下独立实现这些行为。易言之,算法新闻可以独自发挥社会功能性作用和在市场交易中直接产生经济利益。从价值性的角度而言,人工智能生成的算法新闻和普通的人工新闻作品并无二致,不仅能不同程度上满足受众的知情权,而且还能满足受众不同的语言审美情趣和艺术追求。
有学者认为,抽象强调数据的财产性会忽视信息层面上的交易性和人格权保护的理论冲突,并导致过分商业化的恶果。但是,算法新闻的实际价值并非仅仅由其所承载的数据/信息决定,算法新闻的语言表达、逻辑推理、生产单位著名程度等因素也能起到很大的作用。网络环境中人工智能新闻信息的分享和交易必须要通过算法新闻的复制、转载才能完成,这样就为具体强调由数据生成的算法新闻的财产性提供了该成果层面上的交易性和知识产权保护的理论相互支撑的条件,实现有序商业化的理论预期。可以说,算法新闻的财产性是由算法新闻本身来定义的,而非由支撑算法新闻的数据定义的,因为,从某种程度上而言,数据之于算法新闻,就犹如元素之于化合物,元素本身并不具有独立的价值与身份。人工智能对数据/信息进行科学的遴选、有序的整合,并创造性地做出了新的构思及其表达,生成了凝结着创造性劳动的结构性内容成果,这个过程显示了算法新闻内在经济价值的来源。因此,算法新闻本身所体现的独立的经济价值源于创新性结构的价值要素,而非数据/信息内容本身的价值成分。恰如有学者指出的,“数据控制者将无序信息形成有序信息的信息熵减产生了大数据的经济价值。”
2.算法新闻具有独立的可控性
在欠缺著作权法保护的情形下,算法新闻只能依赖于其生产者的控制而实现自身的价值。换言之,算法新闻因其在形式上与自然人创作的新闻作品几无区别,所以它完全可以成为能够透过物质载体感知的独立存在,为人力支配和控制,其自身价值的实现离不开生产者的有效控制。如此逻辑之中也就隐藏这样一个基本判断,即算法新闻的财产价值并非由新闻的内容来彰显,而是由算法新闻的生产者的控制行为来实现。一旦算法新闻未经允许由其他媒体通过某种渠道获取进行复制、转载、刊发,其对于生产者的商业利益就会造成损害。
所以,为了加强生产者对算法新闻的控制,就应该将算法新闻纳入到法律的保护领域,赋予生产者相关权利,使其享有排他性的专有权,即非经权利人同意或者法律特别规定,他人不得对算法新闻实施受法律专有权控制的行为。那么,鉴于算法新闻的无形性、可复制性、非排他性等特征,将其纳入到什么法律之中比较合适呢?有学者认为,对于无形的信息或数据进行权利界定在法律上并非完全空白,其中最直接的体现就是知识产权。因为,知识产权本身控制的对象并非信息本身,并非致力于阻碍他人对信息的知悉或分享,而是对权利客体在市场交易或流通领域中的一种独占与控制。算法新闻作为新闻系列中的一种,天然趋向于满足大家的信息需求,新闻价值属性决定了其超强的信息传播能力。尤其是,算法新闻内容的完整性和结构性,使其脱离了纯数据所具有的碎片化、非稳定性,呈现可操作性、可识别性和可利用性,这也就奠定了在法律上赋予权利主体对其在财产或者经济利益方面所享有一种流通控制权的可行基础。
(三)算法新闻财产性的权利化:著作权法规范
财产权原本就具有社会性,财产权客体的种类、性质有着时空上的差异性,会随着主体认识和实践活动范围的变化而不断变化。同时,利益是权利的基本要素,是权利的基础和目标,也是法律制度设计的重要参照系。因此,将算法新闻列入著作权法保护的客体范畴,目的并不仅在于建构生产者与算法新闻之间一般对应关系,更为期待的是建构主体对客体的某种利益关系。易言之,只要作为客体的算法新闻能够符合作为主体的生产者的建构需求和建构利益,其就应该成为权利保护的对象。对此,恰如有学者梳理现代财产进化史所发现的,当技术的变革增加了某项资源的价值时,财产权便随之出现了。比如在录音技术发明之前,声音从来都不是财产;照相机发明之前,名气从来不是财产;广播技术发明前,电磁频谱也从来不是财产。追溯人类技术迭代与制度演化之间的关系,可以揭示出一个基本博弈规律:当一项新技术的运用促使人类因依赖于某项资源而改变生活或者生产模式时,新制度也就随之产生。因此,从认识论而言,财产权是一种法律创造,一个人认为财产是什么,取决于他要用财产来干什么,即其希望通过一定的方式来看待财产试图推进什么样的目标,人们的财产观念从来都是被塑造的结果,财产权从来都是手段而非目的。如此看来,算法新闻作为目前传媒业界采取人工智能技术重塑生产模式甚至范式的一种趋势,不仅可以在速度和数量上极大满足受众对信息知识的获取,也可以繁荣文化市场和版权产业市场,而且还可以激励传媒产业投入更多资金用于购买或者研发更为先进的人工智能。
当然,从宏观而言,将算法新闻作为一种著作权法保护下的无形财产,既考虑到了新闻单位为生产算法新闻投入的人力、物力、财力,又出于激励人工智能市场繁荣发展,提高供给人工智能应用市场的能力之目的。大陆法系国家的著作权法制度,在设计权利主体时不仅对创作作品的作者进行保护,而且对没有付出创作智力却付出投资的传播作品或者非作品的传播者也提供保护。将作为缺乏“智力创造”而失去“作品”属性的算法新闻纳入著作权法制度进行规范,符合著作权法结构设计和法理逻辑推演,“尽管事实上没有生命,没有道德思维,但在法律设计上,只要法律思维认为有必要这样做,法律便可以不只唯一地尊重有智慧的人。”因此,当缺乏人类“智力”的算法新闻大量涌现时,可以很大程度上及时消除受众的信息不确定性,满足服务社会、指导生活,传播知识、普及教育,提供娱乐、丰富生活等方面的需求,对其缺乏权利保护的现状的改变是符合法律思维的,也是符合技术发展推动著作权法扩张的历史规律的,以开放的客体理念和主体观念吸纳人工智能技术发展所带来的前所未有的成果形式,有利于强化人工智能技术的应用,促进算法新闻的许可和转让,为21世纪人工智能技术蓬勃发展提供助力。
四、算法新闻排他权的立法模式选择:
邻接权保护模式
(一)算法新闻邻接权保护模式选择理由和数据智能聚合权的设立
1.采纳算法新闻邻接权保护模式符合邻接权制度设立宗旨
首先,传媒机构符合邻接权制度对权利主体的最初定位。在国际上提出邻接权的国际条约是1964年缔结的《罗马公约》。该公约规定,邻接权的设立初衷是为了保护表演者、录音制品制作者和广播组织的权利。因此,世界知识产权组织将“邻接权”定义为:“在日益增多的国家中,为保护表演者或演奏者、录音制品制作者和广播组织在其公开使用作者作品、各类艺术表演或向公众播送时事、信息及在声音或图像有关的活动方面应得的利益而给予的权利。”细究该权利主体有一个共同的特点,就是上述三个主体都是传播者,因此,有学者将邻接权定义为作品的传播者就其传播作品的过程中付出的创造性劳动和投资所享有的权利。强调该权利保护的对象是进行传播的行为,而不是创作文学艺术作品的行为,可以简称为“作品传播者权”。而就目前传媒市场来看,算法新闻生产主体都是媒体组织,既包括传统媒体,如《光明日报》,也包括新媒体,如今日头条。这些媒体机构生产算法新闻的目的并非为了满足自己的使用,而是为了传播至社会各个角落,满足社会大众对时事新闻的需求。因此,将人工智能应用到新闻生产领域的传媒机构,其终极目的并不仅仅在于算法新闻的生产,还在于将这些算法新闻传播出去,那么保护这些作为传播者的传媒机构,也恰恰同邻接权的设立初衷不谋而合。
其次,符合特定产业主体的要求。与著作权保护客体为具有独创性的作品不同,邻接权保护的客体是未达到独创性要求不能构成作品的智力成果。但是,现实中并非所有的这类智力成果都能获得邻接权的保护,不同国家对此规定也不尽相同。比如我国只规定了表演、录音录像、广播电视信号、版式这四种邻接权客体,而《俄罗斯民法典(著作权部分)》、法国《知识产权法典(法律部分)》都规定了五种邻接权,且并不一致。由此可见,从邻接权客体角度无法探知邻接权制度保护发展的规律。但是,我们将分析路径转向权利主体方面就会发现,那些为传播付出劳动和投资的特定主体基本上都能获得保护,实现他们的合理的利益诉求。比如录音录像技术、盗播技术对表演者、广播组织的利益影响巨大,他们争取权利保护是源自于自身的合理需求,保护的是合理利益。那么,是不是只要是付出劳动或投资且拥有合理诉求的主体就能够获得邻接权保护?答案是否定的。我们梳理传统邻接权产生的过程可知,这些主体最终获得权利保护的原因,还在于其经历坚持不懈的、漫长的国际会议中的利益博弈后才争取到了权利保护。如此背景下,传媒产业因生产算法新闻投入的劳动和投资而诉求专有权利的保护,从维护特定产业主体的利益角度看是合理的、正当的。这也就为传媒产业在未来立法博弈中争取邻接权保护扩张至算法新闻奠定了坚实的基础。
2.采纳算法新闻邻接权保护模式符合邻接权制度扩张规律
首先,邻接权是技术的产物。纵观历史,人类社会的信息传播方式可以分为七个阶段:语言传播时代、文字传播时代、印刷传播时代、模拟式电子传播时代、数字式电子传播时代、信息时代和智能时代。有研究表明,19世纪末至20世纪上半叶这段时期技术进步主要集中在传播信息的新技术方面,如留声机唱片、无线电广播、录音录像等都是传播方式的革新。而这些技术上的变革必然会冲击当时社会群体的利益格局,进而促使其去寻求突破当时法律制度的保护。从著作权法产生的背景来看,印刷技术的产生促进了著作权的出现,而录音录像无线电广播技术的发明和广泛应用导致了邻接权的产生。换言之,既可以说“邻接权制度是人类传播技术进步的结果”,也可以说“这种进步直接导致对邻接权的承认”。
随着传播技术的飞速发展,很多国家在邻接权立法方面进行了扩张,保护的客体大为丰富,比如德国将达不到摄影作品要求的一般照片、非独创性数据库、达不到电影作品独创性要求的电影制品和活动图像等都纳入了邻接权保护范畴;意大利将舞台布景设计、工程设计图纳入了邻接权保护范畴;中国将通过信息网络向公众传播的广播、电视纳入了邻接权的保护范畴。那么,在当下这个智能时代,人工智能技术和传媒产业结合彻底改变了传媒新闻生产、传播的范式和格局,将人工智能技术所带来的算法新闻纳入邻接权保护范畴,比较符合邻接权制度扩张的技术规律。
其次,邻接权制度的价值追求:保护投资。通常认为,邻接权是因作品传播者在传播作品过程中付出了劳动或者资本投入而享有的专有权,这里面一是强调权利主体是传播者,二是强调保护的原因在于传播者背后的投资。在邻接权制度构建初期,这种理解是恰当的。但是,在邻接权制度随后不断丰富的过程中,我们看到了资本逻辑的力量,投资在邻接权保护中所占的作用越来越重,促进权利主体、客体的扩张,将投资者扩充进来,也不再限于与作品相关。比如,《德国著作权法》第81条规定,剧院及音乐会组织者可以获得邻接权;《欧盟数据库指令》、《俄罗斯民法典》均将数据库制作者列为邻接权主体,明确将资本投入纳入保护的范畴。在司法实践中,德国联邦最高法院更是在2008年和2009年的判决书中总结出邻接权保护的前提是:保护对象凝结和体现了厂商“经济性和组织性”的投入。因此,在这种发展趋势下,将算法新闻纳入邻接权保护范畴,是和邻接权制度保护投资的价值追求相一致的,不仅可以对人工智能程序的研发投资、算法新闻生成的商业化投资提供保护,而且可以激励相关利益主体继续投资于人工智能研制及其算法新闻生产,实现人工智能技术的快速发展和算法新闻的广泛传播及利用。
3.作为邻接权的数据智能聚合权的设立
由于我国在邻接权权利类型设置方面采取的是法定模式,只规定了表演者权、录音录像制作者权、广播组织权和版式设计权,所以,依据权利法定这一基本法律原则,若将算法新闻归入邻接权保护范畴,则须以明确的方式命名权利名称,并将权利内涵、权利主体及其保护期限等进行详细规范。
首先,算法新闻的邻接权可以命名为“数据智能聚合权”。恰如前述,从人工智能生成过程而言,算法新闻就是通过挖掘、感知技术程序的设计,对网络原始数据进行抓取、分析、整理并捕捉特征,转换成计算机可识别的数据语言,选择不同的新闻模板进行生产的结果。在本质上,就是数据“运算——再生成”的产物,因此,将算法新闻的邻接权命名为“数据智能聚合权”也遵循了其本质规律性。另外,该种命名方式也体现出了开放性的特点,因为人工智能生成物是一个比较宽泛的称谓,不仅包括算法新闻,还可以包括小说、诗歌、曲谱等,目前虽然能有一个特定产业支撑的只有算法新闻,但是不排除今后小说、诗歌背后也出现比较稳定的、庞大的产业支撑,该权利也就可以将它们纳入进来,实现一起保护。
其次,算法新闻的权利内涵及其保护期限。算法新闻本质上是一种智能独立生成的数据成果,因此,可将算法新闻的邻接权称为“数据智能聚合权”,具体含义是指传媒组织对其以大数据为基础并通过人工智能技术自动生成的新闻数据成果的权利。该概念内涵应从以下几方面进行理解:其一,权利客体是新闻数据成果,而非其他形式成果,如小说、诗歌、报告,强调数据信息的及时性、客观性、价值性,而不问是否具有“创造性”。其二,权利名称中的“聚合”是指:“对有关的数据进行内容挑选、分析、归类,最后分析得到人们想要的结果,主要是指任何能够从数组产生标量值的数据转换过程。”强调数据挖掘和再生,这也就同数据资料集合(选择与编排)如数据库相互区别开来。其三,该权利不仅仅包括财产权,如发行权、复制权、信息网络传播权,而且还包括署名权,以期实现主体区分,利于传播、销售的目的。鉴于算法新闻生产的批量性或工业属性、内容的时效性和数据性、传播的智能性、表述逻辑的模式性、公私权利间的平衡性,该权利保护期限不宜过长,可以借鉴欧盟《关于数据库法律保护的指令》对数据库保护期15年的规定以及我国《著作权法》对版式设计权保护期10年的规定经验,建议5年为宜。
(二)算法新闻邻接权归属:人工智能所有者或者依协议而定
1.人工智能设计者不具有数据智能聚合权的主体资格
人工智能设计者就是编写人工智能程序的人。人工智能设计者通过机器训练、数据建模将数据筛选的价值观融入程序之中,使其具备价值取舍、逻辑性表达的功能,这个过程和结果都充分体现出该设计者的智力投入。人工智能生产算法新闻虽然不是人工智能设计者的智力结果,但却是通过融入设计者创造性智力劳动的人工智能程序算法运行而得来的。可以说,算法新闻的产生必须以人工智能程序的存在为前提,人工智能设计者为此做出了实质性的贡献。因此,人工智能程序作为一种智力成果,能够受到著作权法的保护,设计者的智力劳动通过著作权法保护获得了利益分配权,得到了创新激励。即便如此,人工智能设计者的创造性智慧仅仅体现在为算法新闻生产提供了一个至关重要的平台、一个能“聚合”大数据的温床,其智力或者意志蕴藏在所设计的人工智能程序里,并不能顺延至该程序所生产的衍生物——算法新闻之中。针对人工智能生产的算法新闻,有学者提出人工智能设计者可以参与到其利益分配之中具有二次获酬请求权,以期获得更多创新激励的观点,本文认为值得商榷。一方面,恰如前述,人工智能设计者的智力贡献在于人工智能程序的产生,对于每一篇算法新闻的表达内容只是提供了技术支持,属于间接的甚至是微乎其微的,因此,从身份来看,设计者就是智能程序的开发者而非算法新闻的固定者或者生成者;另一方面,从激励理论来说,著作权法终极目标在于激励作品的创作与传播,人工智能设计者从程序的版权中可以获得报酬并得以激励其从事人工智能程序的开发与创新,为市场提供更加先进的智能产品,但是,若从制度层次再给予设计者对算法新闻权益的享有,不仅因其获取双重激励而违背激励制度的设置初衷,而且,因再次付费增加传媒组织的使用、生产成本,有损于传媒组织购买人工智能的积极性。因此,人工智能设计者对算法新闻并无权益主张的资格。
2.数据智能聚合权归属人工智能所有者
人工智能所有者就是对人工智能拥有所有权的人,这里不再赘述那些因设计付出智力劳动而享有著作权或者所有权的人。对于算法新闻而言,人工智能所有者就是购买了人工智能程序或者研发人工智能程序留归自己使用的传媒组织,比如拥有“快笔小新”的新华社。新华社机器人写作系统分为数据采集、数据加工、自动写稿、编辑签发4个环节,不管新华社是通过支付对价购买人工智能程序还是自己的工程师研发“快笔小新”,在这个过程中新华社不仅付出了经济成本,而且还基于自身需求设置关键词加入意志安排。也正是基于这种投资成本和意志安排,将人工智能程序版权给予新华社或者作为设计者的新华社雇员,符合权利配置公平原则。更进一步的是,有关“快笔小新”生产算法新闻的控制权,应该赋权给新华社,有利于稳定权利,实现“快笔小新”生成算法新闻的传播、利用和再创造。与此同时,也能激励其他传媒组织积极购买人工智能程序,满足程序设计者的利润需求,推广人工智能在新闻生产之中的应用。当然,如果不能将人工智能生产的算法新闻赋权给购买人工智能程序的传媒组织,那么势必造成传媒组织难以回收之前购买人工智能程序的成本以及之后使用该程序生产算法新闻的人工、电力、设备磨损等成本,作为理性市场主体的传媒组织也就不会做出购买人工智能程序的决定,卖不出去的人工智能程序也就难以支撑最初设计者继续研发的动力,人工智能产业也就会难以为继。
五、结语
从算法新闻的生成逻辑和属性定位考察,算法新闻本质上是一种智能生成的数据成果,在法律属性上具有客体性和财产性,因此,将其纳入邻接权制度进行保护具有正当性和合理性。同时,建议在邻接权制度中创建“数据智能聚合权”,与现有的表演者权、录音录像制作者权、广播组织权、出版者版式设计专有权等四项权利并列。在权利归属方面应采取以“谁投资谁受益原则”为主,以“意思自治原则”为辅,通常确定由传媒组织享有专有权,对于人工智能设备属于租赁等特殊情况,由“合同约定”来确定权利归属。因此,本文建议在《著作权法》第四章中增加“第五节数据智能聚合”,该节应包括三个条款:其一,传媒产业人工智能所有者对人工智能程序聚合大数据而生成的数据成果,享有署名以及许可他人复制、发行、通过信息网络向公众传播并获得报酬的权利;权利的保护期为5年,截止于该制品首次制作完成后第5年的12月31日。其二,将数据智能聚合成果用于有线或者无线公开传播,或者通过传送声音的技术设备向公众公开播送的,应当向人工智能所有者支付报酬。其三,传媒组织与人工智能所有者不重合情况下,算法新闻归属由当事人约定;没有约定或者约定不明确的,由传媒组织享有。
载《新闻与传播研究》2022年第3期
囿于篇幅,公号舍去注释,完整版本请见刊物。
编辑 | 高源昊