查看原文
其他

当计算机程序遍历诗歌的所有汉字组合,其生成物能否构成作品?——关于刘慈欣《诗云》的畅想

王宇扬 不能使用该名称 2020-08-31
来自专辑
法学问题研究系列文章
上周在陈绍玲老师的知识产权案例研习课上,我们讨论了人工智能生成物能否构成著作权法意义上的作品。当然,这一问题早已在王迁老师主编的教材和相关论文中盖棺定论——人工智能生成物基于模板和算法,属于执行既定流程和方法得到的运算结果,毫无智力创造的空间,因此无疑不属于著作权法保护的“包含人类智力创造”的作品。
其论证过程为:
大前提:作品的构成要件包括独创性中的“独”和“创”,在“创”的方面包括:a.存在个性化判断和选择的空间(最低限度的创造性);b.达到某类型作品的独创性要求。对于前者,具体来说即:如果一个内容在思想和条件一致的情况下,不同人创造的内容具有一致性,就排除了实施者发挥聪明才智的空间,完全失去了个性化的可能性。
小前提:当不同人不同计算机上基于同一套人工智能计算机程序选取同样的素材(数据库)在同样的条件(算法)下生成的内容完全或几乎一致,其最优策略甚至是完全一致的。这就说明人工智能在生成文字过程中,可供“某一主体”个性化判断和选择的空间不存在或几乎不存在。
结论:因此人工智能生成物不属于包含个性化判断和选择的智力成果。

必须强调的是,这一论证过程,实际还包括两个隐藏的逻辑:
首先,检验内容生成过程中是否具有创造性的前提条件,是必须确定特定内容创造过程的起始点和结束时间;人工智能创造过程起始点取决于程序实际开始“生成文字”的时点,而程序运行前的“设计程序代码、进行选项配置”等仅为创作启动的条件设置,与创作过程本身无关
机器基于算法和概率产生的文字组合,只是死板运算,其体现的“智能性”与人的“智力”、“个性化判断和选择”完全不可比。

这两个隐藏的逻辑即成为了很多反对者的攻击方向,对应的,诞生了两种反对观点,主要观点如下:
观点一,基于对“创作启动时间节点”的不同理解,他们认为:计算机程序本身的编写和预先调试即为机器在“创作过程中”的个性化判断和选择换言之,他们认为:在编写程序过程中,程序未来生成内容的“创作”实际上已经“提前”开始了——和传统的文学作品创作不同,前者“个性化判断和选择”与“实际的内容创作过程”基于“一定的技术原因”被割裂开了
观点二,基于人工智能实际创作结果的“变化万千”,他们认为:即使在条件(程序、算法、素材)一定的情况下,生成的内容依旧有极为庞大的可能性(,即认为王迁老师在论证过程中所说的“一定条件下生成的结果完全相同”只是一种假象)。而从这一实际结果,他们反推得出人工智能在创作过程中依旧有相当大的个性化判断和选择的空间。例如,假设一段音乐的第一个音符是C,基于算法,“下一个音符是D”的概率为50%,那么人工智能音乐创作机器最终创作的结果有一半的概率是以C、D为首的音乐,也有一半的概率不是以C、D为首的音乐,而可能是C/#E、C/降F、C/G……
当然,由观点二还延伸出了另一种相似逻辑:他们认为既然人可以毫无阻碍地理解人工智能生成物,即能反推得出人与机器在创作过程中所运用的逻辑是一致的,因而关于“智能”、“个性化判断”的内涵也是一致的、共通的。

对于上述两种反对者的攻势,我们逐个讨论。

观点一着眼于程序员编程和机器运行的关系,认为:在考量生成内容的创造性时,应当将程序员的“努力”囊括在内,其论证方式又分立为两种:①人工智能创作时存在“思想外化为表达前的个性化判断表达实际产生的过程相分离”的特殊性;人工智能仅是创作者表达的工具。
第一种论证方式的意思是,传统写作过程中,作家是一边进行个性化判断和选择,一边实际将表达写出来的,两者同步进行;但人工智能程序运行生成的表达,其创造性不是在程序运行过程中体现的,而是提前体现在了程序员和操作人员的预先设计和设置之上。
这种说法不无道理。机器本身无法脱离程序制作者而自行运转,其运行的逻辑和结果很大程度上是程序编写者“思想”或“表达”愿望的延伸。程序编写者对其运行过程和结果实际上掌握了极其强大的控制权,他可以决定生成的文字是财经新闻还是体育新闻、他可以决定程序自动运行时在第一段采用数据还是专家证言、采用的比例是多少、在文章结尾是否要对某些词语的定义作出阐释……这些内容的控制几乎与程序员事先配置的代码是完全一一对应的。这一思想也体现在了人工智能第一案(腾讯Dreamwriter案)的法官论证中

涉案文章的生成过程主要经历数据服务触发和写作智能校验和智能分发四个环节。在上述环节中,数据类型的输入与数据格式的处理、触发条件的设定、文章框架模板的选择和语料的设定、智能校验算法模型的训练等均由主创团队相关人员选择与安排。涉案文章的创作过程与普通文字作品创作过程的不同之处在于创作者收集素材、决定表达的主题、写作的风格以及具体的语句形式的行为也即原告主创团队为涉案文章生成作出的相关选择与安排涉案文章的实际撰写之间存在一定时间上的间隔。本院认为,涉案文章这种缺乏同步性的特点是由技术路径或原告所使用的工具本身所具备的特性所决定的。

(2019)粤0305民初14010号
但问题在于,程序员创造人工智能程序,其本身已经将一种思想外化为了表达(程序代码),而这些代码的设计在人工智能软件领域有充分的个性化选择空间,当程序设计体现了足够质和量的创造性时,程序本身已经成为了受著作权法保护的作品。因此我们不难发现,程序员在敲代码过程中爆发出来的创造性,与后续生成出来的一篇篇文章的“思想外化为表达的过程”是完全无关的因为前者外化为代码的思想是一种“将文字生成自动化”的理念,而后者则对应到具体文章中所要表达的思想,例如一篇生成的财经文章表达的是“汇集信息、给人们带来有用的数据以帮助阅读者投资”的思想。
因此,当我们判断独创性时,也必须要充分确认,某人在某个环节付出智力劳动所对应的思想,究竟是不是法律正在评价的客体本身(所对应的思想)。我们发现,程序员在程序设计时基于个性化判断和选择的智力成果,已经通过程序本身的著作权得到了保护。而当程序代码被执行,即使其生成的内容依旧富含程序本身所反映的智力创造的印记(例如一篇财经文章因其是电脑创作的而大受追捧),也不应将生成物的智力功劳归于程序设计者、或是将其与软件本身的创造性强加关联。
因为。只要进一步将同样的逻辑放到其它计算机程序生成物的例子中,其荒谬之处就更加明显。
例如,运用美图秀秀app“智能增强”功能处理自己的摄影作品,“智能增强”功能的代码当然富含程序员的智力创造(例如画面明暗的调解、色彩调整的触发阈值设定等),那么经此功能处理后的摄影作品是否因为其刻上了上述功能的创造性印记就因此成为了程序员的作品呢?按照法院的逻辑,摄影师一旦使用美图秀秀处理照片,所有处理后的照片将成立一个新的演绎作品,其著作权将归属于美图秀秀,但事实上程序设计者并没有对这个“新作品”的产生付出任何劳动。相反,当我们将新生成物的生成过程和程序设计本身正确地割裂开时,就能基于独创性标准论证:经程序处理后的内容实际上并没有在原作品基础上体现任何新的创造性(或没有新的智力创造活动),因此处理前后,原作品还是原作品,并不会产生一个新的作品。
因此我们可以看出,法院的论证实际上非常勉强,没有将程序设计和程序运行过程一刀两断,而是先验地、强行地将两者捆绑在一起,视为同一个创作的不同环节,这是与客观事实不符的。

那么,我们退一步,即使我们假设一个同时具备计算机编程能力的新闻主编,他就是要用人工智能的方式产出文字,那么程序设计就必然是文字创作过程的一部分了吗?老师认为,事实上,其依旧只能相当于创作前的筹备或是创作启动的条件设定,而并非创作过程本身。陈老师在课上举了一个例子——研究生导师指导学生创作论文。
研究生导师给学生安排一篇论文的研究方向、指导其论文的具体框架和可供参考的素材,这种指导过程隐含的思想对之后学生创作的论文的思想也有极其强大的影响,那么,学生完成论文所反映的思想与研究生导师在论文筹划阶段的思想一致,是否能推导得出——论文创作过程的实际启动起始于研究生导师对学生的指导?这显然是荒谬的。虽然将“研究生导师对学生的指导”和“程序员对人工智能创作机器的编程”相类比,仍有勉强之处,但我们至少判断得出:“一个作品启动前的酝酿”与“创作启动后实际的表达过程”之间具有清晰的分界线。

对于观点一想法,还有另一个方向的论述,即认为:人工智能写作机器只是编程者写作的工具。这就陷入了对人工智能程序完全不同的认识,即认为人工智能机器完全是程序员写作的工具——就如同摄影师与单反相机的关系一般。因此进一步推导可以得出:人工智能生成物本质上是编程者创作的作品,仅仅因为技术更迭而与传统写作方法有所不同。
这一看法的不恰当之处在于,其对作者与创作工具的关系理解有误。摄影师通过改变摄像机的角度、光圈、对比度、焦距等直接进行摄影作品创作,在此过程中,人对摄影工具实际成像过程的介入程度是无限高的。正如陈老师列举的另一个例子:即使人训练并教唆猴子在图书馆楼顶对着明法楼拍照,此时猴子依旧不能被视为此人的拍摄工具,除非这个人的人脑和猴脑直接相连,进而使得人对于猴子拍摄时的介入程度达到与前者一致的高度。(或者我在某些纪录片曾看到人仿制的机器人猴子,人可以直接对其进行操控并利用隐藏摄像头拍摄。)而程序员编写完程序之后,对于程序运行时生成的文字结果,并没有介入的可能性。一定要注意!有人会认为这句话和上文中“程序员对结果有极其强大的控制力”是自相矛盾的,但是我在这里所说的介入,指的是文章本身的思想外化为表达的过程,而非程序的理念外化为代码的过程。因此,陈老师让我们谨记:不能抛开思想和条件谈创造性!


论证到这一步,我终于可以开始谈谈这篇文章的标题——当计算机程序遍历诗歌的所有汉字组合,其生成物能否构成作品?
我们之所以容易被观点一所蛊惑,是因为我们很容易将程序的设计所体现的思想和机器生成的文章所反映的思想同一化,但实际上,这种同一只是一种表象。
在刘慈欣小说作品《诗云》中,描述了一个来自高级文明的人,认为地球古代时期中国诗人创作的诗歌、词等作品只是一些小伎俩,(对于高级文明的人来说)毫无“智力”可言。为了证实他的这种贬低,他决定创造一个程序:按照诗词的结构和规则,遍历所有(共计3000多个)汉字的组合——这样,他就能创作出从古至今一切被人赏识的佳作,甚至,他也将未来一切的创作可能性都已经穷尽了。
这是一个多么浪漫的想法,甚至,这个程序的代码其实仅具有非常低的技术要求,即使是现代的人也可以轻易编写出“达到这个程序要求”的代码(,其本身和“将1、2、3数字的组合可能性‘123’‘132’‘ 213’‘ 231’‘ 312’‘321’穷举出来”的原理没什么区别,)问题仅仅在于3000个汉字的排列组合数量极其庞大,对于地球的科技水平来说,没有任何一种介质可以存储这样海量的“信息”。因此,高级文明的人运用一种“神秘”的技术,将构成万物的原子用来存储二进制信息,在程序运行中,它甚至将太阳熄灭了。
当程序运行完毕之后,程序的创造者却认输了,因为他突然意识到:他永远没有办法达到古代诗人李白、杜甫等人的作品高度,因为他发现——将所有的组合生成出来并不意味着佳作就自动映入眼帘,最终还是需要诗人将一个个佳作从程序生成的海量信息中挑选出来,这本身不就是一部作品的全部创造过程吗?而程序,创造出来的,只不过是一堆混沌、无用的垃圾罢了。
这个作品所反映的哲学内涵曾经令我非常震惊,而当我学习了著作权法的作品概念之后,我才又将《诗云》的记忆从脑海深处拾回来。
我们回想作品中的那个程序,不禁恍然大悟,这个程序和当今的人工智能写作机器,又有什么本质上的区别呢?程序的思想是遍历所有组合,即使他包含“创作一部好诗”的理念,其生成出来的万千个组合中的李白的佳作的思想,又和“创作一部好诗”的理念有什么关系呢?难道李白在创作作品之时满脑子都在想着名垂千古吗?这时,你能说,这首被挑选出来的李白的作品,是程序创造者的智力劳动成果吗?答案显然是否定的。
因此《诗云》这个故事太过于生动,以至于我认为应该将其作为著作权法独创性讲解课程中的经典案例,这个故事很容易就能化解人们对程序设计和程序运行之间的混淆。

因此,在讲解这个故事以后,上文中反对者的观点二事实上已经不攻自破了。即使是一个最简单的遍历文字组合的程序,都能生产出李白的佳作,难道可以说这个程序已经达到了和李白一样的智力创造性高度了吗?
这其实是人们被程序运行结果的表象蒙蔽了双眼。回到那个音乐创作的例子,究竟是以C/D音调为首,还是以C/#D音调为首,这种选择对于人们来说,是完全基于自己的思想和个性的,但对于计算机程序来说,它只会死板地调用算法结果,成为算法和概率论的“奴隶”,究竟是创造CD还是C#D,根本就没有任何程序模块进行过实际的“像人一样的”思考和酝酿。因此,表面上,它能创造无数种选择,但这种选择的空间,和人将思想外化为表达的选择空间是不可类比的,因为前者毫无能动性,而后者充满了能动性。
这就是为什么,一个朋友和我感慨道:计算机程序或许可以模仿巴洛克时期的对位和古典时期的功能和声,但它永远也学不会印象派的“捉摸不透”。
因为,前者是有规律的,后者,则是反规律、反常态的;换句话说,它其实最终是反“以数学规则为生命”的人工智能的
这是第一堂知识产权案例研习课留下来的一些思考和整理,聊作备份。为了避免文章可能出现的错误误导阅读者,我特地开通了留言互动小程序(在最下方),请各位大佬们对于本文的问题予以批评指正!万分感谢!



参考论文:
①王迁. 论人工智能生成的内容在著作权法中的定性[J]. 法律科学-西北政法大学学报, 2017, 035(005):148-155.
知识产权法教程 第6版. 王迁著. 北京:中国人民大学出版社(2019年1月第6版)
③孙山. 人工智能生成内容著作权法保护的困境与出路[J]. 知识产权, 2018, 000(011):60-65.

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存