孙远钊 | “人工智能”与美国著作权法:对应和挑战
【摘要】当一位知名的作家向人工智能应用ChatGPT提问对自己的作品的意见时,ChatGPT在极短时间就生成了一篇非常详尽的摘要和分析。但这也强烈意味著开发这款人工智能工具的企业OpenAI没有经过作者的许可,就通过对其作品的全部或绝大部份复制,对ChatGPT进行了“深度学习”。究竟这是否构成著作侵权行为,抑或合理使用?目前已成为美国法院必须面对和处理的问题。另一方面,人工智能的生成物是否应该获得著作权的保护?目前美国版权局新出台的政策和联邦地区法院的判决已提供了初步的答覆:只有自然人才具有“作者资格”,也只能从“作者”的独创表达才能获得著作权的保护。但是在这个看似简单明了的基本原则背后,却还有著一连串既有趣、又复杂的问题需要厘清。本文拟对美国著作权法制体系如何对应近来人工智能发展所带来的挑战进行一个比较详细的梳理,包括检视目前引起了许多关注的八个关于侵权、一个关于赋权的“测试案件”,并提供未来应如何继续有效对应的前景分析。【关键词】人工智能、著作权、深度学习、独创性、合理使用
人类天生喜好模仿。[1]也以此作为学习和求生的本能,让本来在几乎各个方面与其他动物相较都不具优势,且对自身非常不利的环境下,却能运用唯一的工具 —— 智慧,不断地尝试、探索、适应而生存了下来,并登上了食物链的顶端,成为当前地球上最具优势的物种。也正是因为人类的好奇、探索和模仿促成了各种创新与发明。[2]人类除了模仿周遭的人物,也同样期待“被模仿”并以此为基础从事更多的附加创新。自古以来已经出现了以人类自己为核心(或“拟人化”的呈现anthropomorphizing),再结合不同物种的优势形成更优的“超人类”便不断在许多的神话和传说之中出现,如狮身人面、人马兽等等。
一个直接反应了这个人类特性的著名神话故事是,属于半人半神的普罗米修斯(希腊文:Προμηθεύς/ Promētheús)从奥林匹斯山(Όλυμπος/Mt. Olympus)偷了火种送给人类。当众神之王宙斯(希腊文:Ζεύς/Δίας)得知此事之后大怒,于是命火神赫菲斯托斯(希腊文:Ἥφαιστος、英文:Hephaestus)用黏土打造出了世间第一位女性潘朵拉(希腊文:Πανδώρα、英文:Pandora),另铸造了一个让她随身的金属“盒子”(其实应该是个坛子(πίθος/pithos),却一直被误译)送给人类作为惩罚。宙斯的妻子赫拉(希腊文:Ἥρα/Ἥρη、英文:Hera)则赐予了好奇心给她。她因为自己的好奇心打开了那个金属盒子,结果释放出了所有邪恶到人间:贪婪、虚伪、诽谤、嫉妒、痛苦、战争等等,等她把“盒子”盖上时,只剩“希望”(Elpis)还留在其中。[3]火神赫菲斯托斯的另一项“成就”是用青铜打造了一个名叫塔罗斯(希腊文:Ταλως、英文:Talos)的机械巨人,具有高度的智慧,能自动操作,帮助宙斯守护克里特岛(希腊文:Κρήτη、英文:Crete)。
关于塔罗斯的神话故事应是目前已知最早的、涉及到今天被称为“人工智能”的记载之一,也足证这样的想法(哪怕还只停留在纯粹属于想像或幻想的阶段)自古早已有之。从古以降,无分东西文化,各种具体的尝试也从未间断,诸如人工服务员、自动杀人的器械、不计其数的监视控制系统和娱乐工具等等,诚可谓渊远流长,各家文化皆所见略同。[4]
当代“人工智能”的滥觞一般是溯及到英国的艾伦·图灵(Alan M. Turing, OBE FRS, 1912-1954)博士(被誉为计算机科学与“人工智能之父”)和于1956年夏季在美国举行的“达特茅斯会议”(Dartmouth Conference)。图灵在他的经典论文中开宗名议题出了一个问题:“机器能思考么?”继而以“模仿游戏”(The Imitation Game)来论证这个命题的荒谬性与可能的思路,并推导出了著名的“图灵测试”(Turing Test)和符号操作可能就是人类思维的本质的新思路。[5]“达特茅斯会议”则是正式确定了以“人工智能”作为研究领域的称谓以及系统性地梳理出了多个相关的理论和未决的问题,对未来的研发提供了一些可行的具体方向,指出“学习或智能的任何其他特性的每一个方面都应能被精确地加以描述,使得机器可以对其进行模拟”。[6]从此“人工智能”的发展经历了70年的筚路蓝缕和多次的起伏,有时获得了一定的成功、突破,也遭遇了许多的瓶颈、挫败甚至倒退。[7]
一、概念定义
二、原理与操作
一、输入端
(一)“崔布雷诉OpenAI集体诉讼”案
(二)“匿名作家诉OpenAI集体诉讼”案
(三)“西尔弗曼诉OpenAI集体诉讼”案
(四)“盖蒂图像公司诉稳定迭代人工智能公司”案
(五)“安德森等诉稳定迭代人工智能、Midjourney和DeviantArt公司”案
(六)“匿名者诉GitHub、微软及OpenAI”案
(七)端倪、问题与挑战
二、输出端
(一)美国版权局的政策
(二)司法实践与发展
(三)争议与评论
无论是摄影机、录像带、复印机、多媒体计算机、互联网点对点分享……等等,历史经验已一再表明,每当有新的科技产生并获得了市场的接受,随著该科技应用的不断扩展,就常会与既有的内容提供者让产生市场的竞合与各种摩擦和冲突,其中的一道主要战线便是著作权。归根结底,在表面上各种科技便利的背后,牵涉到的是整个相关资源与“利益大饼”的重新分配。目前牵涉到人工智能应用的各种争议也不例外。
“人工智能”迄今还没有一个国际公认的定义,但从各个不同的既有定义中可以归纳出一个共通点:人工智能系统是一种整合模型和算法的信息处理技术。已知的人工智能相关问题大体涉及到能力(Power)、可能(Possibility)与危险(Peril)三个面向(或可称为“3P问题”)。讨论人工智能与著作权的关系,包括应如何对应和潜在寓含的风险时,也同样、同时涉及到这“3P问题”:在输入端,这套工具是否因必须从网络上大量复制既有的素材从事“机器学习”却构成了著作侵权抑或可以主张合理使用?假如不涉及侵权或可以构成合理使用,在输出端,其生成物是否可以受到著作权的保护?
第二届图灵奖得主艾兹格·迪科斯彻(Edsger W. Dijkstra)教授曾在1984年计算机协会中南地区会议上发表的主旨演讲中表示:“电脑是否能思考的问题就与潜水艇是否能游泳的问题同样相关。”[84]于是由此产生了“潜水艇是否会‘游泳’”的有趣问题。这个问题其实是个悖论,毕竟一个具有潜水功能的机器与一个游泳的人之间完全没有可比性,如果硬要用人类对“游泳”的概念去套用到一个毫无生命的机器,势将产生相当荒谬的结果:诸如如果潜水艇真会“游泳”,那么坐在潜水艇里的人呢?是不是也跟著在“游泳”?假如是一艘无人潜艇,那么在陆地上遥控操作无人潜水艇的人是否也在“游泳”?因此,用人类的游泳比赛规则来规制潜水艇是否合适?
这也表示,至少在现阶段,如果人们总是不自觉的用一种“拟人化”的寄情投射去看待人工智能,无法以软件程序当中设定的逻辑算法来看待这个已经发展了70馀年、最近再次推陈出新的机器工具,就很容易造成自我误导。毕竟人工智能最大的问题是没有常识,因此从不保证其生成、输出的结果正确无误,也无法确知是否已排除了侵权的因素和“瞎编胡诌”的风险,因此不能被寄予信任。[85]人类已经投入了几十年去尝试解决,但迄今仍然未果,也成为人工智能继续发展的“阿喀琉斯之踵”(Achilles’ heel,即可致命的短版)。前已提及,机器的“深度学习”基本上是统计工作,是个收集大规模的数据然后进行快速计算和推导的过程,因此与人类的原创表达完全不是同一个概念,也恐怕无法从事类比,否则就与“潜水艇是否会‘游泳’”的悖论如出一辙。
虽然社会对人工智能的讨论和应用在近来风起云涌,也让相关领域受到了各大、小投资者的青睐,一时间获得了前所未见的资源投注,但或因其中过程的不公开与不透明,极大程度加深了外界的疑虑甚至惶恐,于是也同时兴起了一波著作侵权和其他类型的诉讼。只要其中出现侵权成立的判决,就几乎注定还会有更多的后续诉讼纷纷出笼。这显然会大幅提高人工智能产业后续发展的成本与市场准入门槛,对相关的创新研发也势将造成很大的负面影响。鉴于这些诉讼通常会旷日持久,除非各方能达成诉前和解,整个领域在未来的相当时间当中恐将限于许多不确定的状态。
无论如何,对于人工智能引发的种种问题和争议,首先必须厘清,一旦发生问题,究竟应当由谁来承担责任?当人们还在争论是否应该对人工智能的生成赋权时,或许可从反向审视:是不是首先必须厘清应承担责任的主体,才能接著探究是否应对该主体赋权?现时看到的状况通常是,凡是一提到赋权只见众家争抢,互不相让;但只要发生了问题,一触及义务与责任承担,则只见各相关当事人开始相互推托或彼此交相指责。本文启始摘引了著名的罗马法法谚:“无救济即无权利”(ubi jus ibi remedium),即拟建议以此做为处理相关权责问题的基本准绳。
即使在是否需要对人工智能生成物赋权的讨论上,从来不是否定只有自然人才可具有“作者资格”(反面的意义便是:凡是由机器自动生成的物件无法获得著作权,因不具独创性),也不是只能在“全盘否定”与“当然赋权”两个极端选项之间做出互不相容、绝对排斥的政策选择,而是要探讨在特定、某种人类可控的程度与范围内,人工智能生成物是否应像当年对摄影作品的保护认定一般,也可受到某种权益保护?即使能跨过或绕开作者资格的门槛给予著作权保护,权利应该归属于谁?保护的标的是什么?范围又应如何?在纽约现代艺术博物馆展出的“瑞非克‧安那多尔:无人监督”特展,投射在屏幕上的呈现从不重复,无时无刻都随著周遭环境在变化,所以显然没有“固定”(fixation)。这如何来界定权利?
通过本文的分析可见,正如同打开了“潘朵拉的盒子”一般,一个表面上看似简单的问题却牵引出更多更难以处理的其他难题。也就意味著即使要考虑赋权,著作权显然并不合适,不是好的政策选项,毕竟著作权法的主要目的是为了激励人类从事文化、艺术与科学的创作和保护文化资产,著作权本身也是一种公开换保护,有创作才会赋权。人工智能的代码既然不公开,就不需要换取保护,机器并不需要得到激励,不应用拟人化的角度去看待其生成物。因此,或许应探讨是否要另行创设某种特殊、单独的权利(sui generis right)给予某些有限的保护,但是其中还是有太多的未知和困难需要进一步厘清、克服,千万不能冒进;抑或就通过厂家“自律”的方式(例如让使用者签订协议,就与现行进入任何网站或使用数据库必须先行同意才可进入的做法相似),反而可以获得更大的效益。对此或可参酌上世纪90年代欧盟与美国对于是否应对数据库给予某种赋权保护引发的巨大辩论(不过却有个共识:数据本身推定无法赋权)。[86]欧盟选择了用特殊赋权的方式保护数据库,但却导致发生了许多的问题,后来不但遭到欧盟法院以四个判决对此严格设限,[87]且最终自身进行的两次实证调研也显示成效不彰。[88]其中一个最遭诟病的批判是,此种赋权犹如“掩耳盗铃”,背后真正的目的是为了保护特定的投资利益,早已悖离了以公开换保护、公示公知的基本原则。毕竟投资本来应是风险自负。制定特别法来保障特定投资利益不啻以立法手段(公权力)变相促进特定企业或商业利益形成更大的垄断。
有鉴于此,或许诚如《纽约时报》专栏作家埃兹拉•克莱因(Ezra Klein)所言:“我们如此执着于思考这项技术能做什么,以至于忽略了更为重要的问题:它将如何使用?谁又将决定它的用途?……还有一个更平庸但或许更紧迫的问题:这些机器将服务于何人?”[89]他认为人工智能并非真正在为消费者服务,而是听命并服务于投资者的利益:“我们谈论人工智能的技术太多,却基本忽略了驱动人工智能的商业模式。加之这样一个事实:人工智能的吸睛展示,仅服务于吸引巨额投资和收购报价的炒作周期这一种商业模式。”克莱因并引述了人工智能公司Hugging Face的首席伦理科学家玛格丽特·米切尔(Margaret Mitchell,也是原谷歌公司从事人工智能研究的一位关键领头人)一针见血的评论:人工智能不是为预测事实而生,它们实际上是为了编造看起来像事实的东西而生。”[90]最危险的状况是人们被智能工具操控与说服,其实还是一小群人在设法控制多数的人,毕竟机器工具背后的操控者是程序设计者和商业利益。
人工智能或许是另一个由普罗米修斯带来的火种,也可能是另一个潘朵拉的盒子,更可能是两者兼具。在人类玩起这把新火的过程中,是否会一方面成就了更多以往难以迄及的成果,另一方面却又因为各种的自我误导、法律风险把自己给推回了山脚下,然后必须重头来过?此时才赫然惊觉,原来自古以来的神话一直是面镜子,从镜中看到的那个普罗米修斯原来就是人类自己的映照!
注释(上下滑动阅览)
【1】Francys Subiaul, What’s Special about Human Imitation? A Comparison with Enculturated Apes, 6 Behavioral Sciences 13 (2016), at https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5039513/.
【2】Benoit Godin, Innovation: The History of A Category, Project on the Intellectual History of Innovation Working Paper No. 1 (2008), available at http://www.csiic.ca/PDF/IntellectualNo1.pdf.
【3】 Hesiod (Ἡσίοδος、中文:赫西俄德), The Theogony (Θεογονία、中文:《神谱》), Lines 545-616 and Works and Days (Ancient Greek: Ἔργα καὶ Ἡμέραι、中文:《工作与时日》), Lines 42-53(赫西俄德在《神谱》中并未提到那位被塑造的女性名字,但因为在《工作与时日》的长篇教训诗当中有了更详细的描述和正式的姓名,且与《神谱》中所描绘的情节高度近似,因此后世的学者咸认前者所指称的就是潘朵拉)。
【4】对人工智能发展历史的完整介绍与说明,可参见Pamela McCorduck, Machines Who Think: A Personal Inquiry into the History and Prospects of Artificial Intelligence, 2nd ed. (Boca Raton, FL: CRC Press/Taylor & Francis Group 2004);另参见E. R. Truitt, Surveillance, Companionship, and Entertainment: The Ancient History of Intelligent Machines, MIT Press Reader, November 24, 2021, available at https://thereader.mitpress.mit.edu/the-ancient-history-of-intelligent-machines/。
【5】 Alan M. Turing, Computing Machinery and Intelligence, 49 Mind 433 (1950).
【6】同上注,第111页以下。这项会议的正式名称是“达特茅斯人工智能暑期研究项目”(Dartmouth Summer Research Project on Artificial Intelligence),从1956年6月18日到8月17日左右在新罕布什尔州汉诺威(Hanover, New Hampshire)的达特茅斯学院(Dartmouth College,长春藤盟校之一)以密集“头脑风暴”(brain storming)的“作坊”(workshops)方式举行,由时任该校数学系的一位年轻助理教授约翰‧麦卡锡(John McCarthy)召集组织,原来预定邀请10人,但最终共有20馀名学者专家全程或部份参与了这个会议。在此之前,对“思考型机器”(thinking machines)的研究有多种不同的名称,如控制论(cybernetics,是研究生命体、机器和组织的内部或彼此之间的控制和通信的科学)、自动机理论(automata theory,是把离散数学系统的构造,作用和关系作为研究对象的数学理论)或复杂信息系统处理(complex information processing)等,反应出各自的主要取向。
【7】Daniel Crevier, AI: The Tumultuous History of the Search for Artificial Intelligence (New York, NY: Basic Books: 1993).
【8】Merriam-Webster’s Ninth New Collegiate Dictionary (Springfield, MA 1985), at 106 (artificial: 1. humanly contrived often on a natural model : man-made; 2. lacking in natural or spontaneous quality; 3. imitation, sham. artificial intelligence: 1. a branch of computer science dealing with the simulation of intelligent behavior in computers; 2. the capability of a machine to imitate intelligent human behavior)[Emphasis added].
【9】U.K. Defence Science and Technology Laboratory (Dstl), Building Blocks for AI and Autonomy: A Dstl biscuit book/Guidance: Core Elements of AI (23 October 2020), available at https://www.gov.uk/government/publications/building-blocks-for-ai-and-autonomy-a-biscuit-book/core-elements-of-ai.
【10】Alyssa Pagano, Repairing Organs With the Touch of a Nanochip: This New Device Changes the Function of Cells by Injecting Them with Synthetic DNA, IEEE Spectrum, 12 August 2017, available at https://spectrum.ieee.org/repairing-organs-with-the-touch-of-a-nanochip.
【11】联合国科教文组织,《人工智能伦理问题建议书》(2021年11月23日),第10页(一、适用范围第二点),载于https://unesdoc.unesco.org/ark:/48223/pf0000380455_chi。
【12】同上注。
【13】European Commission (EC), Proposal for a Regulation of the European Parliament and of the Council Laying Down Harmonised Rules on Artificial Intelligence (Artificial Intelligence Act) and Amending Certain Union Legislative Acts, COM(2021) 206 final (21 April 2021).欧州议会(European Parliament)已于当地时间2023年6月14日以499票赞成、28票反对、93票弃权通过了这个草案的修正版本(文本内容尚未对外公布)。目前全案已移送欧盟理事会(European Council)审议,也是本案成为正式立法需要通过的最后一关。
【14】其原文为:“‘artificial intelligence system’ (AI system) means software that is developed with one or more of the techniques and approaches listed in Annex I and can, for a given set of human-defined objectives, generate outputs such as content, predictions, recommendations, or decisions influencing the environments they interact with” [Emphasis added]。
【15】EC, Annexes to the Proposal for a Regulation of the European Parliament and of the Council Laying Down Harmonised Rules on Artificial Intelligence (Artificial Intelligence Act) and Amending Certain Union Legislative Acts, COM(2021) 206 final (21 April 2021).
【16】 “人工智能”常见的算法包括,但不限于:线性回归(linear regression,是利用统计学当中线性回归方程的最小二乘函数对一个或多个自变量和因变量之间的关系进行建模的一种回归分析)、逻辑回归(logistic regression,是离散选择法之一,属于多元变量分析的范畴,常用于社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析等)、深度神经网络(Deep Neural Networks,简称DNN,是模仿生物神经网络的结构和功能(类似于动物的大脑和中枢神经系统)的数学模型或计算模型,由大量的“人工神经元”联结计算,用于对特定的函数进行估计分析;在多数情况下,人工神经网络能在外界信息的基础上改变内部结构,是一种能自动适应的系统,也就是一般所谓的“机器学习”)、决策树(decision tree,主要用于数据挖掘和机器学习,是从对象属性与对象值之间的某种映射关系建立出的预测模型;树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,每个叶节点则是对应从根节点到该叶节点所经历的单向输出路径所指向的对象的值)、线性判别分析(linear discriminant analysis,简称LDA,是利用统计学对费舍尔线性鉴别方法(Fisher linear discrimination,简称FLD)的归纳,试图找到两类物体或事件的特征的一个线性组合,以便能从事特征化或区分)、朴素贝叶斯计算法或分类器(Naive Bayesian algorithm,是一种借助贝叶斯定理的分类算法,也作为一种生成模型(generative model),采用直接对联合概率(P(x, c))建模,以获得目标的概率值)、支持向量机(support vector machine,简称SVM,是一种在分类与回归的过程中分析数据的监督式学习算法)、学习向量量化(learning vector quantization ,简称LVQ,是通过自动学习的演进过程,进行实时的微调,使各个类别的代表点趋近最佳值)、K—最近邻(K-nearest neighbor,又称为KNN算法或K-近邻算法,是一种用于分类和回归的非参数统计方法,采用向量空间模型进行分类,凡是相同类别的案例,彼此的相似度就高,而可以借由计算与已知类别案例的相似度,来评估未知类别案例可能的分类)、以及随机森林(Random Forests®,是平均多个深度决策树以降低变异数的一种方法)……等等。关于人工智能的发展、现况与未来的应用等介绍与分析,可参见Piero Scaruffi, Intelligence Is Not Artificial – Expanded ed. (Seattle, WA: Createspace 2018)(该书2013年第一版的中文译本是,皮埃罗‧斯加鲁菲,《智能的本质:人工智能与机器人领域的64个大问题》(任莉、张建宇 译,北京:人民邮电出版社,2017年1月)。
【17】是一种专门对人工智能(特别是人工神经网络(artificial neural networks)、机器视觉(machine visual)、机器学习操作(machine learning operations,简称MLOps)等功能)从事加速的微处理器或计算硬件系统。
【18】是指输入大量未经筛选、监督的数据,通过数据本身的结构或者特性,由机器建构出不同的标签(pretext),然后即可再以类似监督学习的方式进一步从事训练。
【19】是指使用大量的未标记数据,以及同时使用标记数据来进行模式识别的工作。
【20】参见Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Łukasz Kaiser, and Illia Polosukhin, Attention Is All You Need, paper presented at the 31st Conference on Neural Information Processing Systems (NIPS 2017), available at https://papers.nips.cc/paper_files/paper/2017/hash/3f5ee243547dee91fbd053c1c4a845aa-Abstract.html。谷歌公司另外还使用了所谓的“混合专家模型”(Mixture of Experts architecture,简称MoE,也称为“多专家模型”)作为替代,通过门控(gating)将单一个任务空间划分为多个子任务,再由多个专家网络(子模型)分别处理特定的子任务,最终得到整体的预测结果。参见Noam Shazeer, Azalia Mirhoseini, Krzysztof Maziarz, Andy Davis, Quoc Le, Geoffrey Hinton, and Jeff Dean, Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer, paper presented at the 5th International Conference on Learning Representations (ICLR 2017), arXiv:1701.06538 [cs.LG], available at https://arxiv.org/abs/1701.06538。
【21】参见Ling Yang, Zhilong Zhang, Yang Song, Shenda Hong, Rusheng Xu, Yue Zhao, Wentao Zhang, BinCui, and Ming-Hsuan Yang, Diffusion Models: A Comprehensive Survey of Methods and Applications, arXiv:2209.00796v10 [cs.LG] (23 March 2023), available at https://arxiv.org/pdf/2209.00796 (manuscript submitted to Association for Computing Machinery (ACM))。马尔可夫链(Марков/Markov chain),是根据概率分布,让系统可以从一个状态改变到另一个状态,也可以保持当前的状态。
【22】Harry J. Holzer, Understanding the Impact of Automation on Workers, Jobs, and Wages, Brookings Institution Commentary, January 19, 2022, available at https://www.brookings.edu/articles/understanding-the-impact-of-automation-on-workers-jobs-and-wages/; The Stages of Industrial Revolution and Its Impact on Jobs, February 20, 2020, available at https://www.accountancysa.org.za/the-stages-of-industrial-revolution-and-its-impact-on-jobs/.
【23】Scaruffi, 同前注16。
【24】英文“common sense”一般直译为“常识”,字面上有“共通感知”的意思。《韦氏辞典》的定义是“根据对一个情况或事实的简单观感所得到的合理与审慎判断”(sound and prudent judgment based on a simple perception of the situation or facts),且无须复杂或特殊知识,以平均、可信赖的能力来评断。参见Merriam-Webster Dictionary, available at https://www.merriam-webster.com/dictionary/common%20sense。
【25】王艺璇,【专访】皮埃罗·斯加鲁菲:人工智能并不“智能”,《中国经济报告》,2018年7月23日,载于https://www.sohu.com/a/243015946_485176。
【26】Girl with AI earrings sparks Dutch art controversy, Economic Times (ET) Telecom.com, March 10, 2023, available at https://telecom.economictimes.indiatimes.com/news/girl-with-ai-earrings-sparks-dutch-art-controversy/98543707(莫瑞泰斯皇家美术馆于2022年下半年发起了一项名为“我的珍珠女孩”(My Girl with a Pearl)的活动,向各界征集作品来暂时填补原作空出的位置。结果共收到3,482件作品,并从中挑选了5件轮流展出,这是其中之一。参加活动的作者年龄从3到94岁不等,有的把“女孩”形塑为一个恐龙,有的是一只宠物,也有的是一件水果)。
【27】据报道,安那多尔一共使用了该博物馆收藏的18万件艺术品和38万个图像作为机器深度学习的对象和基础,再通过其本人设计的模型生成了用于特展的所有动态作品显示。安那多尔最早是于2016年在一个名为“野性档案”(Feral File)的平台上运用人工智能技术开创了一个称为“机器幻觉”(Machine Hallucinations)的系列创作,并于2021年首次在该平台上公开发行了“无人监督”的数字作品(使用的是英伟达的桌上型人工智能超级计算机(Nvidia DGX Station A100)加上若干不同商用软件的组合)。参见Kyle Barr, Latest MoMA Exhibit Is an AI-Generated Swirling Hallucination of Other Museum Art, Gizmodo, November 18, 2022, available at https://gizmodo.com/moma-art-museum-ai-ai-art-generator-refik-anadol-1849800994。
【28】Christopher T. Zirpoli, Generative Artificial Intelligence and Copyright Law, Congressional Research Service Legal Sidebar (Updated May 11, 2023), at 3 (quoting a statement of the Patent and Trademark Office).
【29】17 U.S.C. §107.
【30】Campbell v. Acuff-Rose Music, Inc., 510 U.S. 569 (1994); Google LLC v. Oracle America, Inc., 593 U.S. ___, 141 S. Ct. 1183, 209 L. Ed. 2d 311 (2021); Andy Warhol Foundation for the Visual Arts, Inc. v. Goldsmith, 598 U.S. ___ (2023).
【31】The Authors Guild, Inc. v. Google, Inc., 804 F.3d 202 (2d Cir. 2015).
【32】这个名称显然取自英语里的名言:“To wear my heart on my sleeve”。表面的意思是,如果自己的衣服袖子上粘贴了什么,那么谁都可以看得到。所以这是描述一个人容易流露自己的感情,也就是“情感外露”。另也可表示,如果一个人把对某事或人的想法和感受外露,他人就很可能趁机来占便宜或欺负那个人,于是“情感外露”便成了一个弱点。这句话可能源自中世纪的武士以马槊比武(jousting)时在自己盔甲覆手的袖片上标志要把自己的勇气和胜利献给何人(通常是一位女士)。莎士比亚的戏剧作品《奥赛罗》(Othello)首次将这个表述记录了下来。William Shakespeare, The Tragedy of Othello, the Moor of Venice, Act 1, Scene 1, Line 70.
【33】Laura Snapes, AI Song Featuring Fake Drake and Weeknd Vocals Pulled from Streaming Services, The Guardian, 18 April 2023, available at https://www.theguardian.com/music/2023/apr/18/ai-song-featuring-fake-drake-and-weeknd-vocals-pulled-from-streaming-services.
【34】同上注。由40个涵盖了音乐发行领域的各个主要权利人团体于2023年3月16日在“西南偏南”(South By Southwest或SXSW)的年度音乐盛会期间决议展开一个“人类艺术活动”(Human Artistry Campaign),其中包括组建一个全新的娱乐产业联盟(Entertainment Industry Coalition),并揭橥了这7个针对处理涉及人工智能的核心原则。其中最重要的是,要求必须在使用到任何涉及有著作权的作品、专业表演者的声音与肖像等必须经过许可、授权并且合规;政府不应创设新的著作赋权或责任免除从而让人工智能的开发者未经许可或不支付费用对作品等从事利用。详见Kristin Robinson, How Should Artists Face AI? Entertainment Industry Coalition Releases 7 Principles to Support ‘Human Creativity’, Billboard, March 16, 2023, available at https://www.billboard.com/pro/ai-creative-works-principles-artist-groups/。
【35】公开信是致开放人工智能研究中心(OpenAI)、字母表公司(Alphabet, Inc.,谷歌公司(Google, Inc.)的母公司)、元平台控股公司(Meta Platforms, Inc.,原脸书公司(Facebook))、稳定迭代人工智能公司(Stability AI)、国际商用机器公司(International Business Machines Corporation,简称IBM)和微软公司(Microsoft Corporation)等6家企业的总裁或首席行政官(Chief Executive Officer, CEO)。关于信函的全文与签名连署,参见The Authors Guild, Open Letter to Generative AI Leaders, available at https://authorsguild.org/app/uploads/2023/07/Authors-Guild-Open-Letter-to-Generative-AI-Leaders.pdf。
【36】The Authors Guild, More than 10,000 Authors Sign Authors Guild Letter Calling on AI Industry Leaders to Protect Writers, Press Release, July 18, 2023, available at https://authorsguild.org/news/thousands-sign-authors-guild-letter-calling-on-ai-industry-leaders-to-protect-writers/.
【37】Complaint, Tremblay v. OpenAI, Inc., Case No. 4:2023cv03223 (N.D.Ca June 28, 2023).
【38】同上注。
【39】Electronic Communications Privacy Act (a/k/a ECPA), Pub. L. 99–508, 100 Stat. 1848, codified at 18 U.S.C. §§ 2510, et seq.
【40】Counterfeit Access Device and Computer Fraud and Abuse Act, as Ch. 21 of the Comprehensive Crime Control Act of 1984, §2101, Pub. L. 98–473, 98 Stat. 1976, 2190, codified at 18 U.S.C. §1030.
【41】California Invasion of Privacy Act (a/k/a CIPA), codified at California Penal Code §631.
【42】California Business and Professions Code §§ 17200, et seq.
【43】Complaint, P.M. et. al. v. OpenAI LP, Case No. 3:23-cv-03199 (N.D. Ca. June 28, 2023).
【44】Complaint, Getty Images (U.S.), Inc. v. Stability AI, Inc., Case No. 1:23-cv-00135-UNA (D.De. February 3, 2023). 此种解说也称为“元数据”(Metadata),或中介数据、中继数据、诠释信息等,是描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
【45】联邦第二和第九巡回上诉法院已分别在两个牵涉到同一原告的案件中一致认为,作为销售和收付代理的相片图库,除非作者(著作权利人,推定为摄影师)在协议中将著作权一并转让或给予独占许可,图库方面仅凭借该代理协议还不足以具备诉讼资格。参见DRK Photo v. McGraw-Hill Global Education Holdings, LLC, 870 F.3d 978 (9th Cir. 2017), cert. denied, 138 S.Ct. 1559 (2018);John Wiley & Sons, Inc. v. DRK Photo, 882 F.3d 394 (2d Cir. 2018), cert. denied, 139 S.Ct. 237 (2018)。
【46】Complaint, Andersen v. Stability AI, Ltd., Case No. 3:23-cv-00201 (N.D.Ca. January 13, 2023).
【47】Blake Brittain, US Judge Finds Flaws in Artists' Lawsuit Against AI Companies, Reuters, July 19, 2023, available at https://www.reuters.com/legal/litigation/us-judge-finds-flaws-artists-lawsuit-against-ai-companies-2023-07-19/.
【48】美国的司法实践要求,欲证明侵害了著作权利人的复制权,原告(权利人或其独占被许可人)必须举证被告“实际复制”(actually copied)了原告的作品,并与原告受著作权保护的部份或元素“实质近似”(substantially similar)。参见Boisson v. Banian, Ltd., 273 F.3d 262 (2d Cir. 2001); Concrete Machinery Co. v. Classic Lawn Ornaments, Inc., 843 F.2d 600, 606 (1st Cir.1988); Sturdza v. United Arab Emirates, 281 F. 3d 1287 (D.C. Cir. 2002)。目前已有初步的实证调研显示,从Stable Diffusion系统从事有限的随机取样(2千万个图像)当中,扩散模型的确能够从“深度学习”的素材当中复制高清(high-fidelity)的内容,但并非如本案原告所主张的,其所有的生成输出都构成侵权。参见Gowthami Somepalli, Vasu Singla, Micah Goldblum, Jonas Geiping, and Tom Goldstein, Diffusion Art or Digital Forgery? Investigating Data Replication in Diffusion Models, arXiv:2212.03860v3 [cs.LG] (12 December 2022).
【49】Complaint, J. Doe 1 v. GitHub, Inc., Case No. 22-cv-06823 (N.D. Ca. November 3, 2022).
【50】详见GitHub Pages, History of GitHub, contained in Git and GitHub Tutorial, available at https://pslmodels.github.io/Git-Tutorial/content/background/GitHubHistory.html;GitHub, Wikipedia, available at https://en.wikipedia.org/wiki/GitHub。
【51】GNU是个非营利组织,其名称是个“文字游戏”,是指“GNU’s Not UNIX”,也是个递归或递回的定义(recursion definition,使用被定义对象的自身来为其下定义(或自我复制的定义))的首个字母缩写。它的发音是“guh-new”,与牛羚角的发音相同。由其开发出的开源(open source)许可协议现已成为业内通过此种开源方式从事软件开发的一个重要依据。UNIX是1969年由贝尔实验室(Bell Laboratories)开发出的一套能让多重使用者同时从事多重任务(multitasking)的操作系统。LGPL是GNU Lesser General Public License的缩写,可译为“较宽松公共许可协议”或者“函数库公共许可协议”。坊间经常把license译为“许可证”,不但错误且具误导性。
【52】Order Granting in Part and Denying in Part Motions to Dismiss, J. Doe 1 v. GitHub, Inc., Case No. 22-cv-06823 (May 11, 2023).
【53】Metro-Goldwyn-Mayer Studios, Inc. v. Grokster, Ltd., 545 U.S. 913 (2005); Sony Corporation of America v. Universal City Studios, Inc., 464 U.S. 417 (1984).
【54】同上注。
【55】Mia Sato, Drake’s AI Clone Is Here — And Drake Might Not Be Able to Stop Him, The Verge, May 1, 2023, available at https://www.theverge.com/2023/5/1/23703087/ai-drake-the-weeknd-music-copyright-legal-battle-right-of-publicity.
【56】Restatement of Unfair Competition (Third) § 46 (1995).截至2020年9月底,美国共有35个州正式承认这项权利;其中有24个州是通过成文立法,22个州是通过普通法(common law,即司法案例),13个州是以某种两者的组合或兼而有之的方式给予认可。参见Mark Roesler and Garrett Hutchinson, What’s in a Name, Likeness, and Image? The Case for a Federal Right of Publicity Law, American Bar Association (ABA) Landslide (September/October 2020), available at https://www.americanbar.org/groups/intellectual_property_law/publications/landslide/2020-21/september-october/what-s-in-a-name-likeness-image-case-for-federal-right-of-publicity-law/。
【57】Roesler and Hutchinson,同上注。
【58】与英国、加拿大等采取普通法的国家可由法院直接发布不针对特定被告的所谓“某甲禁令”(“John Doe” Order,即被告身份不明)不同,美国联邦民事诉讼程序原则上禁止对身份尚未确定的被告发布暂时禁制令(preliminary injunction)。只有在非常例外且紧急的情况下(如既有的证据明确显示如不立即签发将导致立即且无可弥补的损害等),法院可以考虑发布一个“暂时限制令”(Temporary Restraining Order,简称TRO),但原则上为期不超过14天(必要时基于正当理由可以延展),而且必须尽速、优先召开关于应否发布暂时禁制令的听证。参见Federal Rules of Civil Procedure §65(b)。
【59】U.S. Copyright Office Copyright Review Board, Second Request for Reconsideration for Refusal to Register A Recent Entrance to Paradise (Correspondence ID 1-3ZPC6C3; SR # 1-7100387071), February 14, 2022, at 3, available at https://www.copyright.gov/rulings-filings/review-board/docs/a-recent-entrance-to-paradise.pdf.
【60】Burrow-Giles Lithographic Co. v. Sarony, 111 U.S. 53 (1884)(联邦最高法院在本案首次面临到由一个当时的新发明 —摄影机— 呈现的结果是否仍可获得著作权的保护,尤其是一个通过机械的感光把外部实况予以记录下来的呈现是否构成当时著作权法所规定,由一个“作者”(author)所“撰写”(writing)的作品。法院认为,摄影师仍然从事了背景的铺排、采光投影、当事人的服饰与摆出的姿态等等各种的设计与搭配,因此符合了对于独创性的要求和“作者”的身份,藉助摄影机等器材的协助从事对特定人像的“撰写”或描绘。这个案件是关于名作家和诗人奥斯卡‧王尔德(Oscar Wilde, 1854-1900)的一帧沙龙照)。
【61】Copyright Office, Letter of February 21, 2023 on Zarya of the Dawn (Registration # VAu001480196).
【62】U.S. Copyright Office, Compendium of U.S. Copyright Office Practices (3rd ed. 2017) §313.2。
【63】同上注,2021年更新版。新增的文句是:“…the Office will not register works produced by a machine or mere mechanical process that operates randomly or automatically without any creative input or intervention from a human author. The crucial question is “whether the ‘work’ is basically one of human authorship, with the computer [or other device] merely being an assisting instrument, or whether the traditional elements of authorship in the work (literary, artistic, or musical expression or elements of selection, arrangement, etc.) were actually conceived and executed not by man but by a machine”。
【64】Library of Congress, Copyright Office, Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence, 88 Federal Register 16190 (March 16, 2023).
【65】U.S. Copyright Office, Copyright Office Launches New Artificial Intelligence Initiative, NewsNet Issue No. 1004 (March 16, 2023), available at https://www.copyright.gov/newsnet/2023/1004.html.
【66】塞勒已在全球19个国家和地区提出申请或上诉,试图让其设计的人工智能工具(即“创作机器”和/或另一个称为DABUS的关联系统,是“统一感知自动导引装置”(Device for the Autonomous Bootstrapping of Unified Sentience)的简称)成为著作权的“作者”或“共同作者”以及专利权的“共同发明人”。截至2023年8月底,只有DABUS获得了南非的专利权,其馀的申请都遭到驳回并在上诉之中。由于南非没有对专利申请的实质审查,因此该授权在实质上恐怕不会具有如何的影响力,也将难以被其他国家或地区接受。参见The Artificial Inventor Project, Patents and Applications, available at https://artificialinventor.com/patent-applications/。其以人工智能做为“发明人”在美国提出的发明专利申请已遭到美国专利商标局(U.S. Patent and Trademark Office)的核驳并经法院判决确定(联邦最高法院已于2023年4月24日驳回其再审请求)。参见Thaler v. Vidal, 43 F.4th 1207 (Fed. Cir. 2022), cert. denied, 598 U.S. ___ (2023)。
【67】Memorandum Opinion, Thaler v. Perlmutter, Case No. 22-1564 (BAH)(D.D.C. August 18, 2023).本案名义上的被告是美国版权局的现任局长希拉‧波尔马特(Shira Perlmutter, 1956 -)女士。
【68】Zachary Small, As Fight Over A.I. Artwork Unfolds, Judge Rejects Copyright Claim, New York Times, August 23, 2023, at C4, available at https://www.nytimes.com/2023/08/21/arts/design/copyright-ai-artwork.html.
【69】国内文献常把此一司法处置按照字面错译为“简易判决”,实际上既不简也更不易。依据《联邦民事诉讼规则》第56条,如果一方当事人在庭审中能显示,双方在全案的重要事实方面不存在真正的争议(no genuine dispute as to any material fact,通常是因为对方未能针对真正的关键问题举证或举证不足),纵使庭审程序尚未结束,法院即应根据该当事人的声请依法迳行判决(as a matter of law),不需等到整个程序结束。参见Federal Rules of Civil Procedure §56(a)。
【70】同前注60。
【71】H.R. Rep. No. 94-1476, at 51 (1976).
【72】Urantia Foundation v. Maaherra, 114 F.3d 955 (9th Cir. 1997).
【73】Sam Ricketson, People, or Machines: The Berne Convention and the Changing Concept of Authorship, Horace S. Manges Lecture, 16 Columbia-VLA J. L. & Arts 1 (1991-1992). 本文作者里基森现为澳大利亚墨尔本大学(Universities of Melbourne)法学院的退休教授。其与哥伦比亚大学法学院简‧金斯伯格教授(Jane Ginsburg)合著的《国际版权与邻接权-伯尔尼公约及公约以外的新发展》(International Copyright and Neighbouring Rights: The Berne Convention and Beyond, London, U.K.: Oxford University Press, 2nd ed. 2005)是研究《伯尔尼公约》和后续国际著作权保护体系的经典(或权威)之作(该书的中文版是由郭寿康教授等翻译,中国人民大学2016年出版)。
【74】U.S. Patent and Trademark Office, Public Views on Artificial Intelligence and Intellectual Property Policy (October 2020), at 20-21.本文摘录并综合了来自诸如美国律师协会知识产权组(American Bar Association Intellectual Property Law Section)、公共知识(Public Knowledge)、知识产权所有人协会(Intellectual Property Owners Association)等等多个专业组织提出的反馈意见。
【75】International Intellectual Property Alliance (IIPA), Copyright Industries in the U.S. Economy 2022 Report (December 2022), at 8.
【76】同前注74,第21页(摘录自作家协会(the Authors Guild, Inc.)的反馈意见第5页)。
【77】同上注(摘录自信息技术及创新机金会(Information Technology and Innovation Foundation, ITIF)的反馈意见第4页)。
【78】Christa Laser, How A Century-Old Insight of Photography Can Inform Legal Questions of AI-Generated Artwork, Technology & Marketing Law Blog, August 2, 2023, available at https://blog.ericgoldman.org/archives/2023/08/how-a-century-old-insight-of-photography-can-inform-legal-questions-of-ai-generated-artwork-guest-blog-post.htm.
【79】同前注60。
【80】Michael Kasdan and Brian Pattengale, A Look At Future AI Questions For The US Copyright Office, Law360, November 10, 2022, available at https://g2bswiggins.wpenginepowered.com/wp-content/uploads/2022/11/Law360-A-Look-At-Future-AI-Questions-For-The-US-Copyright-Office.pdf#page=7.
【81】17 U.S.C. §501(b)(其原文为:“The legal or beneficial owner of an exclusive right under a copyright is entitled, subject to the requirements of section 411, to institute an action for any infringement of that particular right committed while he or she is the owner of it….”)。
【82】Mark Perry and Thomas Margoni, From Music Tracks to Google Maps: Who Owns Computer-generated Works?, 26 Computer Law & Security Review 621 (2010).
【83】其原文为:“3. Content (a) Your Content. You may provide input to the Services (“Input”), and receive output generated and returned by the Services based on the Input (“Output”). Input and Output are collectively “Content.” As between the parties and to the extent permitted by applicable law, you own all Input. Subject to your compliance with these Terms, OpenAI hereby assigns to you all its right, title and interest in and to Output. This means you can use Content for any purpose, including commercial purposes such as sale or publication, if you comply with these Terms. OpenAI may use Content to provide and maintain the Services, comply with applicable law, and enforce our policies. You are responsible for Content, including for ensuring that it does not violate any applicable law or these Terms” [Emphasis added]。参见OpenAI, Terms of Use (Updated March 14, 2023), available at https://openai.com/policies/terms-of-use。
【84】其原文是:“The question of whether Machines Can Think, a question of which we now know that it is about as relevant as the question of whether Submarines Can Swim.”参见prof. dr. Edsger W. Dijkstra, The Threats to Computing Science, Keynote Speech, delivered at the Association for Computing Machinery (ACM) 1984 South Central Regional Conference (November 16–18, Austin, Texas), text available at https://www.cs.utexas.edu/users/EWD/transcriptions/EWD08xx/EWD898.html。
【85】参见Piero Scaruffi,《智能的本质:人工智能与机器人领域的64个大问题》,同前注16,第23章(2918年版)(作者表示,常识是另一个欠缺的要素。人类会很自然地运用多种不同无法归纳的形式进行推导,因此无法具体明确。一般而言,人们很善于对数学演算从事“合情推理”(或“似真推理”)而不是数学家们使用的“确定推理”。对于许多问题去寻求具体明确的答案往往是没有意义的:需要耗费太多的时间(尤其无法及时反应一个突发或紧急的情况)。其原文为:“Common sense, besides learning, was another missing ingredient. Humans employ naturally several forms of inference that are not deduction, and therefore are not exact. In general, we specialize in ‘plausible reasoning’, not the ‘exact reasoning’ of mathematicians. Finding exact solutions to problems is often pointless: it would take too long….”);另参见前注25。
【86】其中的历史发展、争议与后续影响,可参见拙著,论数据相关的权利保护和问题,《知识产权研究》第28卷(2022年3月),第3-90页。
【87】Fixtures Marketing Ltd v. Oy Veikkaus AB, [2005] ECDR 2, [44] (ECJ)(C-46/02, 9 November 2004), Fixtures Marketing Ltd v. Svenska Spel AB (C-338/02, 9 November 2004); British Horseracing Board Ltd v. William Hill, [2005] E.C.R. 1, [80](ECJ 2004) (C-203/02, 9 November 2004); Fixtures Marketing Ltd v. OPAP (C-444/02, 9 November 2004).
【88】European Commission, First Evaluation of Directive 96/9/EC on the Legal Protection of Databases, DG of Internal Market and Services Working Paper (12 December 2005); Evaluation of Directive 96/9/EC on Legal Protection of Databases, Commission Staff Working Document, SWD(2018) 146 final (25 April 2018).
【89】Ezra Klein, The Imminent Danger of A.I. Is One We’re Not Talking About, New York Times, February 26, 2023, available at https://www.nytimes.com/2023/02/26/opinion/microsoft-bing-sydney-artificial-intelligence.html;《纽约时报》中文版译称“人工智能真正的恐怖之处”,2023年3月1日,载于https://cn.nytimes.com/opinion/20230301/microsoft-bing-sydney-artificial-intelligence/。
【90】同上注。
版权拾轶:著作权保护范围的扩展、限缩与平衡
作者:孙远钊
点击图片查看文章
(www.meddeviceip.com)
(www.caiips.com)