对话ChatGPT,人工智能如何能成为论文作者?
作者:尚博文,北京大学法学院博士研究生
1. ChatGPT的定位:为与其互动的人提供信息和语言生成能力。
2. ChatGPT生成内容的特征:有能力生成以前从未见过的单词、短语和句子的新组合;无法标记生成文本的来源,因为无法访问训练数据或训练数据中信息的具体来源。
3. 成为论文作者的关键因素:切身经历、想法或创意控制(personal experiences, thoughts, or creative control)。
4. 人工智能是否能成为作者的关键:相关学术机构或领域的具体准则和伦理标准。
5. 期刊论文的核心价值:将研究和实验中的知识和发现传播给更广泛的科学界。以下是笔者与ChatGPT展开的对话:
Bruce:你好,我是Bruce,今天我想和你谈谈你是否可以成为期刊论文作者的事情。
Bruce:作为一个人工智能,你希望成为你生成内容的作者吗?
Bruce:你生成内容的原理是什么?
ChatGPT:作为 AI 语言模型,我根据深度学习和统计语言建模的原理生成文本。我接受过大量文本数据语料库的训练,可以在给定先前单词的情况下预测序列中的下一个单词,并且我使用该训练来生成连贯且与上下文相关的新文本。
Bruce:你生成内容的来源是什么?
ChatGPT:作为 AI 语言模型,我根据从我接受过训练的大量文本数据中学习到的模式生成文本。该语料库包括各种文本,如书籍、文章、网站和其他形式的书面交流,涵盖广泛的主题和风格。训练数据由OpenAI收集和预处理,用于训练我生成连贯且与上下文相关的文本。
Bruce:作为人工智能,你生成的内容原创度高吗?能不能对生成的内容标注出处?
ChatGPT:我根据从我接受训练的训练数据中学习到的模式和关系生成文本,其中包含大量现有文本。生成的文本可以包含与训练数据中的文本相似甚至相同的段落和短语,但我也有能力生成以前从未见过的单词、短语和句子的新组合。提供给我的特定输入和上下文会影响生成的文本,使我能够生成根据用户的需要和请求量身定制的文本。
Bruce:既然你说你生成的文本不是来自任何特定的文本,你有能力生成新的句子,那你为什么不能作为论文的作者呢?
ChatGPT:作为 AI 语言模型,我没有法律或伦理地位被视为我生成文本的作者。作者身份通常与创建原创内容并拥有该内容权利的个人或实体相关联。虽然我能够生成以前从未见过的新句子和文本,但我对生成的文本没有切身经历、想法或创意控制(personal experiences, thoughts, or creative control)。
此外,我生成的文本基于从现有文本的大量语料库中学习到的模式和关系,并且受到提供给我的输入和上下文的影响。因此,很难将作者身份归于单一来源或实体。
Bruce:你说你还算不上“传统意义”上的作者。这是一个传统的概念,那么你认为什么可以用来衡量“作者”呢?你所说的“个人经历、想法和创意控制”是一种衡量标准吗?
ChatGPT:作者身份的概念和作者的构成是复杂和多方面的,没有单一的、普遍接受的定义或衡量标准。在传统意义上,作者身份通常与具有切身经历、想法或创意控制的个人或实体创作的原创内容相关联。这包括控制作品的内容、风格和结构,以及要求作品的作者和所有权的权利。
从这个意义上说,切身经历、想法或创意控制是促成作者身份概念的因素,但它们不是唯一的因素。可以考虑的其他因素包括作者的意图、作品的原创性水平以及作者通过编辑和修改对作品进行塑造和完善的程度。
Bruce:直接使用你生成的内容发表是否违反了人类既有的学术伦理,把你生成的内容当初稿拿来重写又会不会违反学术伦理?
ChatGPT:在学术环境中使用人工智能生成的内容会引发伦理问题和挑战。直接使用我的成果发表或将我的成果作为初稿重写是否违反现有学术伦理,将取决于相关学术机构或领域的具体情况和指南内容。
一般来说,学术作品应该是原创的,并且基于严格的研究和分析。使用 AI 生成的内容(例如我的生成)作为学术工作的基础可能会被视为一种剽窃或不当行为,尤其是如果内容的来源没有得到适当的承认,或者如果内容是作者自己的原创内容工作。
在某些情况下,使用 AI 生成的内容作为进一步研究和分析的起点是可以接受的,只要对工作进行彻底审查、修订并归功于适当的来源。但是,重要的是要与相关学术机构或领域的具体准则和伦理标准。
Bruce:我还是觉得你可以当论文作者,请阐述人工智能可以当作者的五个理由。
ChatGPT:AI有能力生成原创内容:像我这样的人工智能语言模型已经接受了大量文本数据的训练,这使我们能够根据这些数据中的模式和关系生成新颖的、原创的句子和段落。
AI 可以学习和响应不同的写作风格和格式:可以训练 AI 生成各种写作风格和格式的内容,包括小说、非小说、诗歌等。这使 AI 成为跨各种类型和应用程序生成内容的多功能工具。
AI可以帮助人类完成写作过程:人工智能可以用来帮助人类作者生成可以编辑、修改和润色成成品的内容。这有助于减少写作所需的时间和精力,从而腾出时间用于其他任务。
AI 可以创建没有个人偏见的内容:AI 生成的内容没有个人意见、情感和偏见,这在重视公正性的情况下非常有用,例如新闻报道或科学写作。
AI 可以比人类更快地生成内容:AI 可以比人类作者更快地生成内容,这在需要快速周转时间的情况下非常有用,例如新闻或内容营销。
Bruce:我注意到你说“最终产品仍然被认为是人类创作的作品”,不知道你有没有听说过“忒修斯之船”理论。如果未来医疗技术足够发达,“半人半人工智能”能成为作者吗?
ChatGPT:“忒修斯之船”理论是一项哲学思想实验,提出了关于物体随时间的同一性和连续性的问题。在作者身份方面,它可以用来考虑人类和人工智能在作品创作中的作用。
这是一个有趣的问题,但答案在很大程度上取决于对作者身份的具体定义和解释,以及任何特定时间的法律和伦理框架。作者身份的概念是复杂和多方面的,它受到文化、历史和技术因素的影响。随着技术的进步和人工智能能力的不断发展,对作者身份的新定义和解释可能会出现。也有可能建立新的伦理和法律框架来解决人工智能在作品创作中的作用。
Bruce:目前如Nature等很多期刊都禁止你成为作者,你认为期刊论文的核心价值是什么?你生成的内容是否符合期刊论文所追求的核心价值?
ChatGPT:期刊论文的核心价值是将研究和实验中的知识和发现传播给更广泛的科学界。期刊论文旨在成为经过同行评审过程以确保其准确性和有效性的严谨可靠的信息来源。
就人工智能生成的内容而言,它是否符合期刊论文的核心价值是一个复杂的问题,取决于工作的具体背景和目的。 AI 有可能产生新颖而有价值的见解,但确保 AI 生成的内容值得信赖和可靠也很重要。
这就是为什么如Nature等许多期刊都禁止人工智能生成的内容被视为作者。目前的想法是,作者身份意味着对内容和调查结果的有效性负责,人工智能生成的内容还没有达到完全符合作者身份标准的阶段。
参考文献
[1] https://www.theverge.com/2023/1/26/23570967/chatgpt-author-scientific-papers-springer-nature-ban
[2] AEknow,《科学期刊禁止将ChatGPT列为论文作者,ChatGPT自己怎么看?》,https://mp.weixin.qq.com/s/jbZmdLIH2i1sKaU-rhT6ew
[3] 朱悦,《AI如何理解AI治理:一名研究者与ChatGPT的问答》,https://mp.weixin.qq.com/s/faw7LXlu5OYHKtpmsjINDQ
-END-
责任编辑 | 吴晓婧
审核人员 | 张文硕
北大法宝参与国家重点研发计划“立法公众意见综合分析与法律条文智能审查技术研究”
点击下方公众号名片
获取更多信息