青萍荟 | ChatGPT能成学霸写出AI时代的《红楼梦》吗？

Original 中国评协中国文艺评论 2023-06-05

收录于合集

/////////////////////

编者按：近期，ChatGPT爆火，开始“病毒式”地在全球传播。它能做到有问必答，甚至可以根据提问，即兴发挥和创作。它不仅席卷了有一定程式的新闻出版、学术论文写作等领域，支持ChatGPT的生成式AI技术甚至可以完成需要发挥创意的小说创作、绘画、设计等文艺活动。一石激起千层浪！假如AI是个娃，怎样才能把它养成一个真正的学霸？人机交互会成为未来人类社会、包括文艺创作的趋势吗？AI会成为真正的艺术家吗？我们如何判定AI创作的合法性？在技术革新与艺术开拓的进程中，文艺如何逆向影响技术、赋予其人文精神和价值导向？我们如何回答AI带给人类的时代之问、艺术之问、审美之问……

鉴于此，中国文艺评论家协会、中国文联文艺评论中心特别策划“青萍荟”专题(点击查看)，围绕ChatGPT与文艺的相关话题，约请学界、业界五位青年专家从AI艺术、算法传播、技艺融合等方面开展感性探讨和理性评论。本期推出彩云科技CEO袁行远、中国艺术研究院马克思主义文艺理论研究所副研究员秦兰珺的两篇短评，以飨读者。

我们距离 AI《红楼梦》，还有多远？

袁行远

chatGPT

机遇

ChatGPT 创造了一种新的写作范式，通过发出指令与AI沟通来不断塑造作品。比如，如果我们要一个类似《红楼梦》的故事，可以从设定人物开始：

但AI 没有给角色起名字，那么我们可以在上文基础上，继续告诉它这个任务：

如果觉得不满意，还可以调整。然后我们列个大纲吧。

看到这里不觉得脊背发凉吗？

AI不仅把之前的人物都放进去了，而且结构完整。虽然距离《红楼梦》差距仍然巨大，但是作为一篇商战小说，结构已经基本合理。那根据这个提纲，开始写吧！

这个……有点太简略和程式化了，这么写小说，肯定没人看。但我们可以发出指令修改它，让文章贴近我们的心意。

虽然还是不能达到满意的效果，但我们惊人地发现，AI可以听懂“人话”，作出修改。因此，如果我们有足够的耐心，并且善于不断提出更细化更具体的修改要求，那么，理论上可以打磨出一个令我们满意的版本。因为AI的创作速度足够快，可以通过不断人机交互获得更好的内容，人机合作有可能成为未来文学创作的新范式。

挑战

但我们目前还面临诸多挑战：首先是文笔问题。因为ChatGPT训练的数据包罗万象，因而在进行细节描写时，即使要求它提升文笔，仍然不容易得到“像小说”的内容。但这个问题是有解的。

经过近30年的发展，中国网络文学早已不是青涩少年，每个有手机的人都可以去尝试发表小说，但只有非常有创意的作者才能在激烈竞争中胜出。起点每日产生6万章节，全网每天产生2亿字，如此大规模的内容生产，给了AI极好的学习素材。得益于网络文学的成果，基于常识和小说语料训练的中国本土语言模型如“彩云小梦V2”等在文笔和想象力上目前比ChatGPT有更好的表现。

△彩云小梦续写刚才的故事开头

另一个挑战是AI写作容易忘记之前的内容。目前GPT3.5可以最大支持4096token，大约是2000个汉字。也就是说输入+输出，整个模型一共可以支持2000字，超过的内容就会被丢掉。人类写作，可以记住的情节和内容是无上限的。有些科技企业正在尝试通过分章节、压缩记忆等方式缓解这一难题，以期把记忆上限推到整本小说。

ChatGPT 的对话形式极不利于写作的编辑和修改，但好在还有很多专业的编辑器。微软也已经表示在Office中会集成ChatGPT的服务，可以预见未来Office/WPS等应用中会内置写作功能，一如拼写纠错等功能一样，会成为编辑器的标配。当前，也有一些专业的AI辅助写作编辑器如NovelAI、Sudowirte和彩云小梦等对人机协同编辑进行了更好的适配，以帮助作家更好地创作。如何通过新的交互界面提高人机协同效率，也是值得继续研究的课题。

△NovelAI界面

△北大中文系同学们与小梦合著的小册子《哔哔打文 2021》

如果以上问题都得到解决，还需要应对版权问题。第一是对AI抄袭的质疑。这个不用担心。因为AI写作是逐字依概率随机生成，查重率为0，越来越多的人已经意识到不可能判定AI抄袭作品了。第二是创作作品的版权归属，目前业内的普遍做法是认为版权属于操作AI的人类。

但更为困难而根本的问题可能还在于AI写作的尺度和价值观问题。色情暴力等需要审查的内容在全球都会受到限制，目前国外的NovelAI没有对写作进行限制，而ChatGPT进行了很多限制。如何既能不损害创作自由，又能保证整个社会的文化环境不因AI写作的出现而受到污染？这个问题的解决需要集合社会各界的力量和智慧，可能还需要长期探索。

AI写作出现后，我们观察到80%的用户并非专业写作者，很多用户写作只是自娱自乐，并不用于发表。人们和AI一起写作，可能更像是在玩游戏，而非单向输出。这无意中突破了读者和作者的边界，在创作过程中，人类既是读者又是作者。随着技术的进步，我们正在迎来一个全新的互动文学时代。或许《红楼梦》在将来会是一种虚拟现实的互动体验，从而诞生新的文学形态和名家？希望我们有勇气打破常规束缚，突破文学边界，或许终有一天，我们也能创作出AI时代的《红楼梦》。

*作者：袁行远，彩云科技CEO

如果AI是个娃，怎样把TA培养成学霸？

秦兰珺

chatGPT

如果AI是个娃，如何养出一个琴棋书画无所不能的学霸？

曾经这种被称作“通用人工智能”的想法被认为“疯狂”，你可以养N个娃，让他们在不同领域各自出色，但不能妄想他样样精通。

但总有一些人类家长不认命。先是有个叫Google Research的团队在2015年的一篇论文中，描述了一种神经网络架构，据说能让娃的底层语言学习能力突飞猛进。后是有个叫Open AI的团队，在该研究成果的基础上，给娃投喂了海量训练模型的数据和支撑魔鬼训练的算力。

在更好模型、更多数据、更大算力的通力作用下，五年后，一个叫GPT-3的学霸于2020年7月出道了。人们惊呼，上个出道即惊艳的，恐怕还是区块链！

(来源：“央视新闻”微信公号)

GPT-3这娃，牛就牛在基础语言能力。对它假以微调，就可以让它从事写新闻、论文、文案、代码等不同工种的语言生成工作，尽管水平不太稳定，但部分优秀成果已能和其人类父母媲美。

看到了“大模型”这条能力培养之路走得通，家长们按耐不住了。家底薄者开始琢磨如何调用这娃的现成能力，让它在具体领域大展身手、养家糊口(比如建立在GPT-3上的广告文案生成工具Jasper)。

家底厚者则更热衷于烧钱在语言、图像等各种基础能力上培养自家学霸(比如谷歌的大语言模型LaMDA，Open AI的大图像模型Dall·E2)。

直到2022年9月，著名投资公司红杉坐不住了，它在《生成式AI：一个创造性的新世界》(Generative AI: A Creative New World)一文中，勾画了AIGC(AI-Generated Content，AI生成内容)在文、图、语音、代码、视频、3D建模诸领域的前途。这下家长更沸腾了：啊呀，有钱人看上了咱大模型炼成的娃，还为它规划好了职业生涯。

不难想象，红杉发话不久，这些炼娃的家长有很多都获得了巨款资助，正是在这波资助热潮期间，Open AI 在GPT-3.5(GPT-3的升级版)的基础上，弄出了ChatGPT，让娃在对话式文本生成领域小试牛刀，瞬间又成了“别人家的娃”。

但养娃的人都知道，娃的三观和能力一样重要。比如，之前就有人问过，AI生成的二次元图像，为何感觉涩涩的。回答这个问题，人类父母确实有点尴尬——因为我们喂给娃的二次元图像数据，大部分就这画风啊！原来，娃的生长环境会对其产生影响，娃吞下啥，就吐出啥，这个道理对于养AI，同样适用。

△电影《机器人总动员》剧照

那么如何培养一个三观端正的AI？或者说，如何在生成式AI的模型中嵌入人文价值？这个看似有点科幻的命题，今天已十分现实。

比如，如果我们曾把网络上的语言数据不加区分地投喂给AI，那么又如何保证它不会继承网络聊天中常带的“戾气”？是否有人会借助培养三观不正的AI，在网络上生产危险、敏感或低俗的内容？

诸如此类的伦理乃至法律责任，不可不察。AIGC时代，或许文艺评论的一个重要责任，就是关注这种深嵌于数据和算法的人文和社会价值。

但很多时候我们也不确定，父母的价值就一定正确，将该价值加诸于娃的尺度，又该如何拿捏。事实上，ChatGPT已展示出在某些方面被过度驯化的迹象。

原来，Open AI早就发现了诸如此类的安全性问题，雇佣了一个人类团队，对这娃提供的答案进行“好”“坏”标注，好赏坏罚、反复迭代，强化学习下，娃就会较少吐出它爹娘认为不好的内容了。

结果，这群人类爹娘在这娃这里，竟训练出一种不偏不倚的“和事佬”文风。或许这不是一种最能表达观点的文风，却的确是在网络舆论环境中，给监护人最少惹麻烦——所谓“安全”——的文风吧。

但是，谁知道，在爹妈没有关注和强调到的地方，这娃又能吐出什么呢？

看来，培养AI学霸确实不简单，但好在，它怎么都比养人更容易。因为后者会说“我”，会说“不”，有时也更具破环性的创造力。作为中年老母亲，笔者只能相信，别焦虑，人类娃都养了，难道还搞不定AI？

*作者：秦兰珺，中国艺术研究院马克思主义文艺理论研究所副研究员