Sora发布：在虚实相交的十字路口，纪录片该如何守护真实

Original 许凯航中国纪录片研究中心 2024-04-12

2022年11月，美国开放人工智能研究中心（OpenAI）发布ChatGPT（Chat Generative Pre-trained Transformer），其中GPT-4.0模型实现了对语言、图片、图表等元素的解读、处理与生成，人类首次进入了AI纪元。而在今年2月16日，AI生成再次迎来重大革新，OpenAI发布了文生视频大模型Sora，Sora使用Transformer架构，结合自家文本模型GPT和图像模型DALL-E，不仅能够根据提示词，生成长达一分钟的高品质视频，还能实现根据图片生成视频以及延长视频。

OpenAI在Sora技术报告中提到：“通过扩大视频生成模型的规模，我们有望构建出能够模拟物理世界的通用模拟器”。Sora可以完全理解提示词的意义并生成出符合现实世界物理规律的高分辨率视频，画面已经相当可用。可见，使用海量数据训练出的Sora大模型已经基本拥有了对现实世界的“正确理解”，跨越为实用生产力工具，向通用人工智能AGI（Artificial General Intelligence）迈进了关键一步。

但是，越来越“真实”的AIGC反而将导致影视行业走向“虚拟”，人工智能技术脱实向虚的价值取向也会助推深度伪造（Deepfake）的泛滥，Sora等文生视频模型的出现，对纪录片赖以生存的“真实性”土壤造成了一定程度的消解，人们越来越难以区分真实与虚假，不禁让人们对纪录片未来发展感到担忧。人工智能技术快速发展已然成为历史趋势，纪录片面临着日益复杂危机的同时也迎来了更加多元的机遇。可生成的影像，意味着纪录片有了更多表达真实的途径，还是意味着未来人们制作纪录片时可以根据需要随意生成内容？在虚拟和真实的十字路口，纪录片到底该怎么走？

当我们讨论AIGC对纪录片的影响与冲击时，我们需要厘清“Deepfake（深度伪造）”和“数字生成影像”对纪录片带来的影响。

Deepfake一词由“Deep learning”（深度学习）和“Fake”（伪造）二者组合而成，简而言之就是借助人工智能的深度学习能力，识别并替换或生成全新的人体形象内容，包括人物的面部五官、表情、声音以及其它可区分个体特征的内容等，而其中使用生成对抗网络（GAN：通过生成器与判别器不断改进，生成越来越接近真实的数据）所生成的Deepfake内容，甚至可以与现实媲美，骗过人眼。

Deepfake换脸技术

Deepfake技术在影视领域带来了多样的变革，可以大量节省生产和运营成本。例如迪士尼利用高分辨率的Deepfake换脸技术改善他们的视觉效果，运用技术将演员的脸部表情转移到替身演员脸上，创造出更加逼真的虚拟角色，甚至能够使角色减龄以及“复活”已故演员；在电影《流浪地球2》中，视效团队利用Deepfake技术实现角色的减龄，让45岁的吴京毫无违和感地饰演了21岁的刘培强，同样使用此技术的还有电影《美国队长·内战》中小罗伯特·唐尼饰演了年轻的“钢铁侠”托尼·史塔克。

摄像机记录的数据结合光线影响对角色进行de-aging（减龄）

但在纪录片领域，Deepfake技术的应用还处于克制和尝试的阶段。例如央视推出的纪录片《创新中国》首次使用AI配音，通过Deepfake技术“复活”李易先生，让其经典的声音重回荧屏；纪录片《中国空间站》使用基于AI的3D降噪和超分辨率等技术修复了2003年杨利伟搭乘神舟五号出征太空的视频画面，让原本低分辨率、低码率的画面摇身一变为4K超清素材；纪录片《欢迎来到车臣（Welcome to Chechnya）》因涉及到敏感的政治话题，所以片方使用了Deepfake技术替换受访者的面部与声音以保护受访者身份，相较于传统的马赛克和变声，Deepfake替换技术最大程度保留了影片的观感与听感体验，可以在不违背事实真实的原则下还原受访者表情，传达真实情感，AI替换的声音也避免了单纯变声技术所带来的疏离感。

纪录片《中国空间站》运用AI技术对素材画面进行画质增强

纵观这些影视作品，AI技术给它们带来了全新的表达，也给影视行业带来更多元的可能，但是背后所涉及的伦理和法律问题却让人们仍然对技术持怀疑和担忧态度。别有用心的人可能利用Deepfake进诈骗行为，不止如此，Deepfake技术也经常被用来污名化明星和政客、生成色情视频和创建马甲傀儡等。

因此，在强大生成技术持续扩大的影响下，对技术持有悲观消极态度的人认为，我们已经陷入了一个无法再确定媒介内容是否符合事实的时代。“后真相”的时代已经过去，就算是我们眼见为实的“真相”也未必是真的真相。“纪实影像”可以被无痕修改，人们可以利用AI替换或生成虚构的纪实照片和视频，其真实性很难得到核查，影视评论家格西拉耶法·阿佐尔博认为，如果没有强大的媒体内容甄别技术，外行人、甚至资深媒体从业者都将越来越难以分辨现实和“貌似现实”。纪录片的真实该如何在层层技术中得到保障？一系列使用了AIGC技术的“纪录片”到底能否被称为纪录片，真实和虚拟的边界又在哪里？

“数字生成影像”是Deepfake的下一个阶段，在此阶段，技术不再局限于对已有的影像进行编辑，而是能够通过已有图像或仅凭文字描述生成全新的图像或视频。由于新的影像完全由AI通过对海量数据进行深度学习生成，我们可称之为“数字生成影像”，OpenAI发布的Sora大模型凭借能够生成出真假难辨的“现实影像”，在数字生成影像领域独占鳌头。不难想象，在Sora开放使用后，网络上将会出现一大批包含AIGC内容的影像作品，其中可能也会不乏一些具备创新性表达和实验性意义的纪录片作品，这些包含“虚拟影像”的纪录片究竟是否违背了纪录片的真实性原则？通过追溯历史，我们或许能给未来纪录片创作提供技术赋能的新思路。

Sora生成的街头舞龙视频‍

纪录片之父弗拉哈迪拍摄的《北方的纳努克》被称为第一部真正意义上的纪录片，在这部纪录片中，弗拉哈迪采用了搬演的手法，即要求纳努克一家将他们的故事重新表演出来，作为对事实的一种再现。发展至今，搬演已经成为一种常规的叙事手法被运用到纪录片当中。

《北方的纳努克》采用搬演手法

古希腊哲学家赫拉克利特曾说“人不能两次踏入同一条河流”，最本真的真实转瞬即逝，纪录片所展现的往往是对现实的再现而非绝对真实，当事实无法被直接表现时，纪录片可以使用搬演、剪辑创作等手段对事实进行复述与再现，而部分纪录片正是在重现真实的过程中被赋予了艺术价值。正如纪录片先锋尤里斯·伊文思提到的：“有人认为纪录片不是艺术，因为纪录片没有想象，这是不对的......纪录片从开始拍摄之前到最后剪接完成，自始至终也不能脱离想象。”现实只是素材，而非艺术本身，纪录片的魅力恰恰就在于通过人类的想象为现实素材赋予艺术价值，进而建构一种形而上的“真实性”，讲述拍摄者想要表达的故事。

随着训练量的增加，Sora生成的视频越来越逼真

从这个角度来说，不论搬演、动画还是AIGC都只是对现实进行再现的一种技术手段，不同技术手段的差别就在于对现实再现过程的把控程度与想象力的介入程度不同。搬演采用真人演员与实景拍摄，在遵循真实的前提下按照导演的意图与合理的想象进行“实拍”，进而还原事实；而AIGC则是通过深度学习，分析已有画面的内容和风格，从而生成全新的画面，创作者可以通过输入提示文本来限定和控制生成画面的内容，随着提示文本的丰富和精准，创作者也能非常准确地把握画面的细节，实现对事实的还原与再现。二者在实际使用中，都是为了更好地展现创作者想要向观众呈现的“真实故事”。因此，从使用目的的角度出发，AIGC与纪录片中常用的搬演手法一致，都服务于创作者的表达。

纪录片《何以中国》采用搬演讲述历史

每个创作者对真实的定义不尽相同，创作者心中的观念远比技术本身产生的影响要更为重要。对于纪录片创作者而言，我们不必将数字生成影像视作洪水猛兽，在精准把握画面和明确告知受众的前提下，AI与搬演、动画一样，都能够成为事实再现的有效工具和途径，与此同时，新技术还将一定程度上带来成本的有效控制和效率的提升。无论业界怎样争议，人工智能必然会在未来被纳入到纪录片创作的使用中，作为纪录片人的我们应该有着同样的追求和信念——坚持纪录片所秉持的传统真实原则，才是纪录片在面对技术冲击时，依然能够把握本心的关键所在。

人工智能跃迁式的进步将导向全球影视行业的更新与变革，“我们会被AI取代吗？”成为了影视从业者的普遍担忧，但更实际也更广泛的一个问题是：在无可后退的社会浪潮中，我们该如何与AI相处？纪录片《徒手攀岩（Free Solo）》的剪辑师鲍勃·艾森哈德特曾表示：“当我们更进一步，来到人工智能的时代，或许也能让它成为纪录片制作的重要工具。但这无疑是一把双刃剑，让人感到兴奋的同时也会让人心生畏惧。”

Sora生成的视频画面

目前，人工智能已经可以在多个方面辅助纪录片的创作，基本涵盖传统纪录片产业的全流程。除了Deepfake与数字生成影像，AI还可以帮助我们快速整理大量素材并进行分类，通过音频生成人物访谈文稿与对应时间码，识别可用的剪辑点甚至帮助剪辑师进行粗略的剪辑工作，对画面进行降噪、超分、补帧等增强画质的后期处理，对音频进行降噪或修复，以保证纪录片的视听效果等，正如纪录片工作室XTR创始人布林·莫瑟感叹的那般：“你很快就能看到人工智能被运用到纪录片制作的后期当中，这将会是自电脑出现以来对纪录片行业最具颠覆性的事情。”

AI剪辑插件：AutoPod

从当前的使用目的和实际操作中，我们可以把AI辅助创作大致分为“工具类AI”与“内容类AI”两种类型进行讨论，前者仅针对重复性的文档归类等基础操作，不会对纪录片的内容与真实性产生影响，而后者的内容生成则会对纪录片的真实性可能造成影响或产生一定的风险。

对于工具类AI，我们可以体验到技术发展带来的便利，这类AI可以有效地帮助我们降低成本、提高工作效率，将人们从一些琐碎复杂或令人苦恼的工作中解放出来。例如讯飞听见可以实现多语种的语音转文字功能，甚至实时生成字幕；FuSta模型可以对视频素材进行防抖处理；ai-coustics模型可以对音频进行去除爆破与降噪处理；Topaz Video Enhance AI软件可以实现对视频素材的超分、修复污点和补帧处理等。

视频增强软件：Topaz Video Enhance AI

对于内容类AI，由于其可生成以假乱真的内容，我们需要在严格的原则与规范下进行使用。首先要确保创作者主导，内容生成类AI的使用必须在创作者的把控下进行，创作者需要对AI生成的内容进行评估与调整，使其适应纪录片的叙事与表达，主动弱化甚至排除其对纪录片真实性的影响，让AI生成内容为纪录片的真实性服务。其次在使用上需要公开透明，使用了AI生成内容的纪录片必须明确告知观众本片使用了AI技术，并标注出AI生成的具体内容与片段，纪录片的观众有权知道自己所观看的内容来自AI生成，否则便是在欺诈观众，且如果未做到公开透明，影片的真实性甚至导演、制作机构的信誉都将受到怀疑与冲击。最后是多方合力监管，使用内容类AI的纪录片除了由创作者主导、公开透明外，还必须受到适当的监管，监管可以来自平台、协会、产业甚至成立专门的管理机构进行指导与监督，对此制定出明确的使用规则和法律条例，对内容进行详细核查，帮助纪录片在AI时代走上良性的发展道路。

罗西在《安迪·沃霍尔：时代日记》中告知观众

影片中有合成内容且已获得基金会同意

有人将Sora的发布称作影视行业的“牛顿时刻”，AIGC所引起的产业革命已经开始，如何不被时代淘汰，如何更好地利用新技术是每个纪录片从业者都必须思考的问题。但是，不管个体如何选择，纪录片将始终作为技术的见证者、记录者和拥抱者跟随新技术一起发展，拓展新形态。同时，在充满“虚构”的时代，我们需要纪录片来记录这个快速发展的社会，带领人们发掘和探查事实与真相，呵护每一抹属于人类创作的灵光。光影一瞬，纪录片“真实纪录”的价值因技术的突飞猛进而愈显珍贵，而这份“真实”需要每一个人的悉心守护。

更多精彩内容，请持续关注

微信公众号“中国纪录片研究中心”往期回顾

监制：何苏六

主编：韩　飞

编审：王　侯李金斋

责编：王悦阳宁皓阳

编辑：许凯航

继续滑动看下一个

中国纪录片研究中心

向上滑动看下一个

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

Sora发布：在虚实相交的十字路口，纪录片该如何守护真实

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

生成图片，分享到微信朋友圈

Sora发布：在虚实相交的十字路口，纪录片该如何守护真实

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡