爆火的Sora会改变内容行业的游戏规则吗?9位一线从业者这么说
作者 | 头号AI玩家
采访 | 月山橘 赖赖
“Sora可能是目前AI视频模型里,写实类表现最好的”
目前看demo,Sora写实类的效果应该表现特别好,可能会是目前AI视频模型里写实类表现最好的。
风格化的demo展现有限(只有一个2D插画类型的)可能和训练素材更多在写实素材上有关。我认为可能会出现和DallE2一样比较尴尬的位置:至今你都没办法让DallE2画具体某个游戏画风的角色/场景,由于数据集本身的多样性不够,导致没有办法做具体的项目风格,风格没有办法自定义,对于大多数商业项目来说就没有意义,即实用性很低。
但看img2video(图生视频)的部分,做氛围片、概念片,这种类型的片子应该绰绰有余了,是能吃掉一部分市场的。
Sora还有两个很厉害的地方:
1. 生成多个镜头,同时主角保持相对连贯,这个是在之前的AI视频生成工具(只能生成单个镜头且细节总是无法保持统一)没有做到的。
2. 提供了一种新的视频编辑交互范式,即用自然语言来描述视频的修改需求,然后生成新的视频,这在其V2V editing(视频生视频)的部分体现得很突出。
十分赞同“人人都是导演”这种说法,工具和资本本来都是创作的门槛,这个门槛越来越低了是好事。
@土豆人toudou_man AIGC艺术家
“Sora面世,未来创作者的价值体现在解决实际问题”
60秒在生成式视频领域里算是长视频了。Sora模型在多镜头、连续内容、稳定性、高画质、空间认知等方面,给现有的技术工具如SVD、Pika和Runway带来了不小冲击。
Sora的面世意味着个人创作者的应用空间被进一步拓展,无需依赖传统拍摄和制作手段就能创作出高质量的内容。未来这样稳定的生成式内容也会逐步渗透到广告和影视领域,至少在一定程度上替代部分现有的工作流程。
对于Sora的实际效果,我持谨慎态度。真正影响AI生成式视频内容在广告和影视领域发展的,还是内容一致性和内容准确性两个重要的判断标准。这两个标准是决定技术能否被引入工业流程的关键因素。
可以预见,Sora会和早期图文生成一样,进一步降低视效内容创作的门槛,卷死一些中层的内容创作者和制作公司。但同时,带来的也是全新的机会点,因为创作门槛降低,视频创作内容的维度也会迎来新的井喷。
部分创作者和公司焦虑的主要源头是“单位价值”,如果内容被判定为廉价且易于制作的,那就意味着产出的内容不值钱。AIGC的核心竞争力是降本增效,创作者的价值则体现在是否能解决实际问题、内容产出的定位和创作者的IP影响力。
@八云 宙晴营销实验室创始人
“谈不上打击,企业和内容生产者应该看到Sora带来的降本提效机会”
我一直比较坚信未来商业组织的形式会发生改变。DAO(去中心化自治组织)实现了公平的分配机制,剩下的是如何最大化解放个体生产力。Sora的出现则提供了更广阔的想象空间,比如一个由AGI和区块链结合的、没有总部的独角兽公司。
回看抖音的发展路线,是工具到社区、再到国民级娱乐应用。但是抖音牺牲了一部分工具属性来换取更多的社交属性,所以后面有了剪映来支持比抖音直拍更复杂的内容生产。
Sora通过指令去生成完整视频这个形式,抖音和剪映没法比较了,因为在降低门槛和成本上已经不在一个级别。
所以Sora是否能从工具走向内容消费,在于上线后看看这个工具对生产力解放到什么地步,通过指令生成的视频需要“调教”的比例是多少、难度高低如何。
我目前对AIGC使用最多是基础编辑、设计工作,提升工作效率。另外,我的一个小癖好是编写世界设定,已经写满了几个备忘录。之所以会成为一个独特的兴趣是因为没有生产力和时间把这么多的设定变成长内容,无论是小说还是影像,目前都需要投入大量时间甚至新的学习成本。所以我对Sora是充满期待的。
以目前Sora的测试视频看,我觉得对于影视工业来说谈不上打击,更多的作用是降低成本。个体创作者应该会加倍兴奋,技术迭代让创作者的核心能力集中在内容本身,比如故事能力,光影分镜只要你脑海里有,且能表达出来,生产内容的能力会指数级提高。
Sora对内容行业的赋能是双向的。其实短视频平台已经实现了“人人都是导演”,生产工具从胶片到手机,人人持有。个体KOL比拼的也已经是性格魅力、表演里和故事力,当本来就手握生产工具、制作和发行的账号创作者迎来Sora这样的工具的时候,未来可能会有影视公司购买短视频作品版权。因为你可以一个人生产有完整设定和世界观的短片。
另一方面,Sora在国内很可能会先解决营销号重复内容、碎片内容、纯情绪内容的生产成本。相比影视行业,可能直接冲击的工作岗位是营销号小编或者集中编短剧的“内容村”。
企业营销负责人和内容生产者应看到Sora带来的降本提效的机会,尤其是在短视频传播和获客方面。此外,如何把个人编写的世界设定变成短片,也是等Sora模型上线后,我会去观察的另一个方向。
Sora在技术上最大的变化就是,引入了在文本模型中被充分验证有效的自回归策略(以Tranformer为具体的技术实现方式),让视频生成的逻辑从关注像素变化变成关注语义变化,从空镜头生成变成故事的生成。
作为对比,在Sora之前的文本生成视频的工作大多关心:如何让单帧图片强行动起来,导致生成出来的内容很像空镜头。
这实际上是技术路径上的系统性升级,但是恰恰因为这是找到了一条很好的路径,所以其他团队跟进会更容易(而GPT-4才是真正大量具体技巧组成的,更难以被跟进)。我相信三个月内市场上就会有达到现有Sora 80%效果的跟进模型出现,甚至有局部场景的领先。
目前看X上发布的Sora视频,可以看出其下限是非常高的,而且有很多内容上限也很高,基本上达到了可以在大荧幕上直出的状态。
猴子无限不是基座模型公司,所以理论上所有基座模型上的进展对于我们来说,都是充分的利好,因为我们可以在基座模型的能力基础上做很多额外的工作,比如产品化地解决稳定性和可扩展性的问题,并变成给客户的解决方案。“客户不需要钻头而需要是墙上钻好的眼”,市场上新的“钻头”出现之后,能加速我们“钻出的眼”的质量和价值,这件事对于行业中绝大多数公司是一致的。
很多创作者担心Sora(和已经出现很久的其他大模型)带来影视行业的失业,是因为我们看到了供给效率的快速提升,而没有去关心因为内容生产成本降低之后,需求更大规模的提升,如果我们相信全新的需求会因此井喷,那么大概率焦虑会小很多。
未来内容创作者最大的机会其实是,从商业的角度看世界,跳出传统的“工具人”角色,去找到因为新技术出现能够满足的新机会,比如:将已有的内容规模化地变成更有吸引力和LTV的形式(小说变有声书和视频);根据长尾理论,满足过去因为成本过高无法被满足的需求;将单语言和单文化的内容快速扩展到更多文化和国家中(换脸和配音本地化),机会远超在现有需求中和AI内卷。
至于Sora未来会不会取代TikTok,从一个内容创作工具变成内容分发、消费平台,我认为一个很好的例子是印刷术,这涉及到内容消费的权力。在印刷术发明之前,人们需要聚集在教堂里听识字的人拿着羊皮卷圣经传道,这个过程中,掌握媒介的人实际上掌握了社会权力。
现在内容创作的权力被新技术下放了,TikTok带来的权力结构(中心化的内容生产者)一定会发生系统性的变化。未来大概率是有新的形态出现,但是和TikTok是平行而不是替代的关系,就像虽然圣经随处可得,现在仍然有教堂一样。
@乔治 电影制作与游戏引擎从业者
“影视制作预可视化、特效低成本化开启新纪元”
Sora完全是一个跨时代的产物,它的底层逻辑完全不是目前已知的模式,跟Runway Gen-2、Pika,还有本地部署的SVD都不是一个级别的。
Runway和Pika我都使用过,真正生成视频素材的过程中,就是在抽卡,抽个十次才有可能得到一个能用的镜头,效果实际也一般,画质有待进一步提升。但两者都收费,不是很实用。
“人人都是导演”的趋势是挡不住的,这是一个时代进程问题。未来会更考验创作者的功底,AI绘画的门槛是低,但想把AI绘画工具用好,可能还是有专业绘画背景的那帮人更有优势。你要有审美和认知,懂原理,才能更好地驾驭AI。现在做视频也一样,像我们做电影电视剧的,即便交给AI去生成视频镜头和素材,也依然需要了解传统制作的所有方法,普通人入圈是没有什么用的。
对于高成本的特效场景,Sora可以提供一种成本更低的替代方案,尤其是在预算有限的项目中。比如电视剧和电影有些镜头,按照传统的拍摄和制作流程,报价比较高,就可以直接用AI来做。
还有一种情况,导演很多天马行空的创意,成本和经费都是hold不住的。但AI可以在影视制作前期用于预可视化,帮助导演和制片人更直观地规划场景和故事线,大大降低制作公司、影视公司、视效指导等多方的沟通成本和试验成本。
@李3水 W的野狗头子
“人人都是导演”是五年前的说法,目前应该是“人人都是电视台”
对于Sora可能会给个体内容创作者或广告公司带来的冲击,W的态度是“只嫌风浪还不够大”,希望各行业最期(焦)盼(虑)的影响加速到来,且趋势成真。
历史性技术大爆发都是渐进加速的,目前所有东西都是外部技术和应用环境远超内部、定义和定价权全然不在自己人手上,比起Sora最后实际落地是否能够超预期,这种不理想体验更心塞。
“人人都是导演”是五年前的说法,目前应该是“人人都是电视台”。
面对AI冲击,W一直倡导的务虚能力和哲科思维,我认为是未来内容创作者应该培养的核心竞争力。
W出品标准图,代表W对务实市场和现实世界的一种务虚要求
“Sora仍是生成视频素材级别的AI工具”
@方伟 游方科技CEO
写在最后
「头号AI玩家交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。