AIGC之后,让我们实现镜头自由
“ 逐渐地,然后突然地。”
文 | 糖总总
●
01
大家最近好吗?
我最近有一些心得,也特地来问候问候。
离上次汇报牛津读书脱层皮的经历竟然又有一年多了,我果然是你萌所说的年更作者 - -
我大部分时间都在伦敦东城区猫着,工作和学习,一边适应新地方,新行业,新文化,同时一边思考三十而立的生活。
简单而言,对这个问题实话说我还没啥答案。
哪里都有好,哪里都有不好,一万句省略后,就说句,我还真挺想家的。
主要我的中国胃作怪也是?
吃其他的都觉得缺点啥。不过最近我感觉好多同胞来伦敦,中国超市开的更多了,超市里的乡音也很多。
工作时,最近也很容易碰到中国人,特别是AI和技术相关的这块。每次一对接发现对方可以讲普通话,就觉得好开心。
02
之前文章里提过,我目前在的公司是做 AI 内容生成的,也就是 AIGC (AI Generated Content).
过去一年 AIGC 这块发生的巨大变化更不用我来叙述,我只是想表达,之前有关科技浪潮的文章里提过的一个关于技术奇点 (Singularity) 来临的观点:
未来学家雷蒙德·库茨魏尔(Ray Kurzweil))把这种人类科技进步的加速发展称作加速回报定律(Law of Accelerating Returns)。
他认为整个 20 世纪 100 年的进步,按照 2000 年的速度只要 20 年就能达成 —— 2000 年的发展速度是 20 世纪平均发展速度的 5 倍。2014 年开始,只要花 7 年(2021年),就能达到又一个 20 世纪一百年的进步。
他提过,那 2030 年的世界可能就能把我们吓一大跳,2050 年的世界会变得面目全非。
还记得我之前提过的这个曲线吗? 那个转折点就是奇点所在。
我真的觉得,我们目前站在这个点上。
像互联网先驱 Tim OReilly 说的那样,技术变革都是这样按照「逐渐地,然后突然地”」 趋势的浪潮发展的。
关键是自己要做点什么,可以有意义地参与。
03
不过,千万别觉得我在伦敦找工作的时候,脑子里有带着这些宏大牛逼的理论,事实上完全没有。
我只是给自己定了几点原则:
1. 尽量找好的人一起工作。创始人和创始团队的素质和人品,决定了团队能力能不能更好发挥,大家是否能同甘共苦。
特别是共苦这点。最好的小伙伴和导师都是创业时候,或者因为创业相关的原因认识的。
我们互相见过最艰难时刻最差的一面,竟然还是朋友,真不容易 - -
2. 尽量和内容变革相关。从传统媒体 Media 到 PGC (Professional Generated Content), 再到 UGC (User Generated Content), 读我公众号时间长的同学可能记得,我就是对内容感兴趣。
一直在试图搞明白,互联网传播方式的巨大变革,对内容生成带来的社会影响(可以看公众号内目录:糖总总的媒体课)。我在牛津做的研究生课题也是Z世代的视频内容生成。
多一句嘴,我强调变革,是因为光从内容生产本身可能会容易一叶障目。因为直到 AIGC 之前,内容生产的成本都非常高(文章后面有专门讲),如果简单去比如做一个新媒体的小编,十有八九时间会被大量的成产过程占据,而不够时间去研究新的图景。
我比较关注变化向的东西。做事要抓关键,做四两拨千斤的事情。
我想起来笑来老师其实之前经常讲,不要被特定媒体的形态绑住。不要陷在更高效地手工给村庄取水,要思考怎么先自动化搭建水渠。即使,刚开始的时候,手工的方法见效更快。你要稳得住。
这也一直是我为什么近几年不执着于更新内容的原因,因为太占精力了,还有很多东西需要学。
当然,这也给自己年更这个状态,找个冠冕堂皇借口,不要介意 - -
3. 尽量和内容生成的新技术相关。我入职我现在公司时候,牛津的互联网中心是学校里讨论 AI 对社会影响最前沿的地方了,但当时讨论 AI,也大多数是在 AI 的道德层面和数据保护层面。
AI 在当时还没有变成内容生成的杠杆。
在牛津的时候我参与了一个 Entrepreneural Program,当时有很多 start-up 在这个创业中心孵化。
我选了一个离内容生成最近的,也就是现在的公司。刚开始我们是在做 3D 生成的 Nerf 技术,帮助大家产生镜像一般的虚拟现实内容。
随着 AIGC 相关研究的井喷,我们结合 AI 生成视频和 3D,在内部的 Creative Lab 孵化了一系列技术。
我当时并没有想到 AIGC 会变成一个专有名词,然后突然 AI 生成内容的奇点来临:按照内容的视觉化难度层级来看,大家看到文字和图片的 AIGC 内容只是前奏 - 视频,游戏,3D 都会继续按照奇点的速度发展。
我记得年初,有一天在家里高兴地鼓掌:一直研究的 Media-PGC-UGC-AIGC 这条脉络竟然连起来了。
04
讲述 AIGC 的意义之前,我们先来说说镜头这个概念,因为极大可以帮助理解。
媒体出身的我,某种意义上我一直是不喜欢镜头的。
这不仅仅是,我自己觉得自己不上相的原因。
Camera 是人类的一个伟大发明。从小孔成像实验到现代电影的发展,镜头背后也叠加了几个世纪的技术buff。
我所谓的不喜欢,是从社会学的意义上来说的。镜头是记录和反映现实的一种强有力媒介。
观察现实的视角,就是镜头在塑造的。
大众媒介的变化,核心就是镜头塑造权利和能力的去中心化,特别是智能手机出现之后。
其实大家都是在围着镜头转:
新闻用镜头传递正在发生的事实(理论理想情况下 - - );
广告用镜头创造吸引人的视觉;电影和电影用镜头语言传达故事的情感和节奏;
短视频和智能手机把前面一众都极简化;
直播本身不新鲜,新闻行业对于反常事件的会用镜头在线的方式体现。只是如今在电商和娱乐行业,因为商业模式的连通,镜头前生活变成了一个 7 X 24 小时不间断的现象(不一定是好现象)。
媒体和注意力本身是有二八法则的,所以无论技术如何变化,一定会有 20% (甚至更少的比例)能够得到 80% (甚至更多)的注意力。
但是这个媒介造就的大众注意力聚焦点,很难让人不关注,更难做到公平公正。
关键是,谁在塑造,谁在看?
更关键的是,因为镜头的能耐,因为智能手机的普及性 - 越来越多的人为了镜头而活。
一部分是在镜头前表演自己的人生,另一部分是观看镜头上别人的人生。
「黑镜」实现了一般的感觉。
每次出门吃饭的时候,看到邻桌有漂亮姑娘以拍照和拍视频作为在餐馆的主要任务,我都想问问技术和互联网先驱们,这样的社会影响你们怎么看。
这点在北京和伦敦,没有啥区别。
05
其实我公众号的老读者都知道,我是很赞成掌握媒介素养(media literacy),让媒体能力成为自己的杠杆的。
我也一直在鼓励传统媒体的老朋友们勇敢迈出科技的这一步。
像前沿科技投资者 Naval 说的那样,新兴媒体和技术能力是重要的创业杠杆,和做传统商业不同,人的负担更小(permissionless)更容易scale up 。
但是真正的媒介素养,不止是能力的达成,而是某种程度上的自由运用。
一定要注意,是我们要拿捏媒体和技术,不是反过来。
我们应该用镜头记录值得记录的生活,而不是一切。
不要为了镜头而活。这样不自由。
不过你要问了,为什么说 AIGC 到一半,过来喷镜头啊?
其实这是我想到的,AI 生成内容对我而言的第一个意义 —— AIGC成为创作杠杆,帮我们实现 镜头自由。
AI 生成内容,从这个角度可以理解成,很多内容不再需要镜头来反映,可让 AI 经过一定的训练,来想象某个人,某个事物和某个场景等等的样子 - 不再需要现实取景。
人类很快就可以减少不必要的因为镜头花费的,无谓的时间。
举个栗子。
我这篇文章的题图,其实就是我们 Creative Lab 内部的 AI 工具生成的(还不成熟,只是原型实验)。
仔细看其实左边有点点像我 —— 这是我和前端同事的虚拟合影,然后加上了我们小时候的样子。输入的内容只有我和他的自拍照,和一些风格咒语(text prompts)。输出内容等待了 10s。
我并没有打开镜头来实现这张合影。
我的同事人在东欧,并不在伦敦。我俩开视频会议做个合影截图也没啥特别的意义。更何况,我们不可能在小时候认识,我俩也都没有高超的P图技术。
这对大众媒介而言,是革命性的 —— 最重要的介质被挑战,这意味着几个世纪以来,人类围绕镜头这样的介质,所塑造的所有内容生产流程和分工被打破。
我上面提到的围着镜头转的行业,都会经历大变革。因为奇点已经来临。
06
其实现在已经有很多关于 AI 所生成的内容真实性和道德性的讨论。我想说,这个问题太大,这篇文章的落脚点也不在宏观层面,而是个体自身。
AIGC 来临之前,内容真实性和道德性的问题本身就存在。媒介和内容永远是人性的照妖镜而已。
如何可以让 AIGC 成为更好的创作杠杆?
这里如果我们直接把这个问题喂给 GPT4,会很快能得到一个概貌:
样式迁移: 人工智能可以在不同的图像和视频之间迁移风格,例如将一个普通照片转化为梵高或毕加索的画风。
场景生成:使用AIGC,可以生成虚拟的背景或场景,以模拟实际拍摄环境。这对于制作需要特定环境但预算有限的影片尤其有用。
角色插入:可以将AI生成的或实际拍摄的角色插入到另一个视频场景中,使其看起来像是在原地被拍摄的。
视频增强:通过AIGC,可以改进视频的质量,例如从低分辨率提升到高分辨率,或改善在差的光照条件下拍摄的视频。
面部和表情生成: AIGC可以生成各种面部和表情,这在广告和娱乐行业中有广泛的应用。
动画和3D模型生成: 通过AIGC,可以快速生成3D模型或动画,大大缩短了传统的创作时间。
我选了一些跟我想说的主题相关的答案,基本是围绕镜头相关的内容制作来的:拍摄前的人物和场景准备,拍摄中的表演和拍摄之后的后期,以及视觉和创意效果增强等等。
你看,GPT4 其实已经减少了我这篇文章的创作成本 —— 减少我查找和描述基本事实的时间,我则可以聚焦在我的核心观点。
镜头相关创作成本的大大降低,这代表着 AIGC 可以帮助我们填补很多将想法具象化的视觉。
这其实不仅仅和专业的影视从业者有关 —— 我的判断是,很多写文章的作者,很可能变成视频创作者。
这点其实让我非常欣慰,因为这样让有想法的作者可以更好讲故事。
Robert Mckee, 电影制作和叙事技巧经典制作「故事」的作者,有一个核心观点就是,故事的核心不在表面(extrinsic)叙事,而是内在(intrinsic)价值。
好看的电影,画面可以很粗糙,但是可以很扎心。一个内在价值好的内容,起到的就是四两拨千斤的效果 —— 通过抓住 20% 的最重要的关键,实现80%的效果。
很多时候华而不实的电影制作是,80% 的制作花在了表面功夫。而很多很好地作者,卡在了镜头和拍摄这一环。
试想一个有想法的作者,再也不用担心出镜,演员,拍摄和后期的大部分成本。目前 AI 还只能实现通过文字输入,产生电影预告片一样的视觉。但是这是 0 到 1 的质变。
试想一个好看的生活方式网红,可以拍摄少量的经典照片,让 AI 让图片实现动感,短视频轻松可以完成。再也不用大部分时间用来摆拍生活场景,而是可以让数字分身去拼接相对重复的生活取景和拍摄。
深谙镜头这行的人,在镜头面前,对于如何安排时间,可能把握还多一些。最可能走偏的是以为开了镜头就能够拥有塑造注意力的能力,结果让时间面前,静静地流失 —— 成本特别高。
新媒体账户上多的几个数据,一生却被镜头拿捏,人间不值得。
期待看到镜头自由的时代,创作图景会出现怎样的改变。
期待镜头在大家生活中的占据比例,特别是不必要的部分,可以逐渐淡化。
希望全世界的漂亮姑娘们在餐馆里,都能不用摆拍,可以好好吃饭。
07
感谢大家花时间读完今年的年更文章。感谢远在深圳的一条大狗同学给我做的文章风格设计,他 3 年前帮我弄的,我到现在还在用。我真的一点编辑和视觉化都懒得搞 - - 所以说为啥我有动力研究 AI 如何辅助文字创作呢。
下一次什么时候更新呢?我尽量 - - 看心得什么时候来。
感兴趣的话可以去阅读原文看看我刚忙完的官网更新,还有我们的 Creative Lab 最近做的一些视频 demo。有想法欢迎留言探讨,一起切磋。
祝大家新的一周工作不要那么累。
让我们都聚焦在 20% 最重要的地方 —— 打磨一个内在价值好的想法。
微信公众号糖总总(ID:clairetangmedia)的读者都会记得要想想 AIGC 是否能成为自己的杠杆。欢迎转发到朋友圈,低调点击一下「在看」↘️