AIGC之后，让我们实现镜头自由

Original 糖总总糖总总 2023-08-25

收录于合集

#AIGC 1 个

#内容创业 8 个

#糖总总的媒体课 19 个

“ 逐渐地，然后突然地。”

文 | 糖总总

●

大家最近好吗？

我最近有一些心得，也特地来问候问候。

离上次汇报牛津读书脱层皮的经历竟然又有一年多了，我果然是你萌所说的年更作者 - -

我大部分时间都在伦敦东城区猫着，工作和学习，一边适应新地方，新行业，新文化，同时一边思考三十而立的生活。

简单而言，对这个问题实话说我还没啥答案。

哪里都有好，哪里都有不好，一万句省略后，就说句，我还真挺想家的。

主要我的中国胃作怪也是？

吃其他的都觉得缺点啥。不过最近我感觉好多同胞来伦敦，中国超市开的更多了，超市里的乡音也很多。

工作时，最近也很容易碰到中国人，特别是AI和技术相关的这块。每次一对接发现对方可以讲普通话，就觉得好开心。

之前文章里提过，我目前在的公司是做 AI 内容生成的，也就是 AIGC (AI Generated Content).

过去一年 AIGC 这块发生的巨大变化更不用我来叙述，我只是想表达，之前有关科技浪潮的文章里提过的一个关于技术奇点 (Singularity) 来临的观点：

未来学家雷蒙德·库茨魏尔（Ray Kurzweil)）把这种人类科技进步的加速发展称作加速回报定律（Law of Accelerating Returns）。

他认为整个 20 世纪 100 年的进步，按照 2000 年的速度只要 20 年就能达成 —— 2000 年的发展速度是 20 世纪平均发展速度的 5 倍。2014 年开始，只要花 7 年（2021年），就能达到又一个 20 世纪一百年的进步。

他提过，那 2030 年的世界可能就能把我们吓一大跳，2050 年的世界会变得面目全非。

还记得我之前提过的这个曲线吗？那个转折点就是奇点所在。

我真的觉得，我们目前站在这个点上。

像互联网先驱 Tim OReilly 说的那样，技术变革都是这样按照「逐渐地，然后突然地”」趋势的浪潮发展的。

关键是自己要做点什么，可以有意义地参与。

不过，千万别觉得我在伦敦找工作的时候，脑子里有带着这些宏大牛逼的理论，事实上完全没有。

我只是给自己定了几点原则：

1. 尽量找好的人一起工作。创始人和创始团队的素质和人品，决定了团队能力能不能更好发挥，大家是否能同甘共苦。

特别是共苦这点。最好的小伙伴和导师都是创业时候，或者因为创业相关的原因认识的。

我们互相见过最艰难时刻最差的一面，竟然还是朋友，真不容易 - -

2. 尽量和内容变革相关。从传统媒体 Media 到 PGC (Professional Generated Content), 再到 UGC (User Generated Content), 读我公众号时间长的同学可能记得，我就是对内容感兴趣。

一直在试图搞明白，互联网传播方式的巨大变革，对内容生成带来的社会影响（可以看公众号内目录：糖总总的媒体课）。我在牛津做的研究生课题也是Z世代的视频内容生成。

多一句嘴，我强调变革，是因为光从内容生产本身可能会容易一叶障目。因为直到 AIGC 之前，内容生产的成本都非常高（文章后面有专门讲），如果简单去比如做一个新媒体的小编，十有八九时间会被大量的成产过程占据，而不够时间去研究新的图景。

我比较关注变化向的东西。做事要抓关键，做四两拨千斤的事情。

我想起来笑来老师其实之前经常讲，不要被特定媒体的形态绑住。不要陷在更高效地手工给村庄取水，要思考怎么先自动化搭建水渠。即使，刚开始的时候，手工的方法见效更快。你要稳得住。

这也一直是我为什么近几年不执着于更新内容的原因，因为太占精力了，还有很多东西需要学。

当然，这也给自己年更这个状态，找个冠冕堂皇借口，不要介意 - -

3. 尽量和内容生成的新技术相关。我入职我现在公司时候，牛津的互联网中心是学校里讨论 AI 对社会影响最前沿的地方了，但当时讨论 AI，也大多数是在 AI 的道德层面和数据保护层面。

AI 在当时还没有变成内容生成的杠杆。

在牛津的时候我参与了一个 Entrepreneural Program，当时有很多 start-up 在这个创业中心孵化。

我选了一个离内容生成最近的，也就是现在的公司。刚开始我们是在做 3D 生成的 Nerf 技术，帮助大家产生镜像一般的虚拟现实内容。

随着 AIGC 相关研究的井喷，我们结合 AI 生成视频和 3D，在内部的 Creative Lab 孵化了一系列技术。

我当时并没有想到 AIGC 会变成一个专有名词，然后突然 AI 生成内容的奇点来临：按照内容的视觉化难度层级来看，大家看到文字和图片的 AIGC 内容只是前奏 - 视频，游戏，3D 都会继续按照奇点的速度发展。

我记得年初，有一天在家里高兴地鼓掌：一直研究的 Media-PGC-UGC-AIGC 这条脉络竟然连起来了。

讲述 AIGC 的意义之前，我们先来说说镜头这个概念，因为极大可以帮助理解。

媒体出身的我，某种意义上我一直是不喜欢镜头的。

这不仅仅是，我自己觉得自己不上相的原因。

Camera 是人类的一个伟大发明。从小孔成像实验到现代电影的发展，镜头背后也叠加了几个世纪的技术buff。

我所谓的不喜欢，是从社会学的意义上来说的。镜头是记录和反映现实的一种强有力媒介。

观察现实的视角，就是镜头在塑造的。

大众媒介的变化，核心就是镜头塑造权利和能力的去中心化，特别是智能手机出现之后。

其实大家都是在围着镜头转：

新闻用镜头传递正在发生的事实（理论理想情况下 - - ）；
广告用镜头创造吸引人的视觉；电影和电影用镜头语言传达故事的情感和节奏；
短视频和智能手机把前面一众都极简化；
直播本身不新鲜，新闻行业对于反常事件的会用镜头在线的方式体现。只是如今在电商和娱乐行业，因为商业模式的连通，镜头前生活变成了一个 7 X 24 小时不间断的现象（不一定是好现象）。

媒体和注意力本身是有二八法则的，所以无论技术如何变化，一定会有 20% （甚至更少的比例）能够得到 80% （甚至更多）的注意力。

但是这个媒介造就的大众注意力聚焦点，很难让人不关注，更难做到公平公正。

关键是，谁在塑造，谁在看?

更关键的是，因为镜头的能耐，因为智能手机的普及性 - 越来越多的人为了镜头而活。

一部分是在镜头前表演自己的人生，另一部分是观看镜头上别人的人生。

「黑镜」实现了一般的感觉。

每次出门吃饭的时候，看到邻桌有漂亮姑娘以拍照和拍视频作为在餐馆的主要任务，我都想问问技术和互联网先驱们，这样的社会影响你们怎么看。

这点在北京和伦敦，没有啥区别。

其实我公众号的老读者都知道，我是很赞成掌握媒介素养（media literacy），让媒体能力成为自己的杠杆的。

我也一直在鼓励传统媒体的老朋友们勇敢迈出科技的这一步。

像前沿科技投资者 Naval 说的那样，新兴媒体和技术能力是重要的创业杠杆，和做传统商业不同，人的负担更小（permissionless）更容易scale up 。

但是真正的媒介素养，不止是能力的达成，而是某种程度上的自由运用。

一定要注意，是我们要拿捏媒体和技术，不是反过来。

我们应该用镜头记录值得记录的生活，而不是一切。

不要为了镜头而活。这样不自由。

不过你要问了，为什么说 AIGC 到一半，过来喷镜头啊？

其实这是我想到的，AI 生成内容对我而言的第一个意义 —— AIGC成为创作杠杆，帮我们实现 镜头自由。

AI 生成内容，从这个角度可以理解成，很多内容不再需要镜头来反映，可让 AI 经过一定的训练，来想象某个人，某个事物和某个场景等等的样子 - 不再需要现实取景。

人类很快就可以减少不必要的因为镜头花费的，无谓的时间。

举个栗子。

我这篇文章的题图，其实就是我们 Creative Lab 内部的 AI 工具生成的（还不成熟，只是原型实验）。

仔细看其实左边有点点像我 —— 这是我和前端同事的虚拟合影，然后加上了我们小时候的样子。输入的内容只有我和他的自拍照，和一些风格咒语（text prompts）。输出内容等待了 10s。

我并没有打开镜头来实现这张合影。

我的同事人在东欧，并不在伦敦。我俩开视频会议做个合影截图也没啥特别的意义。更何况，我们不可能在小时候认识，我俩也都没有高超的P图技术。

这对大众媒介而言，是革命性的 —— 最重要的介质被挑战，这意味着几个世纪以来，人类围绕镜头这样的介质，所塑造的所有内容生产流程和分工被打破。

我上面提到的围着镜头转的行业，都会经历大变革。因为奇点已经来临。

其实现在已经有很多关于 AI 所生成的内容真实性和道德性的讨论。我想说，这个问题太大，这篇文章的落脚点也不在宏观层面，而是个体自身。

AIGC 来临之前，内容真实性和道德性的问题本身就存在。媒介和内容永远是人性的照妖镜而已。

如何可以让 AIGC 成为更好的创作杠杆？

这里如果我们直接把这个问题喂给 GPT4，会很快能得到一个概貌：

样式迁移: 人工智能可以在不同的图像和视频之间迁移风格，例如将一个普通照片转化为梵高或毕加索的画风。

场景生成：使用AIGC，可以生成虚拟的背景或场景，以模拟实际拍摄环境。这对于制作需要特定环境但预算有限的影片尤其有用。

角色插入：可以将AI生成的或实际拍摄的角色插入到另一个视频场景中，使其看起来像是在原地被拍摄的。

视频增强：通过AIGC，可以改进视频的质量，例如从低分辨率提升到高分辨率，或改善在差的光照条件下拍摄的视频。

面部和表情生成: AIGC可以生成各种面部和表情，这在广告和娱乐行业中有广泛的应用。

动画和3D模型生成: 通过AIGC，可以快速生成3D模型或动画，大大缩短了传统的创作时间。

我选了一些跟我想说的主题相关的答案，基本是围绕镜头相关的内容制作来的：拍摄前的人物和场景准备，拍摄中的表演和拍摄之后的后期，以及视觉和创意效果增强等等。

你看，GPT4 其实已经减少了我这篇文章的创作成本 —— 减少我查找和描述基本事实的时间，我则可以聚焦在我的核心观点。

镜头相关创作成本的大大降低，这代表着 AIGC 可以帮助我们填补很多将想法具象化的视觉。

这其实不仅仅和专业的影视从业者有关 —— 我的判断是，很多写文章的作者，很可能变成视频创作者。

这点其实让我非常欣慰，因为这样让有想法的作者可以更好讲故事。

Robert Mckee, 电影制作和叙事技巧经典制作「故事」的作者，有一个核心观点就是，故事的核心不在表面（extrinsic）叙事，而是内在（intrinsic）价值。

好看的电影，画面可以很粗糙，但是可以很扎心。一个内在价值好的内容，起到的就是四两拨千斤的效果 —— 通过抓住 20% 的最重要的关键，实现80%的效果。

很多时候华而不实的电影制作是，80% 的制作花在了表面功夫。而很多很好地作者，卡在了镜头和拍摄这一环。

试想一个有想法的作者，再也不用担心出镜，演员，拍摄和后期的大部分成本。目前 AI 还只能实现通过文字输入，产生电影预告片一样的视觉。但是这是 0 到 1 的质变。

试想一个好看的生活方式网红，可以拍摄少量的经典照片，让 AI 让图片实现动感，短视频轻松可以完成。再也不用大部分时间用来摆拍生活场景，而是可以让数字分身去拼接相对重复的生活取景和拍摄。

深谙镜头这行的人，在镜头面前，对于如何安排时间，可能把握还多一些。最可能走偏的是以为开了镜头就能够拥有塑造注意力的能力，结果让时间面前，静静地流失 —— 成本特别高。

新媒体账户上多的几个数据，一生却被镜头拿捏，人间不值得。

期待看到镜头自由的时代，创作图景会出现怎样的改变。

期待镜头在大家生活中的占据比例，特别是不必要的部分，可以逐渐淡化。

希望全世界的漂亮姑娘们在餐馆里，都能不用摆拍，可以好好吃饭。

感谢大家花时间读完今年的年更文章。感谢远在深圳的一条大狗同学给我做的文章风格设计，他 3 年前帮我弄的，我到现在还在用。我真的一点编辑和视觉化都懒得搞 - - 所以说为啥我有动力研究 AI 如何辅助文字创作呢。

下一次什么时候更新呢？我尽量 - - 看心得什么时候来。

感兴趣的话可以去阅读原文看看我刚忙完的官网更新，还有我们的 Creative Lab 最近做的一些视频 demo。有想法欢迎留言探讨，一起切磋。

祝大家新的一周工作不要那么累。

让我们都聚焦在 20% 最重要的地方 —— 打磨一个内在价值好的想法。

微信公众号糖总总（ID：clairetangmedia）的读者都会记得要想想 AIGC 是否能成为自己的杠杆。欢迎转发到朋友圈，低调点击一下「在看」↘️

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖

AIGC之后，让我们实现镜头自由

您可能也对以下帖子感兴趣

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖

生成图片，分享到微信朋友圈

AIGC之后，让我们实现镜头自由

您可能也对以下帖子感兴趣