中国视频AI，正在杀出一个黎明！

Original 风清徐徐来 AI变现研习社

2024-10-17

各位老铁们，准备好你们的瓜子和板凳，今天咱们就来看看国产 AI 视频界的这场"华山论剑"！

这周，咱们中国的软件公司在视频 AI 江湖可是大展神威

快手的"可灵 "和字节跳动的"即梦 "这两个视频AI狠角色，连续放大招，简直是要掀翻天！

先说即梦 AI，这哥们儿一出手就是"四个 A"，推出了个叫 Loopy 的"对口型"魔法。

这玩意儿直接把数字人带货的门槛降到了地板，基本上就是给咱们普通老百姓免费使用了。这操作，简直是要让所有主播都失业啊！

可灵 AI 一看这情况，嘿嘿一笑，直接甩出"四个 2"！上线了个 1.5 模型，画质直接飙升到好莱坞大片水准。

不仅如此，可灵 AI 还整了个笔刷功能，能同时指挥一张图里三个不同主体按不同的轨迹运动，这操作，简直是要上天！

这一手绝活儿直接把全球 AI 界都整懵了！

连全球第一 AI 搜索引擎 Perplexity 的印度裔CEO 都忍不住给可灵点赞！

正当可灵耍完帅准备收工的时候，却听见字节跳动悠哉悠哉地来了句："且慢"。

轻言细语，却掷地有声

纳尼？！全球 AI 界瞬间安静如鸡。

只见字节再次出牌，这次只出了两张牌，一大一小两个王，王炸！

一个叫 Seaweed（海藻），字节跳动最新的文生视频 AI。小王

一个叫 PixelDance(像素舞动），最新的图生视频 AI。大王

哎呀我去，大哥，你咋不早出？

原本以为这是中国版的 Sora 终于要露脸了。

但是看完评测我才发现，同学们，我错了，错得离谱！

字节跳动这两个 AI 已经隐隐显出王者之气，拿 Sora 来对比有点小瞧这两位少侠了

对了，字节这两个 AI 现在需要申请才能用，具体方法我放在文末了，需要的铁粉们自取哈！

那么问题来了，为啥大家提到视频 AI，都在跟 Sora 比呢？

可能刚入坑 AI 的老铁们还不知道，Sora 是 OpenAI 今年 2 月中旬发布的视频 AI，到现在都还没正式上线呢，就跟大家一直喊的元宇宙似的，就是个大饼。

在 Sora 之前啊，AI 做视频，说是视频，其实就是几张图片抖了抖。就跟你喝假酒的时候，看啥都是抖的那种感觉。

Sora 的核心技术来自谷歌的 Diffusion Transformers（DiT）模型。

谷歌自己没整明白，Sora 倒是搞定了。

说到这儿，不得不吐槽一下，谷歌自己的论文，结果让 OpenAI 玩出了花。谷歌啊，人才是不少，但就是得了大公司病，太墨迹了！

Sora 一出世就惊为天人，简直就是从芙蓉姐姐直接进化到奶茶妹妹的水平。

大家这一看，哎呀妈呀，原来视频 AI 还能这么玩！

于是乎，八仙过海，各显神通。

国外的 Runway、Pika、Luma，国内的即梦、可灵、海螺，纷纷基于 DiT 架构推出自己的视频 AI。这阵仗，简直就是群雄逐鹿啊！

业内有个段子：OpenAI 摸着谷歌过河，大家摸着 OpenAI 过河。

这话一点没错！

那么，国内用这套模型的有十几家，为啥偏偏是字节跳动和快手率先杀出呢？

要搞 AI 视频，三个条件缺一不可：

第一，算法。现在都基于 DiT 模型，这个大家都差不多。

第二，算力。字节跳动财大气粗，这点不用愁。

第三，算素。训练AI用的视频素材这才是真正的护城河！全球最大的视频库，长视频可能是谷歌的油管，但短视频绝对是字节跳动的天下！

我敢打包票，再过个一两年，这些做短视频的公司，大部分都得转型到 AI 视频。到时候全是 AI 制作，连真人都省了！

接下来，咱们来好好聊聊字节跳动这两位少侠：

首先，字节的新视频AI生成模型简直是神了！能理解复杂的用户指令，效果堪称完美。

支持黑白、3D 动画、2D 动画、国画、水彩、水粉等各种风格；尺寸比例从 1:1 到 21:9 应有尽有。

镜头技巧更是花样百出：变焦、环绕、平摇、缩放、目标跟随，简直就是数字版的老谋子啊！

最牛的是，它能在一句话里实现多个镜头切换，还能保持主体、风格和氛围一致。

这哪是 AI 啊，这分明是数字界的"梁朝伟"和"国际章"在飙戏！

除了视频生成模型，还有音乐模型和同声传译模型。这是要把整个影视行业都搬到 AI ？！

再来说说它的特性，简直是要上天：

多主体多动作交互，不再是一个人的独角戏了。实现导演自由!

一致性的镜头切换，10 秒视频里能讲一个完整的故事，剧情感爆棚！实现编剧自由!

模型具备灵活的视角控制能力，带来更贴近现实的视觉体验，能够在不同场景中轻松切换镜头。

大师级运镜。动态超强，变焦、环绕、平摇、缩放、目标跟随，一气呵成。实现摄影师自由!

也就是一个 Prompt ，就能控制人物的样貌、服装和细节在不同镜头的切换下仍然保持一致，接近真实拍摄的效果

多人物同一空间下复杂互动，多镜头组合视频，极致的运镜控制。在三个模式下，人物形象始终保持一致

再给放个字节跳动官方视频集锦：

这看着就是妥妥的院线大片啊

这几个突破，对技术的要求可不是一般的高。能看出模型背后有多强的技术实力，绝对值得一试！

最后，怎么申请测试呢？

目前这两个模型只在火山引擎和即梦 aa.aiiz.cn/R2FFfq进行小范围的排队和内测，正在逐步开放中。想尝鲜的铁粉们可以先去火山引擎排队占位。

申请网址如下：

https://console.volcengine.com

大家点击“阅读原文”也可达到

登录后填个企业名称就行，随便找个真实存在的公司名填上就成。预计一个月内就能公开测试了，大家快去试试吧！

总结：

一句话，这次字节AI模型最牛的地方在于多人物、多镜头、动态切换情况下，还能保持形象的一致性

感觉这两个模型一出来，字节跳动已经稳坐国产视频 AI"魔岩三杰"，即梦、可灵、海螺的头把交椅了！

就算 Sora 正式发布，也不需要三英战吕布，字节跳动已经有单挑 Sora 的实力了！

未来全球的视频 AI 王者，我赌五毛钱，绝对是在字节跳动和 Sora 之中产生！

各位老铁们，你们怎么看？咱们中国的 AI 视频技术，这是要登顶世界之巅啊！

快来评论区跟我唠唠，让我们一起为国产 AI 加油打气！中国 AI，牛逼！

咱们下期再见，拜拜！

另外，对视频 AI 感兴趣的小伙伴可以关注“sora 入门到精通”小报童！

这个频道日更！分享了很多 AIGC 的知识和最前沿的实操案例、工具、提示词。

原价 49，买断优惠推广价 10 元！

字节跳动即梦上线数字人带货神器！谁是AI界的老司机?
简直无敌了! AI + Canva 批量海报制造机
卧槽！海螺 AI 视频把我整懵了，这波操作太秀了！
有了文小言，我也是穿普拉达的女王
你不能错过的操作秘籍，办公室小白也能轻松搞定 Excel 动态图表
七个国外顶流AI的国产平替，不花钱还超好用环肥燕瘦！
免费使用 GPT-4o 的六个网站
掌握了这些神器，你就是办公室卷王！
用AI画小姐姐，真的太顶了！
美国人吹的牛，被这个中国AI实现了！
又被夸了！六个案例讲透 AI 做文档分析
天呐! AI 之王 GPT-6 猎户座来了！
房屋养老金=房产税？AI竟然这样回答
免费生成美猴王图片的六个AI网站
姜萍作弊了吗？我问了18个AI搜索，竟给出了这样的回答
Kimi+ WPS，5 分钟做行研 PPT
清华 AI 团队用 ChatGPT 开医院，一天看完几年的病
保姆级教程！手把手教你支付宝开通 ChatGPT plus！
可视化！用 GT4 十分钟内完成泰坦尼克号生存分析

修改于

继续滑动看下一个

AI变现研习社

向上滑动看下一个

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

国内突然宣布，将大规模调整经济布局！又一朝阳行业悄然崛起，新一轮机会出现了！

中国视频AI，正在杀出一个黎明！

您可能也对以下帖子感兴趣

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋 华人崩溃大哭 连空姐都吐了; 客机颠簸盘旋3小时

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

国内突然宣布，将大规模调整经济布局！又一朝阳行业悄然崛起，新一轮机会出现了！

生成图片，分享到微信朋友圈

中国视频AI，正在杀出一个黎明！

您可能也对以下帖子感兴趣

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时