中国视频AI,正在杀出一个黎明!
各位老铁们,准备好你们的瓜子和板凳,今天咱们就来看看国产 AI 视频界的这场"华山论剑"!
这周,咱们中国的软件公司在视频 AI 江湖可是大展神威
快手的"可灵 "和字节跳动的"即梦 "这两个视频AI狠角色,连续放大招,简直是要掀翻天!
先说即梦 AI,这哥们儿一出手就是"四个 A",推出了个叫 Loopy 的"对口型"魔法。
这玩意儿直接把数字人带货的门槛降到了地板,基本上就是给咱们普通老百姓免费使用了。这操作,简直是要让所有主播都失业啊!
可灵 AI 一看这情况,嘿嘿一笑,直接甩出"四个 2"!上线了个 1.5 模型,画质直接飙升到好莱坞大片水准。
不仅如此,可灵 AI 还整了个笔刷功能,能同时指挥一张图里三个不同主体按不同的轨迹运动,这操作,简直是要上天!
这一手绝活儿直接把全球 AI 界都整懵了!
连全球第一 AI 搜索引擎 Perplexity 的 印度裔CEO 都忍不住给可灵点赞!
正当可灵耍完帅准备收工的时候,却听见字节跳动悠哉悠哉地来了句:"且慢"。
轻言细语,却掷地有声
纳尼?!全球 AI 界瞬间安静如鸡。
只见字节再次出牌,这次只出了两张牌,一大一小两个王,王炸!
一个叫 Seaweed(海藻),字节跳动最新的文生视频 AI。小王
一个叫 PixelDance(像素舞动),最新的图生视频 AI。大王
哎呀我去,大哥,你咋不早出?
原本以为这是中国版的 Sora 终于要露脸了。
但是看完评测我才发现,同学们,我错了,错得离谱!
字节跳动这两个 AI 已经隐隐显出王者之气,拿 Sora 来对比有点小瞧这两位少侠了
对了,字节这两个 AI 现在需要申请才能用,具体方法我放在文末了,需要的铁粉们自取哈!
那么问题来了,为啥大家提到视频 AI,都在跟 Sora 比呢?
可能刚入坑 AI 的老铁们还不知道,Sora 是 OpenAI 今年 2 月中旬发布的视频 AI,到现在都还没正式上线呢,就跟大家一直喊的元宇宙似的,就是个大饼。
在 Sora 之前啊,AI 做视频,说是视频,其实就是几张图片抖了抖。就跟你喝假酒的时候,看啥都是抖的那种感觉。
Sora 的核心技术来自谷歌的 Diffusion Transformers(DiT)模型。
谷歌自己没整明白,Sora 倒是搞定了。
说到这儿,不得不吐槽一下,谷歌自己的论文,结果让 OpenAI 玩出了花。谷歌啊,人才是不少,但就是得了大公司病,太墨迹了!
Sora 一出世就惊为天人,简直就是从芙蓉姐姐直接进化到奶茶妹妹的水平。
大家这一看,哎呀妈呀,原来视频 AI 还能这么玩!
于是乎,八仙过海,各显神通。
国外的 Runway、Pika、Luma,国内的即梦、可灵、海螺,纷纷基于 DiT 架构推出自己的视频 AI。这阵仗,简直就是群雄逐鹿啊!
业内有个段子:OpenAI 摸着谷歌过河,大家摸着 OpenAI 过河。
这话一点没错!
那么,国内用这套模型的有十几家,为啥偏偏是字节跳动和快手率先杀出呢?
要搞 AI 视频,三个条件缺一不可:
第一,算法。现在都基于 DiT 模型,这个大家都差不多。
第二,算力。字节跳动财大气粗,这点不用愁。
第三,算素。训练AI用的视频素材这才是真正的护城河!全球最大的视频库,长视频可能是谷歌的油管,但短视频绝对是字节跳动的天下!
我敢打包票,再过个一两年,这些做短视频的公司,大部分都得转型到 AI 视频。到时候全是 AI 制作,连真人都省了!
接下来,咱们来好好聊聊字节跳动这两位少侠:
首先,字节的新视频AI生成模型简直是神了!能理解复杂的用户指令,效果堪称完美。
支持黑白、3D 动画、2D 动画、国画、水彩、水粉等各种风格;尺寸比例从 1:1 到 21:9 应有尽有。
镜头技巧更是花样百出:变焦、环绕、平摇、缩放、目标跟随,简直就是数字版的老谋子啊!
最牛的是,它能在一句话里实现多个镜头切换,还能保持主体、风格和氛围一致。
这哪是 AI 啊,这分明是数字界的"梁朝伟"和"国际章"在飙戏!
除了视频生成模型,还有音乐模型和同声传译模型。这是要把整个影视行业都搬到 AI ?!
再来说说它的特性,简直是要上天:
模型具备灵活的视角控制能力,带来更贴近现实的视觉体验,能够在不同场景中轻松切换镜头。
也就是一个 Prompt ,就能控制人物的样貌、服装和细节在不同镜头的切换下仍然保持一致,接近真实拍摄的效果
多人物同一空间下复杂互动,多镜头组合视频,极致的运镜控制。在三个模式下,人物形象始终保持一致
再给放个字节跳动官方视频集锦:
这看着就是妥妥的院线大片啊
这几个突破,对技术的要求可不是一般的高。能看出模型背后有多强的技术实力,绝对值得一试!
最后,怎么申请测试呢?
目前这两个模型只在火山引擎和即梦 aa.aiiz.cn/R2FFfq进行小范围的排队和内测,正在逐步开放中。想尝鲜的铁粉们可以先去火山引擎排队占位。
申请网址如下:
https://console.volcengine.com
大家点击“阅读原文”也可达到
登录后填个企业名称就行,随便找个真实存在的公司名填上就成。预计一个月内就能公开测试了,大家快去试试吧!
总结:
一句话,这次字节AI模型最牛的地方在于多人物、多镜头、动态切换情况下,还能保持形象的一致性
感觉这两个模型一出来,字节跳动已经稳坐国产视频 AI"魔岩三杰",即梦、可灵、海螺的头把交椅了!
就算 Sora 正式发布,也不需要三英战吕布,字节跳动已经有单挑 Sora 的实力了!
未来全球的视频 AI 王者,我赌五毛钱,绝对是在字节跳动和 Sora 之中产生!
各位老铁们,你们怎么看?咱们中国的 AI 视频技术,这是要登顶世界之巅啊!
快来评论区跟我唠唠,让我们一起为国产 AI 加油打气!中国 AI,牛逼!
咱们下期再见,拜拜!
另外,对视频 AI 感兴趣的小伙伴可以关注“sora 入门到精通”小报童!
这个频道日更!分享了很多 AIGC 的知识和最前沿的实操案例、工具、提示词。
原价 49,买断优惠推广价 10 元!