实测7款「Sora级」视频生成神器，谁有本事登上「铁王座」？

Original 关注AI的机器之能

2024-09-05

机器之能报道编辑：杨文

谁能成为AI视频圈的King？

美剧《权力的游戏》中，有一把「铁王座」。

传说，它由巨龙「黑死神」熔掉上千把敌人丢弃的利剑铸成，象征着无上的权威。为了坐上这把铁椅子，各大家族展开了一场场争斗和厮杀。

而自 Sora 出现以来，AI 视频圈也掀起了一场轰轰烈烈的「权力的游戏」，这场游戏的玩家主要有大洋彼岸的 Runway Gen-3、Luma，国内的快手可灵、字节即梦、智谱清影、Vidu、PixVerse V2 等。

今天我们就来测评一下，看看究竟谁有资格登上 AI 视频圈的「铁王座」。

-1-

文生视频

目前，文生视频功能已经是各家 AI 视频产品的「拿手好戏」，我们就把它当个开胃菜。

Prompt 1：The camera directly faces colorful buildings in Burano Italy. An adorable dalmation looks through a window on a building on the ground floor.

中文提示词 1：镜头直接对着意大利布拉诺五颜六色的建筑，一只可爱的斑点狗从一楼的窗户往外看。

可灵：

即梦：

清影：

Vidu:

PixVerse V2:

Luma：

Runway Gen-3：

各家都生成了五颜六色的建筑，从运动幅度以及画面的精美程度来看，Runway Gen-3 效果最佳，其次可灵和即梦也挺丝滑。

Prompt 2：Nighttime footage of hermit crabs using light bulbs as shells.

中文提示词 2：寄居蟹用灯泡做壳的夜间镜头。

可灵：

即梦：

清影：

Vidu:

PixVerse V2:

Luma：

Runway Gen-3：

大部分视频中，要么是寄居蟹动几下钳子，要么就是摇镜头，相对而言， Vidu 和 Runway Gen-3 的视频运动幅度最大。Vidu 生成的视频中，寄居蟹一溜烟都快跑没影了， Runway Gen-3则展示了寄居蟹爬动的过程。

Luma 的寄居蟹长得最奇怪，圆滚滚的，有点像满地爬的蟑螂。

Prompt 3：The story of a robot’s life in a cyberpunk setting.

中文提示词 3：一个机器人在赛博朋克背景下的生活故事。

可灵：

即梦：

清影：

Vidu:

PixVerse V2:

Luma：

Runway Gen-3：

除了 Luma 没有出现像样的机器人外，其他各家都展示了各自想象中的机器人形象。

可灵生成的视频画面，在构图和镜头上神似 Sora 放出来的「东京女子走在街头」的示例；即梦的画面最为精美和赛博朋克，而 Vidu 则有种科幻片的即视感； PixVerse V2 的机器人最怪异，像顶了个水桶脑袋。

要说逼真程度以及运动幅度，Runway Gen-3 的效果似乎更胜一筹，当然它也有 bug，比如凭空出现并向后疾驰的汽车。

Prompt 4：The waves are lapping against the shells on the beach.

提示词 4: 海浪拍打着沙滩上的贝壳。

可灵：

即梦：

清影：

Vidu:

PixVerse V2:

Luma：

Runway Gen-3：

整体来说，可灵和即梦生成的效果最真实，Luma 的贝壳看起来有点变形，最离谱的是 PixVerse V2，一开始画面还算正常，但眨眼功夫跑出来一个人，面部表情以及手部崩得没眼看。

Prompt 5：Cartoon style, a kangaroo is dancing

提示词 5: 卡通风格，一只袋鼠在跳舞。

可灵：

即梦：

清影：

Vidu：

PixVerse V2:

Luma：

Runway Gen-3:

AI 理解的动漫风格的袋鼠可真是五花八门，有像老鼠的，也有像不明物种的。相比而言，可灵、Vidu 和 Runway Gen-3 效果更佳，起码没有大面积的模糊虚化。

-2-

图生视频

这几家号称对标 Sora 的视频生成模型也均上线了「图生视频」功能，只需上传一张图片，输入提示词就可让静态图片动起来。

Round 1

上传一张皮卡丘的图片，输入提示词：皮卡丘开心地蹦起来（It jumps up happily）。

可灵：

即梦：

清影：

Vidu:

PixVerse V2:

Luma：

Runway Gen-3：

这轮 Vidu 完胜，不仅运动幅度大，表情、动作流畅，而且蹦跳的过程画面没垮；只是没想到，这轮效果最差的是 Runway Gen-3，各种稀奇古怪的变形。

Round 2

上传一张格兰特・伍德著名的油画《美国哥特式》，输入提示词：两个人笑了起来（They laugh）。

可灵：

即梦：

清影：

Vidu:

PixVerse V2:

Luma：

Runway Gen-3:

从表情的自然程度来说，这把我选 Runway Gen-3、可灵和 Vidu，你觉得呢？

-3-

小编有话说

Runway 不愧是 AI 视频圈的「扛把子」，Gen-3 着实能打，除了皮卡丘翻车以外，其他测试均表现不错。

其次就是可灵，生成画面比较稳定，对于提示词的遵循也挺到位。

即梦对于颜色的驾驭最强，它生成的视频颜色搭配最舒服，不足之处就是当动作幅度过大时，画面容易模糊变形。

Vidu 的动漫效果最好，很擅长把动漫角色动态化这类活儿，而且生成速度快，生成一段 4 秒的视频仅需 30 多秒钟。

Luma，这个曾一度让全球网友疯狂的整活工具，在此次实测中，相比于可灵和 Runway Gen-3，它的表现并不突出，而且生成速度极慢，有时候一段 5 秒的视频得花半个多小时，甚至更长时间。

从付费情况来看，目前除了 Runway Gen-3 需要完全付费外，其他各家都有免费体验次数。其中智谱清影处于内测阶段，可以免费无限次生成。

为满足不同用户的需求，各家把会员分为基础、标准和高级三种，价格都不便宜，按照年付来算，标价最贵的当属 Luma，基础会员每年都需 287.9 美元，这个价格在一众应用中，可以说是一骑绝尘了。

你觉得哪家AI视频生成能力最强？评论区聊聊吧。

工具链接：

快手可灵：https://klingai.kuaishou.com/

字节即梦：https://jimeng.jianying.com/ai-tool/home?activeTab=video&subTab=video

生数Vidu:https://www.vidu.studio/

智谱清影：https://chatglm.cn/video

PixVerse：https://pixverse.ai/

Luma：https://lumalabs.ai/dream-machine

Runway Gen-3：https://runwayml.com/

以后我们会带来更多AI大模型、AI应用的一手评测，也欢迎大家进群交流。

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

继续滑动看下一个

机器之能

向上滑动看下一个

高三女生醉酒后被强奸致死？检方回应

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时

女人最偏爱的十种男人

实测7款「Sora级」视频生成神器，谁有本事登上「铁王座」？

您可能也对以下帖子感兴趣

高三女生醉酒后被强奸致死？检方回应

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋 华人崩溃大哭 连空姐都吐了; 客机颠簸盘旋3小时

女人最偏爱的十种男人

生成图片，分享到微信朋友圈

实测7款「Sora级」视频生成神器，谁有本事登上「铁王座」？

您可能也对以下帖子感兴趣

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时