查看原文
其他

实测7款「Sora级」视频生成神器,谁有本事登上「铁王座」?

关注AI的 机器之能
2024-09-05
机器之能报道编辑:杨文
谁能成为AI视频圈的King?

美剧《权力的游戏》中,有一把「铁王座」。

传说,它由巨龙「黑死神」熔掉上千把敌人丢弃的利剑铸成,象征着无上的权威。为了坐上这把铁椅子,各大家族展开了一场场争斗和厮杀。

而自 Sora 出现以来,AI 视频圈也掀起了一场轰轰烈烈的「权力的游戏」,这场游戏的玩家主要有大洋彼岸的 Runway Gen-3、Luma,国内的快手可灵、字节即梦、智谱清影、Vidu、PixVerse V2 等。

今天我们就来测评一下,看看究竟谁有资格登上 AI 视频圈的「铁王座」。


-1-

文生视频

目前,文生视频功能已经是各家 AI 视频产品的「拿手好戏」,我们就把它当个开胃菜。

Prompt 1:The camera directly faces colorful buildings in Burano Italy. An adorable dalmation looks through a window on a building on the ground floor.

中文提示词 1:镜头直接对着意大利布拉诺五颜六色的建筑,一只可爱的斑点狗从一楼的窗户往外看。

可灵:

即梦:

清影:

Vidu:

PixVerse V2:

Luma:

Runway Gen-3:

各家都生成了五颜六色的建筑,从运动幅度以及画面的精美程度来看,Runway Gen-3 效果最佳,其次可灵和即梦也挺丝滑。

Prompt 2:Nighttime footage of hermit crabs using light bulbs as shells.

中文提示词 2:寄居蟹用灯泡做壳的夜间镜头。

可灵:

即梦:

清影:

Vidu:

PixVerse V2:

Luma:

Runway Gen-3:

大部分视频中,要么是寄居蟹动几下钳子,要么就是摇镜头,相对而言, Vidu 和 Runway Gen-3 的视频运动幅度最大。Vidu 生成的视频中,寄居蟹一溜烟都快跑没影了, Runway Gen-3则展示了寄居蟹爬动的过程。

Luma 的寄居蟹长得最奇怪,圆滚滚的,有点像满地爬的蟑螂。

Prompt 3:The story of a robot’s life in a cyberpunk setting.

中文提示词 3:一个机器人在赛博朋克背景下的生活故事。

可灵:

即梦:

清影:

Vidu:

PixVerse V2:

Luma:

Runway Gen-3:

除了 Luma 没有出现像样的机器人外,其他各家都展示了各自想象中的机器人形象。

可灵生成的视频画面,在构图和镜头上神似 Sora 放出来的「东京女子走在街头」的示例;即梦的画面最为精美和赛博朋克,而 Vidu 则有种科幻片的即视感; PixVerse V2 的机器人最怪异,像顶了个水桶脑袋。

要说逼真程度以及运动幅度,Runway Gen-3 的效果似乎更胜一筹,当然它也有 bug,比如凭空出现并向后疾驰的汽车。

Prompt 4:The waves are lapping against the shells on the beach.

提示词 4: 海浪拍打着沙滩上的贝壳。

可灵:

即梦:

清影:

Vidu:

PixVerse V2:

Luma:

Runway Gen-3:

整体来说,可灵和即梦生成的效果最真实,Luma 的贝壳看起来有点变形,最离谱的是 PixVerse V2,一开始画面还算正常,但眨眼功夫跑出来一个人,面部表情以及手部崩得没眼看。

Prompt 5:Cartoon style, a kangaroo is dancing

提示词 5: 卡通风格,一只袋鼠在跳舞。

可灵:

即梦:

清影:

Vidu:

PixVerse V2:

Luma:

Runway Gen-3:

AI 理解的动漫风格的袋鼠可真是五花八门,有像老鼠的,也有像不明物种的。相比而言,可灵、Vidu 和 Runway Gen-3 效果更佳,起码没有大面积的模糊虚化。


-2-

图生视频

这几家号称对标 Sora 的视频生成模型也均上线了「图生视频」功能,只需上传一张图片,输入提示词就可让静态图片动起来。

Round 1

上传一张皮卡丘的图片,输入提示词:皮卡丘开心地蹦起来(It jumps up happily)。

可灵:

即梦:

清影:

Vidu:

PixVerse V2:

Luma:

Runway Gen-3:

这轮 Vidu 完胜,不仅运动幅度大,表情、动作流畅,而且蹦跳的过程画面没垮;只是没想到,这轮效果最差的是 Runway Gen-3,各种稀奇古怪的变形。

Round 2

上传一张格兰特・伍德著名的油画《美国哥特式》,输入提示词:两个人笑了起来(They laugh)。

可灵:

即梦:

清影:

Vidu:

PixVerse V2:

Luma:

Runway Gen-3:

从表情的自然程度来说,这把我选 Runway Gen-3、可灵和 Vidu,你觉得呢?


-3-

小编有话说

Runway 不愧是 AI 视频圈的「扛把子」,Gen-3 着实能打,除了皮卡丘翻车以外,其他测试均表现不错。

其次就是可灵,生成画面比较稳定,对于提示词的遵循也挺到位。

即梦对于颜色的驾驭最强,它生成的视频颜色搭配最舒服,不足之处就是当动作幅度过大时,画面容易模糊变形。

Vidu 的动漫效果最好,很擅长把动漫角色动态化这类活儿,而且生成速度快,生成一段 4 秒的视频仅需 30 多秒钟。

Luma,这个曾一度让全球网友疯狂的整活工具,在此次实测中,相比于可灵和 Runway Gen-3,它的表现并不突出,而且生成速度极慢,有时候一段 5 秒的视频得花半个多小时,甚至更长时间。

从付费情况来看,目前除了 Runway Gen-3 需要完全付费外,其他各家都有免费体验次数。其中智谱清影处于内测阶段,可以免费无限次生成。

为满足不同用户的需求,各家把会员分为基础、标准和高级三种,价格都不便宜,按照年付来算,标价最贵的当属 Luma,基础会员每年都需 287.9 美元,这个价格在一众应用中,可以说是一骑绝尘了。

你觉得哪家AI视频生成能力最强?评论区聊聊吧。

工具链接:
快手可灵:https://klingai.kuaishou.com/
字节即梦:https://jimeng.jianying.com/ai-tool/home?activeTab=video&subTab=video
生数Vidu:https://www.vidu.studio/
智谱清影:https://chatglm.cn/video
PixVerse:https://pixverse.ai/
Luma:https://lumalabs.ai/dream-machine
Runway Gen-3:https://runwayml.com/

以后我们会带来更多AI大模型、AI应用的一手评测,也欢迎大家进群交流。





© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com


继续滑动看下一个
机器之能
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存