查看原文
其他

最近爆火的项目,大厂终于开始支持了

果核 果核剥壳
2024-09-25


现在市面上有很多AI产品, 果核之前给大家推荐过不少AI生成文字、图片类型的项目,而现在最火的是各种视频生成工具。


大家在网上应该能刷到这种类型的视频,说的是AI 做的视频像是吃了云南菌子,或者像是在梦里的场景一样,摩托特效满天飞,让人觉得很忙又不知道在忙什么。



这些制作者其实都算是在探索AI视频创作,先拿出整活型的内容来看看大家的反应。在视频模型方面,这次在国外的Sora画了饼,官宣完却迟迟不开放的情况下,国内的大模型已经开始入场了,像是国内的可灵、即梦和Vidu等等。



今天我们来看一款可以超低门槛体验的产品:智谱AI基于CogVideoX打造的“清影”,CogVideoX参考了Sora的算法设计,也能将文本、时间、空间三个维度融合起来生成内容,相较于两年前的上一代CogVideo,提升了6倍的推理速度,分辨率也有提升。



可以用它来生成一些视频片段,比如说:“马斯克扮演的钢铁侠,目视着残存的人类都市废墟,随着镜头推进,马斯克召唤出了一道蓝色的时间传送门,他飞了进去。”生成的效果如下(看发型就知道是马斯克):



如果想要其他的效果,可以多生成几次,就会像抽卡一样,可能抽到一些可以用于剪辑的内容,清影目前支持生成的视频格式为1440X960像素的6秒视频,画面比例为3:2。



在生成效果上,从网上看到的资料来看,质量效果是这个排序:动物>植物>物品>建筑>人物。


那就来试试两只熊猫在喝水的视频,看了看确实还行,毛发上有光影效果,两只熊猫的头部层级关系也处理得挺好,没有出现抖动和融合交错的现象。



也用了一下官方创作文档里面提到的一组提示词——冰川上的恶龙。


在镜头较远的时候,龙的形态有些变形,但总体来看这镜头效果还挺刺激的。(图里的天空是颜色断层是转成动图压缩的原因



现在智谱清影不用考虑内测资格等待的问题,上手就能不限量使用!


果核体验的时候,几秒钟就接了体验资格通过的短信。手机端在“智谱清言”的APP里有入口,电脑端可以直接在网页上使用,给大家贴一下使用地址:



智谱清影

PC 端访问链接:https://chatglm.cn/video

移动端APP链接:https://chatglm.cn/download?fr=web_home


如果你担心初次上手的时候,生成的内容有较大差别,那么可以来到智谱清言的智能体广场,这里有两个智能体,文生视频和图生视频中都能用上。



像是我们输入提示词:夜晚,沙滩上的一颗巨大发光玻璃珠。清影提示词助手就能默认扩展出3个版本的加强中英双语内容。



选择自己喜欢的提示词进行生成,就能得到一个符合描述的画面。



除了文字生成视频,也可以扩展图片的内容,这样生成的内容更可控,同时也解锁了“表情包自由”。


我们可以对图片进行一些言语加工,不用特效工具来对画面进行动态“PS”,把一些Logo更换成不同质感,进行3D化等等,这些在视频里都是可以用来增加趣味性的。



看着生成的效果,感觉可以用AI来生成一些比较难创作的东西,像是五彩斑斓的黑什么的。



对于表情包,我们可以直接让画面的元素做出想要的动作,这里特地挑选了一张小狗表情包,看看在小狗结合画面里根本没有的元素,清影会怎么处理。



结果令人意外,清影在屏幕外创造了一张椅子,并且跳上去的时候还有因为惯性而调整姿势的动作!



另外,果核注意到了一个细节,对于清影来说,这个椅子不像是简单的2D内容,而是带有3D处理逻辑的,小狗前爪似乎还想搭在前面的搭板上(虽然这个部件有点奇怪),就是位置有点对不上。



另外在最后一秒的时候,后爪还有从边缘滑落的趋势,可能稍微有些过度解读了,但可以肯定的是,在清影里面,你可以指定图片里的物体,与一个幻想物体生成物理交互效果。


看了基本操作之后,接下来我们上点难度。


目前展示的内容都是6S的片段,我们来尝试一下生成带有小剧情的片段,最后剪辑成一段。简单的剧情为:一个外星人在飞船上,犹豫要不要启动歼星炮,摧毁一颗星球的片段。



先不说画质精细度的问题,如果内容能到基本能看的地步的话,那么以后那些解读科幻或者其他类型的小说博主,就能获得源源不断的画面素材,未来加上固定主体一致性和画质继续提升的话,能让人有很大的想象空间。


首先,来一段解释故事地点和时间的片段,用的提示词为:

采用太空歌剧风格拍摄,镜头从太空站内部向外延伸,展示机械臂装载补给物资的场景。太空站周围,小型飞船进行着星际贸易,远处恒星的光芒照亮了整个太空站。背景音乐激昂,营造出一种史诗般的星际交流氛围。特写镜头展示机械臂的运作和飞船的飞行轨迹,背景是璀璨的星空,太空歌剧风格,气氛宏伟。


可以多生成几段用作备选。



接下来生成一段“受害者”的视频中,就拿大家熟悉的地球最背景了。用的提示词为:

使用科幻风格拍摄,镜头环绕一座高科技的太空站,宇航员们在这里观察宇宙奥秘。太空站的观景舱中,宇航员们凝视着地球的壮丽景色,星辰闪烁与地球蓝色交相辉映,营造出神秘而宏伟的氛围。


这里的宇航员可以设定为外星的宇航员,主要是表现地球的近景。


接下来是导出外星人片段,可以随机给它一些参数,想要打磨好的话需要一些时间,果核在这里简单演示一下,用的提示词是:

在赛博朋克风格的外星基地内,手持跟拍的镜头紧盯着外星人的背影,手中犹豫地悬停在巨大的歼星炮启动按钮上。周围是复杂的科技设备和闪烁的代码,气氛紧张而充满悬疑。



本来用的是外星人的脸,但脸有些吓人,还是用背影好了。接下来是按下启动按钮的场景,用两段来描写它犹豫了一下,然后按下之后的启动变化。后续的内容还有不少,这里就不详细展开了,大家感兴趣可以看图。



得到了这些素材之后,去剪辑软件里稍微加工一下,有的片段可能也还行,但是需要你做一些取舍,然后就得到了一段好像是那么一回事的视频。



最终效果



在制作的过程里,你可能会遇到意料之外的画面,比如说在上面的示例里,有时候会生成两个地球,这个时候才反而提供了一点灵感,两个地球,似乎毁灭一个理由更多了,是不是在同一个空间内等等,可以扩展故事的多元化视角。



比起这些,更重要的是能学到一些AI视频生成的通用思维,怎么去描述才能得到一致类似的效果,怎么样去控制画面的元素等等, 对这类工具感兴趣,这些是绕不过的问题,可以提前学习起来了。


总的体验下来,这个清影可玩性是相当高的,而且现在是免费体验,如果大家有想创作的场景,非常推荐大家试一下,有一种在画画的感觉,只不过现在我们用的不是笔,而是一段段文字。这个过程很有趣!


最后,再次附上智谱清影的使用地址:



智谱清影

PC 端访问链接:https://chatglm.cn/video

移动端APP链接:https://chatglm.cn/download?fr=web_home


继续滑动看下一个
果核剥壳
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存