其他
效果炸裂!OpenAI 发布首个视频生成模型,这就是 AI 视频的 GPT 时刻
能够生成具有多个角色、特定类型动作和主题背景的复杂视频,时长可达到 1 分钟
可以在单个生成的视频中创建多个镜头,模拟复杂的摄像机运镜,同时准确地保持角色和视觉风格。
最重要的是,它不仅理解用户在 prompt 中要求的内容,还能自己理解这些事物在现实世界中的存在方式。比如下面这个案例:Prompt: A Chinese Lunar New Year celebration video with Chinese Dragon.
提示:与中国龙一起庆祝中国农历新年的视频。越简单的 Prompt,越体现出 Sora 模型对物理世界的运行规则理解有多深。更多技术细节可通过官网了解:https://openai.com/sora尽管不想再用这个有点被滥用的词,但我们也许不得不承认,这就是 AI 视频的「GPT 时刻」。至于怎么能体验到 Sora,OpenAI 还没公布向所有用户开放的时间,目前只有部分视觉艺术家、设计师和电影制作受邀测试。不过 OpenAI CEO Sam Altman 开启了「在线接单」模式,只要带上你的 Prompt 在 X 上 @ Sam Altman ,就有可能收到生成的视频。
提示词:一个华丽的珊瑚礁纸艺世界,到处都是五颜六色的鱼和海洋生物。Prompt: Drone view of waves crashing against the rugged cliffs along Big Sur’s garay point beach. The crashing blue waters create white-tipped waves, while the golden light of the setting sun illuminates the rocky shore. A small island with a lighthouse sits in the distance, and green shrubbery covers the cliff’s edge. The steep drop from the road down to the beach is a dramatic feat, with the cliff’s edges jutting out over the sea. This is a view that captures the raw beauty of the coast and the rugged landscape of the Pacific Coast Highway.提示词:无人机拍摄大苏尔加雷点海滩上海浪拍打崎岖悬崖的景象。湛蓝的海水拍打出白色的浪花,夕阳的金光照亮了岩石海岸。远处有一座小岛,岛上有一座灯塔,绿色的灌木丛覆盖着悬崖边缘。从公路到海滩的陡峭落差非常壮观,悬崖的边缘突出海面。这里的景色捕捉到了海岸的原始之美和太平洋海岸公路的崎岖地貌。Prompt: This close-up shot of a Victoria crowned pigeon showcases its striking blue plumage and red chest. Its crest is made of delicate, lacy feathers, while its eye is a striking red color. The bird’s head is tilted slightly to the side, giving the impression of it looking regal and majestic. The background is blurred, drawing attention to the bird’s striking appearance.提示词:这是一张维多利亚冠鸽的特写镜头,展示了它醒目的蓝色羽毛和红色胸膛。它的冠羽由精致的花边羽毛组成,眼睛则是醒目的红色。鸽子的头部略微偏向一侧,给人一种高贵威严的感觉。背景是模糊的,让人注意到这只鸟引人注目的外表。Prompt: Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee.提示词:两艘海盗船在一杯咖啡中航行时的逼真特写视频。AI 视频的 GPT 时刻,AGI 的重要里程碑过去一年 我们已经看过不少媲美专业级制作的 AI 生成视频,连迪士尼也开始用到影视制作中,但仍有不少掣肘。而 Sora 又往前迈出了一大步,就像 OpenAI 研究员所说:制作一部专业电影需要大量的昂贵设备,Sora 这个模型将让普通人在社交媒体上制作出高质量的视频内容成为可能。
但这不代表只靠 Sora 能马上制作出一部电影,研究人员也提到 仍存着一些缺点,比如可能无法理解特定的因果关系。例如给出提示词:一个人咬了一口饼干,但生成的饼干上可能没有咬痕。回顾过去这一年 AI 视频的产品迭代,速度已经超出人们的想象。去年年底,Runway Gen-2 迎来一波大更新,分辨率提升至 4K,视频生成效果的保真度和一致性迎来重大突破,一周后,又再次推出运动画笔功能,轻轻一刷,便能让静态事物动起来。