查看原文
其他

颠覆性王炸!TA来了,现实不存在了?网友:我要失业了!

新闻坊 2024-03-07

2月16日凌晨

OpenAI再次扔出一枚深水炸弹

发布了首个文生视频模型Sora

它可以根据用户输入的

提示词、静止图像

生成长达一分钟的高清视频

该发布瞬间引爆科技圈

引发高度关注


据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。


目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。


例如一个Prompt(大语言模型中的提示词)的描述是:在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。


在Sora生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头行走,不仅主体连贯稳定,还有多镜头,包括从大街景慢慢切入到对女士的脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。


电影预告片讲述了30岁宇航员戴着红色羊毛针织摩托车头盔的冒险经历,蓝天、盐漠,电影风格,35毫米胶片拍摄,色彩鲜艳。


AI想象中的龙年春节,红旗招展人山人海。有紧跟舞龙队伍抬头好奇观望的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。


竖屏超近景视角下

这只蜥蜴细节拉满


网友直呼game over

工作要丢了


甚至有人已经

开始“悼念”一整个行业


还有网友表示

电影业要彻底颠覆了


内容创作领域开启新纪元
确保内容真实透明成重要问题

2021年初和2022年末,OpenAI分别推出了图像生成系统DALL·E和聊天机器人ChatGPT。这也使得AI逐渐成为各行各业辅助工作的工具,也正逐渐改变人们对未来工作的看法。


据介绍,Sora是基于过去对DALL·E和GPT的研究基础构建,利用DALL·E 3的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好的遵循文本指令。


Sora能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。不仅了解用户在提示中要求的内容,还了解这些东西在物理世界中的存在方式。同时,该模型对语言有深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色。

▲ 运用Sora也可以生成高清图像。(图片来源:OpenAI官网)


对于Sora的面世,工信部信息通信经济专家委员会委员、数字经济专家刘兴亮称,这标志着AI技术在内容创作领域的一个新纪元。

“通过简短的文本提示或一张静态图片,Sora能够生成持续一分钟左右的1080P高清视频,涵盖多个角色、不同类型的动作和背景细节等,几乎达到了电影级别的逼真场景。”


“技术创新的这一巨大飞跃,预示着AI在未来人类生活的各个方面都将发挥更加重要的作用。”


而Sora以文字为核心的提示,将能够形成更加符合人类观念的连续视频,该模型的出现无疑将会对人们现有工作方式进行再一次迭代,同时也会对传统行业转型提出新的挑战。


生成式AI过去已积累了不少图像、声音等素材,并通过不断学习形成了更为成熟的算法。因此,若是可以通过AI在计算机中创建视频素材,或许将对影视行业产生重大影响



不过,刘兴亮指出,这种转型并不意味着传统影视行业的消亡,而是需要与AI技术融合,探索新的艺术形式和表达方式。


刘兴亮同时提到,随着AI生成内容与现实之间的界限变得越来越模糊,如何确保内容的真实性和透明性成为了一个重要问题。此外,版权、隐私和数据安全等问题也需要得到妥善解决。社会必须面对这些挑战,通过制定相关政策、法律和伦理准则来确保技术的健康发展,同时保护个人和社会的利益不受侵害。


拉大产业竞争差距

AI生成视频技术或将进入爆发期

AI视频技术的诞生

面临着一系列的问题

而除了对现实世界的影响

作为刚刚面世的全新技术

Sora也存在不足之处


对于Sora当前存在的弱点,OpenAI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。


例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。


该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。


如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。


任何事件的发生都是从无到有,再从有到精的过程。据悉,Sora如今正面向部分用户开放,以评估关键领域的潜在危害或风险


OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。


相比于其自身缺陷

该技术的广泛前景

更为外界所关注


近两年,由于人工智能发展迅速,以至于很多企业纷纷加大了对人工智能的投入。科技创业公司研究机构PitchBook估计,2023年全球生成式AI的市场规模将达426亿美元,2026年则将达到981亿美元,未来增长动能可期。


随着生成式人工智能的市场潜力不断地被挖掘,大大小小的竞争对手开始浮出水面。


当前,参与该赛道的企业不乏亚马逊、微软、谷歌、百度、阿里等众多互联网巨头,也包括Runway等初创企业。


有行业人士指出,随着Sora的发布,OpenAI在行业的领先程度立即加大,会将大家紧追的距离再度拉开一大截。未来,解决了人物一致性问题之后,AI生成视频将大踏步前进,AI视频或进入大爆发期。



END

来源:每日经济新闻(记者:熊嘉楠 可杨)、界面新闻、量子位、OpenAI官网等

编辑:大羽(见习)

推荐阅读


点分享点赞点在看
继续滑动看下一个

颠覆性王炸!TA来了,现实不存在了?网友:我要失业了!

向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存