Sora,我想和这个世界谈谈
你好,我是清风徐来
这是《ChatGPT ,从入门到精通》 系列文章。
昨天,OpenAI发布了文本生视频AI“Sora”
Sora 可以创作长达 60 秒的视频,能实现详实的场景、复杂的运镜,以及表情生动的多角色。
手握最强 LLM 的 OpenAI 剑一出手就封喉🗡️ 无论你生成什么,先得有脑子有逻辑才是王道!
一石激起千层浪
虽然还没有正式发布,但OpenAI已经公开了相关报告,发表了很多demo视频,邀请电影等领域专业人士进行小范围试用
从不断流出的第三方试用视频来看,效果奇佳,很多视频已经让你分不清楚到底是真实存在的,还是AI生成的。
另外,Sora在写实照片生成上的真实度和细节已经比 Midjourney V6 要好,这模型真的离谱。
注意看人脸的细节,绒毛、皱纹。
1.Sora是OpenAI宏大战略的一部分
我们把目光稍微放的远一点,就会发现OpenAI在有条不紊的下一盘大旗!
2月5日,OpenAI的CEO奥特曼发推说新的一年,GPT4将不再懒惰!
《OpenAI要放大招了!谷歌 Gemini Ultra 来了,GPT-5 还会远吗?》
然后又流出了OpenAI正在秘密筹集7万亿刀巨额融资的新闻:《OpenAI 拟融资 7 万亿美元!改造全球 AI 生态》
2月7日,OpenAI又“莫名其妙”宣布启用标准水印:《OpenAI宣布,DALL-E 3将采用C2PA(内容来源和真实性联盟)标准水印!(现在来看,很大程度就是为Sora准备的)
2月14日,OpenAI宣布上线GPT4的长期记忆功能!《突发!ChatGPT永久记忆功能上线》。有了这个功能,GPT以后比你老婆还懂你!
还有风声流出,《OpenAI 正在秘密研发两款 AI 助手》,一款单机助理,一款网络搜索助理。
所有的更新,都按照产品路线规划图有条不紊的在进行。
这些新功能,随便拿一个给谷歌或者Meta,都够他们吹半年。而OpenAI轻描淡写,十天时间,一口气发了四个!
一系列的事件说明,OpenAI将有重大更新!
虽然GPT5还没有公布发布时间,但是这些新功能,一个个叠加上去,不就是GPT5么?
2.Sora定位在真实世界的模拟器
虽然早就知道OpenAI在憋大招,但没想到文生视频Sora效果这么好,定位这么高,远远超出了预期。
老炮周鸿祎甚至提出,Sora的出现,让AGI(通用人工智能)多出现提前了十年!
有人说,Sora吊打其他文生视频AI,比如Pixverse,Pika、Runway、moonvalley、DomoAI、leonardo
嗯,这种说法其实是小看了Sora
Sora定位在真实世界的模拟器,Runway定位在花前月下,Sora的定位是星辰大海。
从流出的视频来看,Sora 有能力在一定程度上模拟现实世界中的人动物和环境。
不需要对三维空间,物体有任何特定的预设,纯粹是scale之后的自然现象。
我甚至觉得sora有一定的智力,它可以根据场景自己推断出周边的场景。
Sora的先进性在于它可以根据已有的知识推断、生成新的东西,这是自我意识的雏形。
比如说一个你从来没见过摩拜单车撞击过坦克,但是你根据你的经验知道肯定是以卵击石,脑海里就会自动浮现出来惨不忍睹的画面,
sora也具备和你同样的推断能力。
这次 Sora 只是小试牛刀,它展现的不仅仅是一个视频制作的能力,它展现的是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破
感觉视频不过是Sora作为未来世界模拟器,顺手做的一个附带产品!
3.Runway们还有出路么?
只要做出差异化、本地化,做AI视频的初创公司们还是很有机会的。
那些做视频生成的创业团队,必须得像 Midjourney 那样在效果和产品路线上专业化,才能有出路!
让我回归下前不久奥特曼在Yc24,以及和和比尔盖茨的一段对话。
《OpenAI 奥特曼:AGI不远了!GPT-5相对GPT-4有一个指数级的跳跃》
《比尔·盖茨对话 OpenAI CEO 奥特曼:GPT5在内的模型,未来五到十年内,将会变得“愚蠢”》
奥特曼提出:最正确的策略是设想一个“上帝般的”模型正在运作,然后基于这种设想来构建最好的产品。 —— Sam Altman 在 YC24
现在,这个“上帝般的”模型已经初见端倪。
不过,上帝抛骰子吗?
原创不易,欢迎阅读、点赞、转发、分享
付费加入知识星球“浩瀚的 AI 苍穹”后,即可取得 VIP 学习群加入方式!
加入星球每隔 1-2 周适当上调,希望大家尽早入群,懂的都懂!
以下是新年新人优惠券
跟着大家,每天分享最新 ChatGPT 实用干货!
不懂就问,言多必得!