查看原文
其他

Sora 完整能力曝光!满满的吸金黑科技

风清徐徐来 AI变现研习社 2024-06-01

你好,我是清风徐来

这是《ChatGPT ,从入门到精通》 系列第 192篇原创文章。#Sora

日前,OpenAI 申请 Sora 商标信息流出!

分析后发现, Sora已经对公众展示只是部分功能!

下面为你详细分析:

根据网上流传的SORA™ 商标旨在涵盖以下类别,如下图:

从此描述看,Sora 的能力如下:

1、生成视频和图像

分析:

生成视频是核心,最新Sora视频合集如下:

这个动画,最奇妙的地方在于主体和空间的延续性

AI 绘画三剑客,质量最好是 Midjourney v6

从流出的对比看,Sora 生成图片质量不亚于 v6

《Sora,让 Midjourney v6 也瑟瑟发抖!附: 比较案例》

2、用于基于自然语言提示、视觉提示、文本、语音、图像和/或视频创建、生成和编辑视频和图像;

分析:这句话内容丰富!笔者读了 4、5 遍才看懂,可以分解为

(1) 基于自然语言提示生成和编辑视频和图像

自然语言就是人类的语言,

这句话的意思是,如果你对生成图片/视频风格,场景,某个细节不满意,你一句话 就让AI 就改了

比如,这是原版赛车

一句话,“赛道改为赛博风格”,就可改为赛博版赛车

再一句话“赛道改到水下” 就改为水下赛车

(2)基于视觉提示生成和编辑视频和图像

什么叫基于视觉?AI 有视觉?有的,那就是摄像头!

这句话的意思是,Sora 可以基于摄像头的实时画面,生成图片或视频!

这个游戏很有用!边摄边改,妥妥的黑镜!

(3)用于视频和图像识别、处理、分析、理解和生成

这个功能类似于 gpt4V,gemini1.5,可以读取视频,识别图像

注意,这里的读取视频,不是指播放、拷贝,而是理解视频,比如 AI 可以看着足球直播画面,给你配音解说!

这意味着 Sora 具有对视频的理解能力,这个和 Gemini 1.5 Pro 的能力一样,但是不知道程度如何,Gemini 1.5 Pro 可以分析 1 个小时的视频。

这也能理解,为什么在 Gemini 1.5 Pro 发布同一天,OpenAI 会拿出 Sora 来阻击!

(4)编辑、组织、修改、传输、上传、下载和共享视频、图像和音视频材料

分析:类似于剪辑大师,可以融合多个视频、图片、音频

现在的技术,换脸、改口型等等,在它面前都是个弟弟!

怪不得,OpenAI要组织1000专家的红队开展安全压力测试!

不过,有一点没有提及,就是 Sora 是否可以基于视频配音?

将前述功能总结如下图:


2、如何注册 Sora

答:Sora暂时没有开放注册,但是按 OpenAI 产品发布惯例,Sora 应该优先提供给 Plus 用户使用

为了优先用上 Sora,你要先注册为 GPT,然后升级为 PLUS 会员,坐等 Sora 发布

详见《一文看懂 GPT 注册》

Plus 用户需要开通 wildcard(国内直联),支付宝付款搞定

《保姆级教程!手把手教你用支付宝开通 ChatGPT plus!》

Sora 发布后,在 ChatGPT 的界面上,就会多一个子栏目

 

好啦,今天的分享到这里,别忘了关注、收藏、点赞、分享这篇文章哦!以便第一时间收到更多更好玩儿的 Sora技巧分享。

付费加入知识星球“浩瀚的 AI 苍穹”后,即可取得 VIP 学习群加入方式!

加入星球每隔 1-2 周适当上调,希望大家尽早入群,懂的都懂!

以下是新年新人优惠券

也可以进入新手群,跟着大家,每天分享最新 ChatGPT ,Sora等实用干货!

学习 AI,如何快速入门?

不懂就问,言多必得!


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存