10 年前是科幻,10 年后是现实!OpenAI 发布免费AI GPT-4O!
就在几小时前,OpenAI 发布了新模型 GPT-4O ,并承诺向所有人免费开放
功能非常非常强!网友笑称,gemini年初吹的牛,gpt4o都实现了
各行各业将迎来巨变,GPT-4o 的应用范围极其广泛,从情感陪护、日常的客服自动化到专业的面试准备,再到游戏互动和教育辅助等,都有广泛的应用前景!
还记得 10 年前那部科幻爱情电影《Her》么?
影片讲述了孤独的写信人西奥多与一款高度人性化的人工智能操作系统萨曼莎之间的情感故事。这部电影深入探讨了人工智能、孤独、爱情以及技术对人际关系的影响,获得了广泛的好评和多个奖项。
今天,OpenAI 将《Her》变成了现实
我们模拟斯嘉丽给大家介绍一下
美东时间 5 月 13 日周一,OpenAI 首席美女技术官 Mira Murati 在直播演示中宣布(来源宝玉baoyu.io)推出新的 OpenAI 旗舰 AI 模型,名为 GPT-4o,并表示:它将向所有人,包括免费用户开放!
OpenAI,将确保使用通用人工智能造福全人类
GPT-4o 的文本和图像功能已在 ChatGPT 中逐步推出,用户可以免费体验,后续将推出音频和视频功能。
笔者已经被灰度到了!
下面,我向你介绍 ,包括特性和十个案例视频
一、概述
(一)评分
GPT-4o 就是几天前神秘出现在机器人竞技场(chat.lmsys.org)的 GPT2
在基准测试中,GPT-4o 在文本处理、推理和编程智能方面达到了与 GPT-4 Turbo 相当的水平,同时在多语言处理、音频和视觉能力上设立了新的高标准。
卧槽,GPT-4o 这个成绩太离谱了,分数比 GPT-4 0409 高了 50 分
下图是机器人竞技场最新评分表
(二) GPT-4o 特性
又一款跨时代的 AI,以下是该模型的一些关键特性
1、即时响应、实时交互
用户可以像和真人聊天一样,与 AI 聊天,比如随时打断
GPT-4o 结合了语音、文本和视觉信息处理能力,允许实时通过语音对话、视频流等方式与 AI 模型互动
GPT-4o 提供即时的响应,情感识别与模拟,编程代码辅助,以及多语言支持。
响应时间和性能:GPT-4o 在响应速度上表现出色,对音频输入的反应时间低至 232 毫秒,平均为 320 毫秒,与人类对话中的反应时间相当,特别适合需要即时反馈的应用。
2、情绪感知
此外,GPT-4o 展示了其实时交互能力 ChatGPT 具备对情绪的感知能力,可以在对话中察觉用户情绪变化,并予以语言抚慰
3、更优的界面
GPT-4o 的 Text、Voice、Video、Image 统一了,不需要相互转换
4、多模态输入与输出
GPT-4o 能够接受文本、音频和图像的任意组合作为输入,并生成相应的输出,这使得它在多种实际应用场景中都非常有用。
想象一下,你可以拿着手机边聊天边用图片或者视频拍给 GPT,GPT 随时给你相应
如在 Mark 紧张时指导其调整呼吸。音频功能的改进包括用户可以随时打断 ChatGPT 的回答,并且减少了响应的延迟。
5、更低的价格
GPT-4o 的 API 价格比 GPT-4 Turbo 便宜 50%,速率限制是 GPT-4 Turbo 的 5 倍,每分钟可以处理高达 1000 万个 token,并且在视觉能力上优于 GPT-4 Turbo。
说明:API 即应用程序编程接口,官网即 APP 可以免费用,但 API 官网是收费的,主要用于开发各种下面
6、更丰富的应用场景
Gpt-4o 的几个能力,可用于教育、情感陪伴、翻译同传等
(1)语音增加了情绪理解和有感情的回复
(2)手机可以实时理解摄像头视频画面给予指导,替代家庭教师
(3)实施同传翻译替代,替代同传翻译
(4)桌面助手,替代 sira
只能说强大强大很强大
二、案例
以下是 几 个惊人的案例
1、成为我的眼
2、实时翻译
3、多人与 GPT-4o 开会
4、给孩子辅导数学
5、学习外语
6、玩游戏石头剪刀布
7、使用 GPT-4o 进行面试准备
8、狗遇见 GPT-4o
三、实测
(一)APP
但是相应功能还未开放,将在实测后与大家分享
(二)进入 PC 界面
1、系统提示升级
2、全新的界面
3、GPTs 整合到右上角
4、测试
首先,速度确实很快!
我将尽快实测了之后再和大家分享。
GPT-4o 的实际可用性太强了, 现在开发者面前有个以小博大的机会, 就是立刻做一个 GPT4O 的套壳, 去吊打市面上所有的 AI 陪伴类产品!
附件 1:《发布会全文》
由 OpenAI CTO Mira Murati 主讲
很高兴你们今天来到这里。
我今天要谈的主要有三点:
1、产品的重要性与更新
我们首先讨论为何对我们来说,拥有一个可以自由向大众提供的产品如此重要。我们一直在努力寻找减少使用困难的方法,以便所有人都能在任何地方使用 ChatGPT。所以,今天我们将发布 ChatGPT 的桌面版本,并进行界面的更新,让其使用起来更为简单、自然。
2、新旗舰模型 GPT-4o 的介绍
但是,今天的重头戏是我们即将发布的新旗舰模型,我们将其命名为 GPT-4o。GPT-4o 特别的地方在于,它将 GPT-4 级别的智能带给了所有人,包括免费用户。我们将在今天进行一些现场演示,展示我们新模型的全部能力,并且我们将在接下来的几周中逐步发布它们。
3、使命和目标我们使命的一个重要组成部分是能让我们的先进人工智能工具面向所有人免费开放。我们认为,人们对技术可以做到什么有直观的理解非常重要。因此,我们希望将其与更广泛的理解结合起来,并始终在努力寻找减少使用难度的方法。最近,我们已经可以不用注册就能使用 ChatGPT。今天,我们为 ChatGPT 引入了桌面应用程序我们希望你能在任何地方都能使用它。
4、用户界面更新如你所见,它使用起来简单轻松,可以非常顺利地融入你的工作流程。同时,我们也刷新了用户界面。我们知道这些模型变得越来越复杂,但我们希望与之的互动体验能变得更加自然、简便,让你无需专注于用户界面,只需聚焦于与 GPT 的交互。
5、技术进步和人机交互的未来接下来是重大新闻。今天我们发布了最新的旗舰模型——GPT-4o。GPT-4o 提供了 GPT 4 级别的强大智能,并且运行速度更快,在文本、视觉和音频等方面的能力也有所提升。过去几年里,我们专注于提升这些模型的智能性,现在它们已经表现得相当出色。但这是我们首次在使用便捷性方面实现了重大突破。这一点极其重要,因为我们正在展望人机交互的未来。我们认为,GPT-4o 正在引领我们进入一个新的协作时代,在这个时代,人机交互将变得更加自然、更加便捷。
6、语音与多模态交互的挑战与解决方案然而,实现这一点其实非常复杂,因为在人与人的交流中,有许多我们习以为常的细节。我们在与人互动时的对话便捷性,背景噪音,一个对话中的多重声音,或者理解声音的语调。所有这些对模型来说都是极其复杂的任务。到目前为止,在语音模式下,我们采用了三种模型共同提供服务。包括:语音转录、智能处理以及文本转语音技术,
这三者协同合作,共同打造了语音体验。但这也带来了大量的延迟,破坏了我们在 GPT 上的沉浸式协作体验。然而,有了 GPT-4o,这一切都能够原生实现。
7、广泛的用户接入和新功能GPT-4o 能够跨声音、文本和视觉进行智能推理。得益于这种卓越的处理效率,我们现在甚至可以将 GPT-4 级别的智能服务提供给免费用户。这是我们一直想要实现的目标,我们非常兴奋终于能把 GPT-4o 带给所有用户。现如今,我们已经有超过 1 亿用户利用 ChatGPT 进行创作、工作和学习。我们有许多高级工具,但以前只有付费用户可以使用。凭借 4o 的高效性,现在我们可以将这些工具提供给所有人。所以,从今天开始,你可以在 GPT 应用商店中使用 GPT。到目前为止,我们已经有超过一百万的用户用 GPT 创造了令人惊叹的体验。这些都是在应用商店中可用的,为特定用途定制的 ChatGPT。现在,我们的开发者们有了更大的受众,大学教授们可以为他们的学生创造内容。或者,播客可以为他们的听众创造内容。你还可以使用视觉功能。因此,现在你可以上传截图、照片或含有文本和图像的文件。并且你可以和 ChatGPT 就这些内容展开对话。你还可以使用记忆功能,这使得 ChatGPT 变得更有用、更有帮助,因为现在它可以记住你的所有对话内容。你还可以使用信息搜索功能,在你的对话中搜索实时信息。还有数据分析功能,你可以上传图表或其他信息,它会对这些信息进行分析。它会给出答案等等。
8、多语言支持的提升最后,我们也提高了 ChatGPT 在 50 种不同语言中的质量和速度。这非常重要,因为我们希望能把这种体验带给尽可能多的人。所以我们非常激动地将 GPT-4o 带给我们所有的免费用户。对于付费用户,他们将继续拥有超过我们免费用户五倍的容量限制。
9、GPT-4o 的扩展到 API但是,GPT-4o 不仅仅在 ChatGPT 中可用,我们也将其引入到了 API 中。因此,我们的开发者现在可以开始使用 GPT-4o 来构建了不起的 AI 应用,并进行大规模部署。4o 的速度是 GPT-4 Turbo 的两倍,价格降低了 50%,速率限制提高了五倍。
10、面临的挑战与未来展望然而,当我们将这些技术引入世界时,如何以一种既有利又安全的方式进行,这是相当具有挑战性的。GPT-4o 在安全性方面为我们带来了新的挑战,因为我们正在处理实时音频和实时视觉。我们的团队一直在努力寻找防止滥用的解决方案。我们继续与各方利益相关者合作,比如政府、媒体、娱乐业、所有行业、红队成员和公民社会,以找出如何最好地将这些技术引入世界。
因此,在接下来的几周里,我们将继续进行迭代部署,向你提供所有的功能。
附件 2:Sam 的博客
Sam 自己写了一条博客来阐述他对今天发布的 GPT-4o 的看法。
他们的阶段性目标获得了更新:
用最低的价格甚至是免费,将最好的模型提供给世界上所有人,“Open AI”新概念。
全文内容:
首先,我们的使命是向人们免费(或以非常优惠的价格)提供功能强大的 AI 工具。
我为我们能在 ChatGPT 中免费提供世界上最先进的模型感到非常自豪,这一切都没有广告或其他干扰。
最初,OpenAI 的设想是开发 AI 技术,并利用它为全球带来益处。然而,现实是我们开发了 AI 技术,而其他人则利用这些技术创造了令全世界受益的杰出成果。
作为一家企业,我们有很多服务是需要收费的,这也支持我们向全球数十亿用户提供免费的顶尖 AI 服务。
其次,新推出的语音(及视频)模式是我使用过的最佳计算界面。它给人一种电影中 AI 的感觉,让人不禁惊叹这竟是真的。达到与人类相似的响应速度和表达能力,标志着一个重大的转变。
最初的 ChatGPT 已经展示了语言界面的潜力;而这一新技术则在体验上有了质的飞跃。它反应迅速、智能、有趣、自然且实用。
以前,我与计算机对话从未感觉如此自然;但现在,我终于有了这种感觉。随着我们逐步增加个性化选项、获取个人信息的权限、代表用户执行操作的能力等功能,我真的可以预见到一个激动人心的未来:我们能够利用计算机完成以往无法想象的更多事务。
最后,非常感谢我们团队的每一位成员,是他们的辛勤工作让这一切成为可能!
好啦,今天的分享就到这里!
既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标 ⭐ ~谢谢你看我的文章
付费加入知识星球“浩瀚的 AI 苍穹”后,即可取得 VIP 学习群加入方式!
以下是新人优惠券
也可以进入免费新手群,跟着大家,每天分享最新 ChatGPT ,Sora等实用干货!
不懂就问,言多必得!