OpenAI役骗我,GPT-4o 货不对板!
你好,我是清风徐来,这是《AI,从入门到精通》 系列第 242篇原创文章。
前两天,OpenAI 发布了 GPT-4o
o 是 omni 的缩写,大概是 omnipotent(全知全能)的意思
根据奥特曼介绍,GPT-4o 是一种全新的多模态大语言模型。它可以处理文本、图像和音频输入并产生文本、图像和音频输出。
奥特曼不愧是营销大师,这次发布效果堪比 Sora 发布!让第 2 天的谷歌年度开发大会黯淡无光!
OpenAI 旗下的 omni 开发团队弹冠相庆
本公众号也第一时间发表了分析文章:
《OpenAI 终于 OPEN!, 附 GPT-4o 开通答疑》
还协调国内直联 GPT,第一时间接入了 GPT-4o(点击“阅读原文”可达)
《国内直联 GPT 接入 GPT-4o !手把手保姆级教程》
用下来,确实速度很快,感觉比 gpt3.5 还快
有个朋友看了盲人辅助那个视频后说:妈的,导盲犬都要遭整失业了!(GPT+机器狗)
gpt4o不但国内普通用户关注度高,程序员群体也在跃跃欲试
有两个朋友,互联网产品经理,已经组织团队开了几次会,讨论如何利用 GPT4o 开发套壳情感类网站和 APP 了!我看了他们的方案,充气娃娃都上了!!
结果这两天不断有小伙伴来质问:
“清风,咋个 GPT-4o 的语音模式还是老的呢?”
一、货不对板?
清风我也纳闷,找来 APP 用了下,发现:
语音模式,就是界面右下角的耳机图标。
尝试了一下,效果不错,但还是老效果,并不像周一演示中的语音模式那么好。
货不对板!
到目前为止,通过官网和 API 的 GPT-4o 版本只能处理文本和图像输入并生成文本输出。其他功能在 OpenAI 之外尚不可用!
以下是 GPT-4o 官网大标题:
现实情况是:OpenAI 宣布推出了新模型,你在界面也选择新模型 gpr-4o,除了文字处理,其他都是老版本!
我记得 OpenAI 说的几周内全部更新(美女CTO会上说的)!但总觉得哪里不对劲
去找官方原文来看了看
openai.com/index/hello-gpt-4o
有两段提到了“接下来几周”
一个是对Plus用户
“我们将在未来几周内在 ChatGPT Plus 中推出新版语音模式 GPT-4o 的 alpha 版。”
一个是 API(适用开发人员)
我们计划在未来几周内在 API 中向一小部分值得信赖的合作伙伴推出对 GPT-4o 新音频和视频功能的支持。
综上,付费的 PLUS 用户几周内可以使用科幻片《HER》中的语音功能,但是不包括视频(实时视频交互)!
注册了会员,1、2个月就可以先人一步,用上真正的GPT4o了!
开通 GPT plus 详见《保姆级教程!手把手教你用支付宝开通 ChatGPT plus!》
而开发者的 API,用官方的话说,则只是“一小部分”值得信赖的朋友开通!国内的开发者短时间内就不要想了!
NND,说得油爆爆的,结果发布了一个半成品!
不过也不能怪 OpenAI?人家黑纸白字写清楚了的,是用户自己被冲昏了头脑(奸商)
估计质疑太多,奥特曼自己出来打圆场
上一次的 Sora,到现在都没用上!美女 CTO 参加访谈,现场演示 Sora 生成质量还翻了车!
GPT-4o 呢?会不a的后尘
二、这个世界会好吗?
为了安抚自己,我又翻出 OpenAI 春季发布会视频压压惊,
GPT-4o 模型的特点如下:
情感理解:能够理解人类的语气情感和表情情绪,表达与沟通更具人性化。
真的是《HER》现实版!
反应速度:反应速度极快,几乎实时,使得对话更加流畅,并且可以被打断。
快得让我想起那个夏天,我从 56K 老猫切换到 ADSL
免费使用:对所有人开放,免费使用,让每个人都有机会拥有一个 AI 朋友。
已经有人做了结构,4 个免费账户 = Plus(大概率会封号,技术小白别试)
视觉交互:不再需要通过键盘输入指令,可以直接进行对话,或者使用手机摄像头进行交互。
下面,我们结合具体案例说明:
1、随身翻译官
GPT-4o 就像个随身翻译官,旅行时不用带翻译软件了,它实时帮你翻,懂你的笑话,还能 get 到你的情绪,超方便的!
说明:本文中文视频来源宝玉baoyu.io
2、口语陪练
GPT-4o 可以配你练口语,不仅能陪你练口语,还能帮你纠正发音,让你一句句练习,反复听反馈,直到说得好。
不过,有了翻译官,还要会口语干啥?
3、全能家教
GPT-4o 这个全能家教,不仅 24 小时在线,还能实时互动,引导解题,甚至在你跑题或者走神时帮你回到正题,就像有个耐心的老师在旁边一样。
GPT-4o 模型的贴心之处在于它能够提供个性化的学习支持,帮助孩子们解决数学、物理、国文、英文、社会科等各种学科问题。这种互动式学习方式让孩子们在学习时不再感到孤单,有了一个可以对话的伙伴。它预示着未来学习方式的颠覆性变革,同时提高了 iPad 等设备的生产力功能,使其不再仅仅是娱乐工具,而是成为学习的强大助手。
4、情感伴侣
GPT-4o 的第四个特性是它具有强大的情感能力,能够提供陪伴和情感支持。它不仅能够理解用户的情绪需求,还能以不同的声调和情感回应,使得交互更加生动和富有人情味。这种能力让它可以作为一个情感丰富的聊天对象,或者在用户心情不佳时提供安慰和放松的对话。
一句话,今夜不寂寞
5、会议助手
可以做会议助理,比如,做流水、做纪要,还可以做辅助
高级别会议,都会邀请高级管理人员或者专家列席
比如,开会开到一半,突然问 GPT,我们公司的XX项目收入?章程中关于投资权限解释下?找几个司法实践中的实际案例?
AI绝对不会文过饰非,隐瞒不报
6、长期记忆
还记得那篇吗?《GPT 比你老婆还懂你,它是怎么做到的?》
以后除了家庭医生,家庭律师,还有家庭 AI,它可以做你家的大管家
有
7、实时视觉助手
帮助低视力人士更好地探索世界
导盲犬都失业了!
8、其他
除了发布会的视频,官网还披露了以下功能
目前来看,虽然目前 GPT-4o 的功能还没有全部开放,但我们只有等待!
就像《阿甘正传》里说的:‘生活就像一盒巧克力,你永远不知道下一颗是什么味道。’
保持理智,相信未来;战胜我们的不是90后,00后,而是努力后,实践后!
好啦,今天的分享就到这里
可以进入免费新手群,跟着大家,每天分享最新 ChatGPT ,数字人等实用干货!
或者付费加入VIP 学习群,学习氛围更好
以下是新人优惠券
不懂就问,言多必得!