查看原文
其他

GPT5 来啦?!OpenAI突然发布o1模型,多项基准测试超过人类博士水平!

清风徐徐来 AI变现研习社
2024-10-16




半夜,正准备睡,突然看到OpenAI 半小时前发了条X:

OpenAI 你不讲武德啊!

前天才有传闻,两周内发布"草莓"大模型

咋个你今天就发了?

根据O记官方网站,将在现有模型下拉菜单新增一个 o1-preview

还官宣说:“今天在 ChatGPT 中向所有 Plus 和 Team 用户推出,并在第 5 层开发人员的 API 中推出。”

个别网友已经开通了新模型!

 

根据官网介绍:

OpenAI o1 在回答之前会思考,并且能够在回应用户之前产生一个较长的内部思路链。

O1-preview 具有很强的推理能力和广阔的世界知识。

o1 在竞争性编程问题中排名第 89 位,在美国数学奥林匹克资格赛中跻身美国前 500 名学生之列,并且在物理、生物和化学问题基准测试中的准确度超过了人类博士水平。

同时发布的还有 OpenAI o1-mini,这是一种经济高效的推理模型,擅长 STEM,尤其是数学和编码。


OpenAI CEO 山姆奥特曼也说:“O1,我们迄今为止最有能力和最一致的一系列模型”

大家仔细看上面这张图,绿色是目前全球综合能力第一的GPT4O

橙色是今天发布的O1预览版,红色是O1正式版

新模型很强啊

编程能力

进步来自于强化学习

我们的大规模强化学习算法教会模型如何在高度数据高效的训练过程中使用其思维链进行高效思考。我们发现,随着强化学习(训练时计算)的增加和思考时间的增加(测试时计算),o1 的性能会不断提高。扩展这种方法的限制与 LLM,我们将继续研究它们。

以下是O1能力实测

OpenAI o1 根据提示编写视频游戏代码。

OpenAI o1 解答了大型语言模型的一个著名棘手问题

官方放出的总评测分数:


简单说,GPT4o是AI的高中水平,O1就是研究生水平,部分能力超过博士生!

Claude3.5的编程、文字能力为啥强,就是因为引入了强化学习!

用 Self-play RL 强化过的,之前全球独一份,天刷屏的汉语新解也是因为这个原因!

OpenAI这次升级,既是防御,也是进攻

目前O1有限提供给所有 Plus 和 Team 用户推出,API 五层用户

GPT Plus开通方式详见:
《保姆级教程!手把手教你用支付宝开通 ChatGPT plus!》

另外,OpenAI的官网还放出了API价格

O1价格是GPT4o的约5倍,mini则是20倍!

从价格来看,O1应该要限制Plus使用次数,类似于当年GPT4刚出来的时候!

好啦,今天的分享就到这里!

用汉语新解的GPT-5来结尾


既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标 ⭐ ~谢谢你看我的文章

付费加入知识星球“浩瀚的 AI 苍穹”后,即可取得 VIP 学习群加入方式!

加入星球,价格每隔 1-2 周适当上调,希望大家尽早入群,懂的都懂!

以下是新人优惠券

「学习群」 如果你想学习 AI 知识,欢迎加入我们的学习群。请后台发送“入群”或扫描下方二维码。

以下是新人优惠券

也可以进入免费新手群,跟着大家,每天分享最新 ChatGPT ,AI办公等实用干货

加笔者微信 wxid_dwqchmjjphwl12  。

24小时内响应,送你一份AI搞钱副业精选项目.pdf

有了文小言,我也是穿普拉达的女王
你不能错过的操作秘籍,办公室小白也能轻松搞定 Excel 动态图表
七个国外顶流AI的国产平替,不花钱还超好用环肥燕瘦!
免费使用 GPT-4o 的六个网站
掌握了这些神器,你就是办公室卷王!

用AI画小姐姐,真的顶了!
美国人吹的牛,被这个中国AI实现了!
又被夸了!六个案例讲透 AI 做文档分析
天呐! AI 之王 GPT-6 猎户座 来了!
房屋养老金=房产税?AI竟然这样回答
免费生成美猴王图片的六个AI网站
姜萍作弊了吗?我问了18个AI搜索,竟给出了这样的回答
 Kimi+ WPS,5 分钟做行研 PPT
清华 AI 团队用 ChatGPT 开医院,一天看完几年的病
保姆级教程!手把手教你支付宝开通 ChatGPT plus!
可视化!用 GT4 十分钟内完成泰坦尼克号生存分析
继续滑动看下一个
AI变现研习社
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存