ChatGPT王炸升级，寸草不生

2023-11-07 凌晨，OpenAI 首届开发者大会如期举行。诸多媒体都有报道，一个词就是炸裂。

OpenAI汇聚开发者200万，客户覆盖92%财富500强公司，周活跃用户1亿。

新模型亮点：

1、更长上下文；

2、更强的模型控制；

3、更好的模型知识；

4、更多模态；

5、个性化GPT；

6、更高输出速度。

🎯1、新模型GPT-4 Turbo：上下文扩展到128K，模型知识更新到23年4月。输入价格$0.01/1K tokens，输出$0.03/1K tokens。GPT-4的微调也加入实验性访问。

🎯2、多模态：DALL-E 3、GPT-4V和新的文本到语音（TTS）全部加入API。

🎯3、API降价&提速：GPT-3.5-Turbo升级到默认16K上下文（之前是4K起），价格输入$0.001/1K tokens，输出$0.002/1K tokens，分别比之前便宜了3倍和2倍。GPT-3.5-Turbo 16K微调价格输入$0.003/1K tokens，输出$0.006/1K tokens，分别便宜了4倍和2.7倍。每分钟token输出速度快2倍。

🎯4、个性化GPT：用户可以定制GPT配置，适应不同的应用场景。既可以自然语言让模型帮助配置，也可以手动配置。支持上传用户知识文件进行检索，以及代码解释器、DALL-E等功能选择。

🎯5、培养商店生态：将推出GPT商店，直接上架用户配置好的个性化模型。OpenAI将对最常用的个性化模型开发者进行奖励，培养生态。由插件商店，过渡到模型商店。

🎯6、Assistant API：进一步方便应用开发者开发程序，支持函数调用、上传文档、代码解释器等，并能够配合手机端实现语音输入。

自定义GPT和GPT商店

自定义GPT，非常简单，不用编写代码。还将上线“GPT商店”，与创作者分享收入。

CEO山姆·奥特曼现场登台演示，3分钟不到，只凭几步操作做好一个“创业导师GPT”。

接下来，“创业导师GPT”就可以根据奥特曼本人过去的演讲内容，回答创业相关问题。

刚刚出炉的新GPT，可以在公司内部共享或对所有人公开。

从此，“GPT开发者”像“iOS开发者”一样成为了新的职业，让AI替你赚钱的梦想成真了。

在极客邦TGO旗下的微信群“TGO和朋友们的AGI”有一些讨论。大概几个要点：

黄小刀老师：GPT Store会是IPhone时刻么？

杨攀@TGO：AppStore Moment。

水哥@NVIDIA：agent store moment。

wei li：插件那次说是AppStore 时刻，后来发现不够给力。算是一次预演，同时也发现了诸多痛点。这次重新披挂上阵，只能说更具AppStore Moment的可能性。

主要的两大生态痛点依然存在。第一是领域壁垒依然，虽然有所松动。第二是商业模式仅仅指望store分成来刺激，不足以匹配这么一次技术大革命的预期。

刘连响：插件是制定了一系列的规则，让现存的网站去适配，这个大家没有动力。

黄小刀：热门插件的功能，官方都下场自己做了。

刘连响：类似agent的方式才是未来，把复杂性留给开发者。

推出 Assistant API

这一 part 是针对基于 API 开发中的痛点。

为了解决这些问题，推出 Assistant API[2]。Assistant API 引入了thread的概念，用于实现 stateful API。不过除了常规的 token 计费以外，还是额外收取 Code Interpret thread和 Retrieval 的费用。

从介绍来看，Assistant API 概念核心就是 threading、Retrieval、Code Interpreter 和 Function calling 四部分。

Assistant API拥有持久且无限长的线程，允许开发人员将线程状态管理移交给 OpenAI 并解决上下文窗口约束。
支持检索功能，利用模型之外的知识来增强，例如专有领域数据、产品信息或用户提供的文档。
支持代码解释器功能，与ChatGPT Plus中的一样，可以在沙盒执行环境中编写和运行Python代码，可以生成图形和图表，并处理具有多种数据和格式的文件。
函数调用功能也迎来更新，现在可以一次性调用多个函数，并把响应合并到消息输出中。

发布会现场演示了构建Assistant的过程，只需要自然语言描述指令，以及勾选启用的工具。

接下来就能在应用程序中调用，在得到10个巴黎旅游景点的同时更新地图标记。

在检索和函数调用演示中，让AI给每个线下参加活动的观众账号发了500美元的使用额度，非常羡慕了。

新的多模态模型

在多模态能力方面，GPT-4 Turbo的API将集成DALL-E3，以及文生语音模型TTS（text-to-speech）。

开发者可以通过API直接调用GPT-4 Turbo with vision中的DALL-E3模型，进行图片识别和图片生成。事实上，DALL·E 3上线之后，ChatGPT Plus用户就已经可以在GPT-4模块下调用DALL·E 3进行图片创作，以及多模态的图片识别了。不过，这次是以API的形式，将多模态的能力开放给开发者。

此外，OpenAI还上线了新的TTS文生语音功能。类似能力，在ChatGPT手机端也已经上线了一段时间（不过目前实测中文还是有一点英语口语），此次也是针对开发者的API开放。目前TTS的语音包共有六种声音可选，可以输出Opus、AAC和FLAC三种格式，尚不支持自建声音。

围绕OpenAI 创业有随时关门的危险

宜博老师在成都分享《AI创业：3个月做20+场景签8家单背后的秘密》曾经提到，围绕类似GPT的创业，很可能你之前work，在GPT3.5之后就被颠覆了，4.0和5.0 出来之后肯定还会有不少被折叠的。行业know-how 的积累，贴身服务可能是小公司的一个点。

有朋友总结了一个excel，本次发布会可能对相关生态创业的降维打击。供参考。

生成式AI，还非常早期。

9月份有文章《狂飙284天后，一批模仿ChatGPT的创业公司或将倒闭》报道大模型创业的冰火两重天。其中谈到，作为一款面向作家和企业的生成式人工智能写作工具，截至今年7月，Jasper的用户增长已经连续四个月下降。有知情人士称，虽然该公司于去年秋季筹集了1.25亿美元资金，估值已经高达15亿美金，但仍于7月份进行了一轮裁员，并下调了今年的收入预测。

所以，生存或死亡，这是摆在创业公司面前的一个问题。生存既要考虑今天，还要为明天做准备，尽可能再想一点后天。没有太高门槛的赛道很难扛住后续的进入者，而依托于平台的创业，如果这个平台没有边界，也很蛋疼。

未来已来。

本文参考量子位、机器之心相关报道，以及

https://zw73xyquvv.feishu.cn/wiki/FJb4wzL7GiUoqkkGXnqcN1WEn2d

欢迎加入技术琐话读者群，请后台回复：读者群

下载宜博老师演讲ppt，请在后台回复：宜博

往期推荐：

刘润道歉的背后

AI给研发带来的改变

技术琐话

以分布式设计、架构、体系思想为基础，兼论研发相关的点点滴滴，不限于代码、质量体系和研发管理。

市管干部“龚书记”免职迷局

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

法明传[2024]173号：关于加快推进起诉状、答辩状示范文本全面应用工作的通知(附下载链接)

ChatGPT王炸升级，寸草不生

推出 Assistant API

AI给研发带来的改变

您可能也对以下帖子感兴趣

市管干部“龚书记”免职迷局

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

法明传[2024]173号：关于加快推进起诉状、答辩状示范文本全面应用工作的通知(附下载链接)

生成图片，分享到微信朋友圈

ChatGPT王炸升级，寸草不生

推出 Assistant API

AI给研发带来的改变

您可能也对以下帖子感兴趣