查看原文
其他

ChatGPT王炸升级,寸草不生

老G先生 技术琐话 2023-11-10

2023-11-07 凌晨,OpenAI 首届开发者大会如期举行。诸多媒体都有报道,一个词就是炸裂。

我们看一下都有哪些变化?

OpenAI汇聚开发者200万,客户覆盖92%财富500强公司,周活跃用户1亿。


新模型亮点:

1、更长上下文;

2、更强的模型控制;

3、更好的模型知识;

4、更多模态;

5、个性化GPT;

6、更高输出速度。


🎯1、新模型GPT-4 Turbo:上下文扩展到128K,模型知识更新到23年4月。输入价格$0.01/1K tokens,输出$0.03/1K tokens。GPT-4的微调也加入实验性访问。


🎯2、多模态:DALL-E 3、GPT-4V和新的文本到语音(TTS)全部加入API。


🎯3、API降价&提速:GPT-3.5-Turbo升级到默认16K上下文(之前是4K起),价格输入$0.001/1K tokens,输出$0.002/1K tokens,分别比之前便宜了3倍和2倍。GPT-3.5-Turbo 16K微调价格输入$0.003/1K tokens,输出$0.006/1K tokens,分别便宜了4倍和2.7倍。每分钟token输出速度快2倍。


🎯4、个性化GPT:用户可以定制GPT配置,适应不同的应用场景。既可以自然语言让模型帮助配置,也可以手动配置。支持上传用户知识文件进行检索,以及代码解释器、DALL-E等功能选择。


🎯5、培养商店生态:将推出GPT商店,直接上架用户配置好的个性化模型。OpenAI将对最常用的个性化模型开发者进行奖励,培养生态。由插件商店,过渡到模型商店。


🎯6、Assistant API:进一步方便应用开发者开发程序,支持函数调用、上传文档、代码解释器等,并能够配合手机端实现语音输入。



自定义GPT和GPT商店


自定义GPT,非常简单,不用编写代码。还将上线“GPT商店”,与创作者分享收入。

CEO山姆·奥特曼现场登台演示,3分钟不到,只凭几步操作做好一个“创业导师GPT”。

接下来,“创业导师GPT”就可以根据奥特曼本人过去的演讲内容,回答创业相关问题。

刚刚出炉的新GPT,可以在公司内部共享或对所有人公开。

从此,“GPT开发者”像“iOS开发者”一样成为了新的职业,让AI替你赚钱的梦想成真了。

在极客邦TGO旗下的微信群“TGO和朋友们的AGI”有一些讨论。大概几个要点:

黄小刀老师:GPT Store会是IPhone时刻么?

杨攀@TGO:AppStore Moment。

水哥@NVIDIA:agent store moment。

wei li:插件那次说是AppStore 时刻,后来发现不够给力。算是一次预演,同时也发现了诸多痛点。这次重新披挂上阵,只能说更具AppStore Moment的可能性。

主要的两大生态痛点依然存在。第一是领域壁垒依然,虽然有所松动。第二是商业模式仅仅指望store分成来刺激,不足以匹配这么一次技术大革命的预期。

刘连响:插件是制定了一系列的规则,让现存的网站去适配,这个大家没有动力。

黄小刀:热门插件的功能,官方都下场自己做了。

刘连响:类似agent的方式才是未来,把复杂性留给开发者。


推出 Assistant API

这一 part 是针对基于 API 开发中的痛点。


为了解决这些问题,推出 Assistant API[2]。Assistant API 引入了thread的概念,用于实现 stateful API。不过除了常规的 token 计费以外,还是额外收取 Code Interpret thread和 Retrieval 的费用。

从介绍来看,Assistant API 概念核心就是 threading、Retrieval、Code Interpreter 和 Function calling 四部分。


  • Assistant API拥有持久且无限长的线程,允许开发人员将线程状态管理移交给 OpenAI 并解决上下文窗口约束。

  • 支持检索功能,利用模型之外的知识来增强,例如专有领域数据、产品信息或用户提供的文档。

  • 支持代码解释器功能,与ChatGPT Plus中的一样,可以在沙盒执行环境中编写和运行Python代码,可以生成图形和图表,并处理具有多种数据和格式的文件。

  • 函数调用功能也迎来更新,现在可以一次性调用多个函数,并把响应合并到消息输出中。


发布会现场演示了构建Assistant的过程,只需要自然语言描述指令,以及勾选启用的工具。

接下来就能在应用程序中调用,在得到10个巴黎旅游景点的同时更新地图标记。

在检索和函数调用演示中,让AI给每个线下参加活动的观众账号发了500美元的使用额度,非常羡慕了。

新的多模态模型


在多模态能力方面,GPT-4 Turbo的API将集成DALL-E3,以及文生语音模型TTS(text-to-speech)。


开发者可以通过API直接调用GPT-4 Turbo with vision中的DALL-E3模型,进行图片识别和图片生成。事实上,DALL·E 3上线之后,ChatGPT Plus用户就已经可以在GPT-4模块下调用DALL·E 3进行图片创作,以及多模态的图片识别了。不过,这次是以API的形式,将多模态的能力开放给开发者。


此外,OpenAI还上线了新的TTS文生语音功能。类似能力,在ChatGPT手机端也已经上线了一段时间(不过目前实测中文还是有一点英语口语),此次也是针对开发者的API开放。目前TTS的语音包共有六种声音可选,可以输出Opus、AAC和FLAC三种格式,尚不支持自建声音。


围绕OpenAI 创业有随时关门的危险


宜博老师在成都分享《AI创业:3个月做20+场景签8家单背后的秘密》曾经提到,围绕类似GPT的创业,很可能你之前work,在GPT3.5之后就被颠覆了,4.0和5.0 出来之后肯定还会有不少被折叠的。行业know-how 的积累,贴身服务可能是小公司的一个点。


有朋友总结了一个excel,本次发布会可能对相关生态创业的降维打击。供参考。




生成式AI,还非常早期。


9月份有文章《狂飙284天后,一批模仿ChatGPT的创业公司或将倒闭》报道大模型创业的冰火两重天。其中谈到,作为一款面向作家和企业的生成式人工智能写作工具,截至今年7月,Jasper的用户增长已经连续四个月下降。有知情人士称,虽然该公司于去年秋季筹集了1.25亿美元资金,估值已经高达15亿美金,但仍于7月份进行了一轮裁员,并下调了今年的收入预测。


所以,生存或死亡,这是摆在创业公司面前的一个问题。生存既要考虑今天,还要为明天做准备,尽可能再想一点后天。没有太高门槛的赛道很难扛住后续的进入者,而依托于平台的创业,如果这个平台没有边界,也很蛋疼。


未来已来。


本文参考量子位、机器之心相关报道,以及

https://zw73xyquvv.feishu.cn/wiki/FJb4wzL7GiUoqkkGXnqcN1WEn2d


欢迎加入技术琐话读者群,请后台回复:读者群


下载宜博老师演讲ppt,请在后台回复:宜博


往期推荐:

技术琐话 



以分布式设计、架构、体系思想为基础,兼论研发相关的点点滴滴,不限于代码、质量体系和研发管理。




继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存