该内容已被发布者删除 该内容被自由微信恢复
文章于 6月7日 上午 10:23 被检测为删除。
查看原文
被用户删除
其他

【2023.9】LLM商用API及feature快报

孔某人 孔某人的低维认知 2023-10-19


前言

之前曾说过我觉得2023年下半年会是商用API爆发的时点,现在截至到9月底,可以来review一下了。

国内主要商用LLM API

列举一下已经公开的主要商用LLM API服务

  • 百度千帆 ernie

  • 讯飞星火 spark

  • minimax abab5

  • 智谱 ChatGLM,聆心智能 CharacterGLM

  • 阿里 通义千问

  • 百川

  • 字节火山 Skylark


其他还有一些,不过可能大家关注就不多了。(欢迎评论区讨论)

简评

  • 简易的搜索插件已经成为国内LLM的标配,除了火山以外全线支持。国内明显这种研发性价比高的feature上相对于国外就比较卷。

  • function calling能力目前仅 百度千帆 、Minimax支持

  • system prompt类似功能目前还仅有minimax和CharacterGLM支持。大家都不重视感觉有点奇怪。

  • CharacterGLM这个定位是要正面硬刚minimax主场,有戏可看了。

  • minimax的API功能真的多,可惜暂时还没有官方SDK

  • 定价大多接近gpt-3.5-turbo,除了星火(被制裁了只能用别的硬件)比较贵。


商用LLM竞争简单展望

目前可以说主流玩家都已经到齐,到现在还没推出API的基座LLM炼丹团队到底能力如何已经开始被(我)怀疑。

定价上大家都比较接近,我觉得大多是瞄着gpt-3.5-turbo来定价的,不好意思比它贵太多。实际成本方面,应该是不赚钱的,全球都有人不断地感慨“为什么gpt-3.5-turbo这么便宜”。

某种意义上来说,现在就已经进入价格战前期了。

长期竞争上,如果主要feature拉不开差距,效果上也拉不开差距的竞品之间,最终都会导向价格和生态绑定竞争了。BBAT大厂可以亏钱把创业公司烧死,感觉已经可以预见竞争的惨烈。

效果到底能不能拉开差距呢?我觉得在第一梯队里大概是拉不开太多用户体感差距的。特别是很多实际使用场景还要经过上层策略的封装,最后能在客户上体现出的可感知效果差异可能就更小了。(第一梯队有哪些我也没有确信的答案,等待社区的进一步测试和认知吧。)

海外主要商用LLM API

简评一下Q3的变化:

OpenAI

  • 0613的重大更新之后,主要是gpt-3.5-turbo微调。

  • 期待后续大概会在Q4发布的feature

    • gpt-4-turbo

    • 更长上下文支持

    • 多模态相关


Claude

  • API已经可以通过AWS进行申请,可惜还是没有大量供应。


商用embedding API

以上国内LLM API一般也都提供了embedding的API,这方面大家可以留意下。

交流与合作

如果希望和我交流讨论,或参与相关的讨论群,或者建立合作,请私信联系,见 联系方式

希望留言可以知乎对应文章下留言


本文于2023.9.27首发于微信公众号与知乎。

知乎链接 https://zhuanlan.zhihu.com/p/658804551



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存