Anthropic 的 Claude 3.5 表明：大模型还有提升空间

Carl Franzen AI新智能

2024-09-06

Anthropic正式发布Claude 3.5 Sonnet，数据碾压GPT-4o，速度也大幅提升。

据报道，在发布一个月后，一个新的大型语言模型（LLM）显然从OpenAI的GPT-4手中夺走了性能桂冠。

今天，由Anthropic发布的新的Claude 3.5 Sonnet聊天机器人和LLM，在关键的第三方基准测试中超越了世界上所有其他模型。

据该公司称，它不仅性能更好，而且比之前的Claude 3模型更快、更便宜。

但推出一个新模型并宣称其主导地位是一回事，让用户真正体验并利用性能提升则是另一回事。

Anthropic最新发布的Claude 3.5 Sonnet似乎没有这个问题。在发布后的短短几小时内，许多 AI 影响者和高级用户已经在网上分享了他们对这款新模型的积极印象，并展示了这个世界上“最智能”的大型语言模型能够完成的任务。

提升编程技能和产品创作

正如企业AI影响者和专家艾莉·K·米勒在X平台上所写，Claude 3.5 Sonnet 仅凭一个截图，在不到半分钟的时间内为她创建了一个完整的可玩游戏：

同样，信息丰富且及时的X账号@TestingCatalog News展示了新推出的“Artifacts” playground——该平台与Claude 3.5 Sonnet同时亮相，实际上展示了聊天机器人界面旁边的交互输出视图——可以执行Claude 3.5 Sonnet构建的真实可用的网页表单代码。

它甚至能够重现1995年经典电影《黑客帝国》（Hackers）中的影像：

企业AI图像生成初创公司EverArt的创始人彼得罗·施拉诺在X平台上写道，将Claude 3.5 Sonnet与另一款工具Maestro结合使用，显示出“通用人工智能的火花？”

Anthropic员工为

Claude 3.5 Sonnet站台

尽管显然存在偏见，Anthropic开发者关系团队负责人亚历克斯·艾伯特在X平台上发了一条帖子，强调Claude 3.5 Sonnet “在编程和自主修复拉取请求方面开始变得非常出色”，甚至表示：“很明显，再过一年，大量代码将由大型语言模型编写。”

同样，Anthropic的技术人员玛吉·沃在X平台上发帖称，Claude 3.5 Sonnet 现在能完成“我一半的工作……我对此感到非常高兴。”

给OpenAI 施加压力

其他人则指出，现在Claude 3.5 Sonnet已经超越了OpenAI的GPT-4o，并且以类似的价格提供，后者公司面临着继续证明其模型是正确选择的新的压力。

宾夕法尼亚大学沃顿商学院教授兼AI推动者伊桑·莫利克将Artifacts功能与 OpenAI GPT-4的“简化版Code Interpreter”进行了比较。

X 用户@kimmonismus更进一步，表示OpenAI将“错过通用人工智能（AGI）”，即公司宣称的在大多数具有经济价值的工作中表现优于人类的AI 模型目标。他们抨击公司宣布了尚未推出的GPT-4o的附加功能，包括新的语音模式。

仍未达到人类水平

尽管在X平台上备受赞誉，但也有人指出，Claude 3.5 Sonnet在一些看似简单的认知任务上仍然存在困难，这些任务是人类相对容易完成的，比如玩“井字棋”。

同样，科技记者蒂莫西·B·李，在X平台上以@binarybits为名，指出它“有时仍会犯愚蠢的错误”。他发布了一张截图，展示了一个简单的数学文字问题的答案：哪个更值钱：100个便士还是3个25美分硬币？Claude 3.5 Sonnet 最初回答是3个25美分硬币。

尽管目前存在这些较小的问题，Claude 3.5 Sonnet仍然是Anthropic和大型语言模型（LLM）的一个巨大飞跃，并表明各个AI模型制造商的性能提升在当前可用计算资源（如 GPU）水平上肯定没有放缓。（VentureBeat）

继续滑动看下一个

AI新智能

向上滑动看下一个

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！

哈里斯女粉搞4B运动、毒杀丈夫，回旋镖能否让美国“血流成河”

比国产光刻机更重要的IPO要来了！

Anthropic 的 Claude 3.5 表明：大模型还有提升空间

您可能也对以下帖子感兴趣

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下 一生守护”慈善项目捐赠仪式圆满举行！

哈里斯女粉搞4B运动、毒杀丈夫，回旋镖能否让美国“血流成河”

比国产光刻机更重要的IPO要来了！

生成图片，分享到微信朋友圈

Anthropic 的 Claude 3.5 表明：大模型还有提升空间

您可能也对以下帖子感兴趣

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！