查看原文
其他

Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。

Aitrainee AI进修生
2024-12-28

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生

Hi,这里是Aitrainee,欢迎阅读本期新文章。

今天是个好日子,AI Claude 触及物理世界。

之前介绍过许多 AI OS 代理,而这次是实力强大的官方实现。虽然基准测试通过率也不是太高,但相比以前的,它排名第一,虽然远低于人类,但未来可期。

Haiku 还不能测试,但 Anthropic 还升级了 Claude 3.5 Sonnet。

所以

我们聊这个。

Claude 3.5 Sonnet 没更新前就被称为最好的编码模型。现在它更强,在Aider榜中超越原来的第一:o1-preview。

更新后,价格和速度保持一致。

>/ 以下素材取自 AiCodeKing、WorldofAI

我们让它,生成一个简单蝴蝶形状的 SVG 代码。

以前测试的许多模型绘制的并不好。

而。我可以说,这是。。最漂亮的一次。

他怎么能画得这么好啊啊啊🐶。

他还以12-1的战绩答对了我们以前对于大模型的测试问题,即便o1也不能完全答对,比如第4条。

不过这也不是重点,没升级的模型也能答对这么多,所以我们还是看看实际编码效果。


一张图,生成APP

惊讶。。

这个任务是这样的 —— 

创建一个可以添加我需要记住的事项的应用。每个事项应该都有一个切换按钮,我可以在认为我完成了时切换。

基于一这个个前置 React 创建的 Exрo Арр : npx create-expo-app ,

给此图,改的。

前置 React 创建的 Exрo Арр 相当于做了v0、Blot那些模板工作,这样才好运行


继续。。

编写一个视觉吸引且用户友好的天气仪表板。

灰常NB。


接下来 —— 实现 Dijkstra 算法,在加权图中找到最短路径,包括使用如 Matplotlib 和 NetworkX 等库可视化图形和路径。

嗯。他对了

算法实现、绘图功能、函数结构都很清楚。厉害。


嗯。优秀的编码模型

优于许多其他模型,如 o1-preview 和新款 Haiku 模型


然后,我们使用强大的Aider再加上强大的它,试试 ——

先给它一个基于React创建的 Exрo Арр

Prompt 这是一个Exрo应用程序。我希望你废弃所有以前的页面,只是做一个一页的应用程序。这个页面显示我所有的费用,底部的右下角 有一个添加按钮,这将打开一个弹窗,我可以添加费用,这将显示在页面上。我还希望编辑和删除选项每一次费用此外,我希望这是名字是 KingDay,我也想要一个选项,一次清除所有的费用。

很酷,真的,基于原型,直接改。。


嗯,再聊聊基准测试——

编码方面,它在 Sued Bench 认证测试中的得分从 33.4 提升到了 49%,超越了所有公共模型,包括 OpenAI o1-preview,,同时在CodeHunanEivat 也创下了新纪录


与 o1 进行直接比较

某些基准下 o1-preview的表现确实优于 Sonic 3.5,然而在编码和与之相关的几个基准测试中,Sonic 3.5 显然超过了 o1-preview

它比o1更便宜,而且。没有 30条消息限制,它是自动编码和多步骤 AI 任务的首选。。


Aider中使用 Sonnet

安装aider 

aider --sonnet 启动aider --sonnet --cache-prompts 以提示缓存启动(减少90%token消耗)

不多言,过往文章一堆 Aider,

这样搜

Aider(已升级):Aider利用双模型架构做到85% SOTA得分!(架构师/编辑师助你实现编程新高度)

2024-10-01


Cline 中使用 Sonnet

在设置选项中,你会看到这个新模型,它默认被选中。如果你使用Open Router 或 Vertex AI等,新的模型也已可用。


🌟希望这篇文章对你有帮助,感谢阅读!如果你喜欢这系列文章请以 点赞 / 分享 / 在看 的方式告诉我,以便我用来评估创作方向。

💫video source

https://www.youtube.com/watch?v=X58CJykY6vo

https://www.youtube.com/watch?v=ifQPPGMKJ9k

👽Submission
kristjahmez06@gmail.com
参考链接:
[1] https://www.anthropic.com/news/3-5-models-and-computer-use

知音难求,自我修炼亦艰

抓住前沿技术的机遇,与我们一起成为创新的超级个体

(把握AIGC时代的个人力量)

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

修改于
继续滑动看下一个
AI进修生
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存