Claude 3.5 Sonnet 升级后,很强。用它写代码不知道有多爽。
🍹 Insight Daily 🪺
Aitrainee | 公众号:AI进修生
Hi,这里是Aitrainee,欢迎阅读本期新文章。
今天是个好日子,AI Claude 触及物理世界。
之前介绍过许多 AI OS 代理,而这次是实力强大的官方实现。虽然基准测试通过率也不是太高,但相比以前的,它排名第一,虽然远低于人类,但未来可期。
Haiku 还不能测试,但 Anthropic 还升级了 Claude 3.5 Sonnet。
所以
我们聊这个。
Claude 3.5 Sonnet 没更新前就被称为最好的编码模型。现在它更强,在Aider榜中超越原来的第一:o1-preview。
更新后,价格和速度保持一致。
>/ 以下素材取自 AiCodeKing、WorldofAI
我们让它,生成一个简单蝴蝶形状的 SVG 代码。
以前测试的许多模型绘制的并不好。
而。我可以说,这是。。最漂亮的一次。
他怎么能画得这么好啊啊啊🐶。
他还以12-1的战绩答对了我们以前对于大模型的测试问题,即便o1也不能完全答对,比如第4条。
不过这也不是重点,没升级的模型也能答对这么多,所以我们还是看看实际编码效果。
一张图,生成APP
惊讶。。
这个任务是这样的 ——
创建一个可以添加我需要记住的事项的应用。每个事项应该都有一个切换按钮,我可以在认为我完成了时切换。
基于一这个个前置 React 创建的 Exрo Арр : npx create-expo-app ,
给此图,改的。
前置 React 创建的 Exрo Арр 相当于做了v0、Blot那些模板工作,这样才好运行。
继续。。
编写一个视觉吸引且用户友好的天气仪表板。
灰常NB。
接下来 —— 实现 Dijkstra 算法,在加权图中找到最短路径,包括使用如 Matplotlib 和 NetworkX 等库可视化图形和路径。
嗯。他对了
算法实现、绘图功能、函数结构都很清楚。厉害。
嗯。优秀的编码模型
优于许多其他模型,如 o1-preview 和新款 Haiku 模型
然后,我们使用强大的Aider再加上强大的它,试试 ——
先给它一个基于React创建的 Exрo Арр
Prompt :这是一个Exрo应用程序。我希望你废弃所有以前的页面,只是做一个一页的应用程序。这个页面显示我所有的费用,底部的右下角 有一个添加按钮,这将打开一个弹窗,我可以添加费用,这将显示在页面上。我还希望编辑和删除选项每一次费用,此外,我希望这是名字是 KingDay,我也想要一个选项,一次清除所有的费用。
很酷,真的,基于原型,直接改。。
嗯,再聊聊基准测试——
编码方面,它在 Sued Bench 认证测试中的得分从 33.4 提升到了 49%,超越了所有公共模型,包括 OpenAI o1-preview,,同时在CodeHunanEivat 也创下了新纪录。
与 o1 进行直接比较
某些基准下 o1-preview的表现确实优于 Sonic 3.5,然而在编码和与之相关的几个基准测试中,Sonic 3.5 显然超过了 o1-preview
它比o1更便宜,而且。没有 30条消息限制,它是自动编码和多步骤 AI 任务的首选。。
Aider中使用 Sonnet
安装aider
aider --sonnet 启动
aider --sonnet --cache-prompts 以提示缓存启动(减少90%token消耗)
不多言,过往文章一堆 Aider,
这样搜
Cline 中使用 Sonnet
在设置选项中,你会看到这个新模型,它默认被选中。如果你使用Open Router 或 Vertex AI等,新的模型也已可用。
🌟希望这篇文章对你有帮助,感谢阅读!如果你喜欢这系列文章请以 点赞 / 分享 / 在看 的方式告诉我,以便我用来评估创作方向。
💫video source
https://www.youtube.com/watch?v=ifQPPGMKJ9k
[1] https://www.anthropic.com/news/3-5-models-and-computer-use
知音难求,自我修炼亦艰
抓住前沿技术的机遇,与我们一起成为创新的超级个体
(把握AIGC时代的个人力量)
点这里👇关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~