查看原文
其他

击败GPT4-Turbo,最强开源代码模型DeepSeek-Coder-V2问世|SiliconCloud上新

SiliconCloud 硅基流动
2024-09-14
6月17日,深度求索正式开源了DeepSeek-Coder-V2模型。
根据相关评测榜单,这是全球首个在代码、数学能力上超越GPT-4-Turbo、Claude3-Opus、Gemini-1.5Pro等的开源代码大模型。DeepSeek-Coder-V2包含236B与16B两种参数规模,对编程语言的支持从86种扩展到338种。
一如既往,继DeepSeek V2之后,硅基流动团队第一时间在云服务平台SiliconCloud上线了DeepSeek-Coder-V2(236B)开源模型。欢迎来玩儿:
https://cloud.siliconflow.cn/models/text/chat/17885302528
注意!!!从现在起,新用户送1亿token,注册即可畅玩:
www.siliconflow.cn/zh-cn/siliconcloud

DeepSeek-Coder-V2模型效果及表现


DeepSeek-Coder-V2在特定代码任务中实现了与GPT4-Turbo相当的性能。据官方博客介绍,DeepSeek-Coder-V2沿用DeepSeek-V2的MoE模型结构,总参数236B,激活参数21B,在代码、数学的多个榜单上位居全球第二,介于最强闭源模型 GPT-4o和GPT-4-Turbo之间。
在拥有世界前列的代码、数学能力的同时,DeepSeek-Coder-V2还具有良好的通用性能,在中英通用能力上位列国内第一梯队。
虽然DeepSeek-Coder-V2相比DeepSeek-V2在评测中综合得分更高,但在实际应用中,两个模型各有所长。DeepSeek-V2是精通文本创作、角色扮演等能力的“文科生”,DeepSeek-Coder-V2是精通代码生成、数学计算等能力的“理科生”。


关于SiliconCloud

SiliconCloud是集合主流开源大模型的一站式云服务平台,为开发者提供更快、更便宜、更全面的模型API。
目前,SiliconCloud已上架包括DeepSeek-Coder-V2、Stable Diffusion 3 MediumQwen2GLM-4-9B-Chat、DeepSeek V2、SDXL、InstantID在内的多种开源大语言模型、图片生成模型,支持用户自由切换符合不同应用场景的模型。同时,SiliconCloud提供开箱即用的大模型推理加速服务,为生成式AI应用带来更高效的用户体验。
真正在乎大模型推理性能和成本的开发者,绝不会错过SiliconCloud。更何况,现在新用户还送1亿token。

快试试吧
www.siliconflow.cn/zh-cn/siliconcloud

硅基流动致力于打造大模型时代的AI基础设施,通过算法、系统和硬件的协同创新,跨数量级降低大模型应用成本和开发门槛,加速AGI普惠人类。

扫码加入用户交流群

官方网站:www.siliconflow.cn
简历投递:talent@siliconflow.cn
商务合作:contact@siliconflow.cn
继续滑动看下一个
硅基流动
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存