国产大模型新高度！讯飞星火4.0发布：整体超越GPT-4 Turbo，8个国际权威测试集测评第一

Original Milan写技术 AI说热点

2024-09-05

文章摘要

科大讯飞近日发布了其最新的讯飞星火大模型V4.0，标志着国内大模型技术能力达到新高度。新版本在七大核心能力上进行了全面升级，包括文本生成、语言理解、知识问答、逻辑推理和数学等，在8个国际主流测试集中排名第一，整体性能超越了GPT-4 Turbo，领先于国内其他大模型。星火V4.0基于全国首个国产万卡算力集群“飞星一号”训练而成，实现了完全自主可控。

星火V4.0在多个方面进行了性能优化和功能创新，特别是在复杂指令跟随、长文本处理能力上进行了加强，并业界首发了长文本内容溯源功能，减少了长文档知识问答任务中的幻觉，提高了答案的准确率。在多模态方面，星火图文识别能力持续升级，在科研、金融、医疗、司法和办公等专业领域的图文识别能力获得极大提升，超越了OpenAI的GPT-4o模型。此外，星火大模型V4.0在教育复杂场景的图文识别任务中也表现突出，显著超越了GPT-4o。

在语音能力方面，科大讯飞的星火语音大模型进行了重磅升级，除了37个主流语种，还增加了对37种方言的识别，实现了37个语种加37个方言共74种语言的免切换自由交流。科大讯飞还展示了其超复杂场景下的语音转写能力，能够在噪音场景下实现多人重叠语音的角色分离和实时转写。

在医疗领域，讯飞推出了面向C端的医疗大模型应用“讯飞晓医”，提供体检报告分析等功能，以及面向B端的“智医助理”，提供预问诊等能力。星火V4.0在医疗核心能力上全面超过GPT-4 Turbo和GPT-4o，面向医生端的“智医助理”已实现辅助诊断8.2亿次，修正诊断147万次，帮助发现7267万不合理处方数。面向个人端的App“讯飞晓医”为普通用户提供病历、体检报告、检查报告的解读，集合各类健康信息，为用户提供个人数字健康空间。

总体来看，讯飞星火大模型V4.0的发布展示了国产大语言模型全面超越国外竞品的实力，并为基于大模型的应用落地打下了坚实的能力基础。

原文信息

链接 | 阅读原文 [ 4627字 | 19分钟 ]
作者 | 机器之心

推荐阅读

💡添加关注，获取更多AIGC资讯～💡

继续滑动看下一个

AI说热点

向上滑动看下一个

“占坑式辩护”，侵犯了谁？

bxrf的瓜

嗷嗷哭！三斤午夜痛哭，压力太大了！阿哲遭恶意举报，爆瓜内幕！

娱乐圈明星唱阿哲“事非人愿”，自爆和阿哲交情！@姗姗，阿哲首发新歌送前妻！二辰午夜陪播！

童锦程爆阿哲抖音年度！哦嫂猫猫抖音复出开播！北王示爱囧囧丸！

国产大模型新高度！讯飞星火4.0发布：整体超越GPT-4 Turbo，8个国际权威测试集测评第一

您可能也对以下帖子感兴趣

“占坑式辩护”，侵犯了谁？

bxrf的瓜

嗷嗷哭！三斤午夜痛哭，压力太大了！阿哲遭恶意举报，爆瓜内幕！

娱乐圈明星唱阿哲“事非人愿”，自爆和阿哲交情！@姗姗，阿哲首发新歌送前妻！二辰午夜陪播！

童锦程爆阿哲抖音年度！哦嫂猫猫抖音复出开播！北王示爱囧囧丸！

生成图片，分享到微信朋友圈

国产大模型新高度！讯飞星火4.0发布：整体超越GPT-4 Turbo，8个国际权威测试集测评第一

您可能也对以下帖子感兴趣