浪潮发布全球最大规模人工智能巨量模型“源”

浪潮服务器

2024-11-10

9月28日，浪潮信息在京发布全球最大规模人工智能巨量模型 “源1.0”。

“源”的单体模型参数量达2457亿，超越美国OpenAI组织研发的GPT-3，成为全球最大规模的AI巨量模型。

“源1.0研讨会”同期举行，来自国内相关领域的院士、专家出席了研讨会，对AI巨量模型的创新与应用进行了深入研讨交流。

源1.0模型参数规模为2457亿，训练采用的中文数据集达5000GB，相比GPT-3模型1750亿参数量和570GB训练数据集，源1.0参数规模领先40%，训练数据集规模领先近10倍。

“源1.0”在语言智能方面表现优异，获得中文语言理解评测基准CLUE榜单的零样本学习和小样本学习两类总榜冠军。在零样本学习榜单中，“源1.0”超越业界最佳成绩18.3%，在文献分类、新闻分类，商品分类、原生中文推理、成语阅读理解填空、名词代词关系6项任务中获得冠军；在小样本学习的文献分类、商品分类、文献摘要识别、名词代词关系等4项任务获得冠军。在成语阅读理解填空项目中，源1.0的表现已超越人类得分。

ZeroCLUE零样本学习榜

（第一行为人类得分）

FewCLUE小样本学习榜

（第一行为人类得分）

在对“源1.0”进行的“图灵测试”中，将源1.0模型生成的对话、小说续写、新闻、诗歌、对联与由人类创作的同类作品进行混合并由人群进行分辨，测试结果表明，人群能够准确分辨人与“源1.0”作品差别的成功率已低于50%。

巨量模型的发展备受关注。斯坦福大学李飞飞教授等人工智能领域知名学者近期在论文中表示，这类巨量模型的意义在于突现和均质。突现意味着通过巨大模型的隐含的知识和推纳可带来让人振奋的科学创新灵感出现；均质表示巨量模型可以为诸多应用任务泛化提供统一强大的算法支撑。

源1.0中文巨量模型的发布，使得中国学术界和产业界可以使用一种通用巨量语言模型的方式，大幅降低针对不同应用场景的语言模型适配难度；同时提升在小样本学习和零样本学习场景的模型泛化应用能力。

浪潮信息表示，“源1.0”将面向学术研究单位和产业实践用户进行开源、开放、共享，降低巨量模型研究和应用的门槛，有效推进AI产业化和产业AI化的进步，切实为国家在人工智能研究创新和产业发展作出贡献。

修改于

继续滑动看下一个

浪潮服务器

向上滑动看下一个

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

著名口述史学者Portelli的一部被忽视的口述史作品 | 一个工业小镇的传记：意大利特尔尼（1831-2014）

浪潮发布全球最大规模人工智能巨量模型“源”

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

著名口述史学者Portelli的一部被忽视的口述史作品 | 一个工业小镇的传记：意大利特尔尼（1831-2014）

生成图片，分享到微信朋友圈

浪潮发布全球最大规模人工智能巨量模型“源”

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡