中文大模型对战平台「SuperCLUE-琅琊榜」开启，首期入围近20个模型

CLUE中文语言理解测评基准 2023-06-05

SuperCLUE中文通用大模型评测基准自5月9日发布以来，引发了社区的热烈讨论，收到了大量反馈和宝贵建议，讨论最多的是如何在AI大模型百家争鸣的时代，构建公正、客观、有效的大模型评测基准。中文通用大模型评测基准SuperCLUE发布更新，新增Claude、清华GLM千亿模型

为此，SuperCLUE团队发起中文大模型对战平台「SuperCLUE-琅琊榜」，平台会选取目前国内外具有代表性的大语言模型进行两两对战。「SuperCLUE-琅琊榜」对战平台旨在为中文通用大模型提供一个公平、公正、开放的评测平台，目标是纳入国内外绝大部分具有代表性的可用模型，为用户提供清晰、客观、有效的模型对比结果。琅琊榜会按定期或按月更新。

现特邀您作为出题人和裁判，参与对战平台评测，与我们一起煮酒论英雄。参与地址：www.SuperCLUEAI.com

（对战平台界面）

1.出题

通过www.SuperCLUEAI.com 进入对战平台。需要您输入自己感兴趣的问题，帮助我们考验中文大模型通用与专业能力，包括但不限于：上下文理解、百科常识、逻辑推理、数学计算、代码生成、内容创作等，难点刁钻都可以。

2.评判

提交问题后，匿名模型会两两对战，分别生成相关答案，需要您对答案做出评判，从4个评判选项中选择一个，分别为模型A更好、模型B更好、平手、都很差。

3.放榜

我们将用一周时间收集到足够数量的有效反馈，届时会发布第一期琅琊榜排名，敬请期待。

谁是英雄，您来评判。期待您的参与，贡献您的智慧。

「SuperCLUE-琅琊榜」官方唯一地址：

www.SuperCLUEAI.com

（若二维码失效，可在公众号后台回复SuperCLUE加入交流群）

琅琊榜首，众雄争王。

清华复旦南北望，

星火天工混元强。

文心通义日日新，

孟子盘古舞凤凰。

名之梦，百川扬。

言深处，西湖旁。

悟道本源，三六成邦。

光年之外，序列华章。

谁是英雄，决，琅琊榜！

—— SuperCLUE 团队

常德悲剧：让谴责无差别杀戮之声更加响亮一点

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

泪目！8死17伤！江苏一职校持刀伤人案，背后隐情令人心惊！

突发！宜兴一学校发生持刀伤人案件！致8死17伤！太恶劣了！

一小学门口突发！多名学生被撞伤！

中文大模型对战平台「SuperCLUE-琅琊榜」开启，首期入围近20个模型

您可能也对以下帖子感兴趣

常德悲剧：让谴责无差别杀戮之声更加响亮一点

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

泪目！8死17伤！江苏一职校持刀伤人案，背后隐情令人心惊！

突发！宜兴一学校发生持刀伤人案件！致8死17伤！太恶劣了！

一小学门口突发！多名学生被撞伤！

生成图片，分享到微信朋友圈

中文大模型对战平台「SuperCLUE-琅琊榜」开启，首期入围近20个模型

您可能也对以下帖子感兴趣