其他
中文大模型对战平台「SuperCLUE-琅琊榜」开启,首期入围近20个模型
SuperCLUE中文通用大模型评测基准自5月9日发布以来,引发了社区的热烈讨论,收到了大量反馈和宝贵建议,讨论最多的是如何在AI大模型百家争鸣的时代,构建公正、客观、有效的大模型评测基准。中文通用大模型评测基准SuperCLUE发布更新,新增Claude、清华GLM千亿模型
为此,SuperCLUE团队发起中文大模型对战平台「SuperCLUE-琅琊榜」,平台会选取目前国内外具有代表性的大语言模型进行两两对战。「SuperCLUE-琅琊榜」对战平台旨在为中文通用大模型提供一个公平、公正、开放的评测平台,目标是纳入国内外绝大部分具有代表性的可用模型,为用户提供清晰、客观、有效的模型对比结果。琅琊榜会按定期或按月更新。
现特邀您作为出题人和裁判,参与对战平台评测,与我们一起煮酒论英雄。参与地址:www.SuperCLUEAI.com(对战平台界面)
1.出题
通过www.SuperCLUEAI.com 进入对战平台。需要您输入自己感兴趣的问题,帮助我们考验中文大模型通用与专业能力,包括但不限于:上下文理解、百科常识、逻辑推理、数学计算、代码生成、内容创作等,难点刁钻都可以。
2.评判
提交问题后,匿名模型会两两对战,分别生成相关答案,需要您对答案做出评判,从4个评判选项中选择一个,分别为模型A更好、模型B更好、平手、都很差。
3.放榜
我们将用一周时间收集到足够数量的有效反馈,届时会发布第一期琅琊榜排名,敬请期待。
(若二维码失效,可在公众号后台回复SuperCLUE加入交流群)
琅琊榜首,众雄争王。
清华复旦南北望,
星火天工混元强。
文心通义日日新,
孟子盘古舞凤凰。
名之梦,百川扬。
言深处,西湖旁。
悟道本源,三六成邦。
光年之外,序列华章。
谁是英雄,决,琅琊榜!
—— SuperCLUE 团队