其他
中国公司突破1200分超ChatGPT创历史新高,登顶AI琅琊榜!
琅琊榜首,众雄争王;
谁是英雄,决琅琊榜。
近日,中文大模型匿名对战平台SuperCLUE-LYB琅琊榜发布更新,共获得有效投票9.9K。
以下是截至2023年7月7日18点12分的SuperCLUE琅琊榜大模型排名。
SuperCLUE-琅琊榜官方唯一地址:www.SuperCLUEAI.com
温馨提醒,此榜单仅用于学术研究,不作为投资建议。
增加清华大学和智谱AI开发的2代GLM模型ChatGLM2-6B
增加了RWKV的世界多语言模型RWKV-4-World-7B
首次加入百川智能开源的预训练模型baichuan-7B
更新IDEA研究院开发的idea-jiangziya模型为v1.1版本
去掉了Anthropic公司开发的Claude模型,原因是Claude官方接口技术问题,后续待官方稳定后可重新上榜
对战胜率
模型A在所有非平局对战中获胜的比例
每个模型组合的对战次数(不含平局)
对所有其他模型的平均胜率(假设均匀抽样且无平局)
Elo机制的Bootstrap抽样(1000轮随机抽样)
SuperCLUE是中文通用大模型综合性评测基准,由三大基准组成,分别是:
详情点击文章:最新大模型排名!中文大模型评测基准SuperCLUE发布6月榜单
详情点击文章:首测生成、多轮对话能力!SuperCLUE-Open中文大模型开放域测评基准发布
详情点击文章:大模型对战平台「SuperCLUE琅琊榜」排名首发,国内大模型首超GPT3.5
点击阅读原文,查看SuperCLUE琅琊榜详情