「斯坦福AI团队抄袭中国开源大模型」最新进展：创始人称已经比较确信对方是套壳

OSC开源社区 2024-06-10

针对“斯坦福AI团队被曝抄袭清华系AI创业公司面壁智能发布的开源大模型”，面壁智能创始人刘知远在知乎平台回应称：

已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳，比较有意思的证据是MiniCPM-Llama3-V 2.5研发时内置了一个彩蛋，就是对清华简的识别能力。

这是我们从清华简逐字扫描并标注的数据集，并未公开，而Llama3-V展现出了一模一样的清华简识别能力，连做错的样例都一样。

事件回顾：

1、斯坦福大学的一个 AI 团队 5 月 29 日发布了名为 Llama3V 的开源多模态模型，声称只要 500 美元就能训练出一个 SOTA 多模态模型，且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。

2、网友发现 Llama3V 与面壁智能 5 月中旬发布的 8B 多模态小模型 MiniCPM-Llama3-V 2.5 在模型结构、代码、配置文件上高度相似，只是变量名有所不同。

3、面对质疑，斯坦福团队成员删除了在社交媒体上官宣模型的推文，并将项目在 GitHub 和 HuggingFace 上的库一并删除。

4、面壁智能团队通过测试发现，Llama3V 在识别清华简的文字时，结果与 MiniCPM-Llama3-V 2.5 高度相似，不仅在正确的地方一样，在错误的地方也雷同，且两个模型在清华简上的高斯噪声也高度相似。

5、斯坦福团队辩称只是使用了 MiniCPM-Llama3-V 2.5的tokenizer，并声称在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。

6、斯坦福团队的抄袭行为引发了广泛关注和讨论，被认为是对中国国产大模型成果的抄袭。

Reference

https://www.zhihu.com/question/657971226/answer/3519010839
https://github.com/OpenBMB/MiniCPM-V/issues/196

END