「斯坦福AI团队抄袭中国开源大模型」最新进展:创始人称已经比较确信对方是套壳
已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳,比较有意思的证据是MiniCPM-Llama3-V 2.5研发时内置了一个彩蛋,就是对清华简的识别能力。
这是我们从清华简逐字扫描并标注的数据集,并未公开,而Llama3-V展现出了一模一样的清华简识别能力,连做错的样例都一样。
事件回顾:
1、斯坦福大学的一个 AI 团队 5 月 29 日发布了名为 Llama3V 的开源多模态模型,声称只要 500 美元就能训练出一个 SOTA 多模态模型,且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。
2、网友发现 Llama3V 与面壁智能 5 月中旬发布的 8B 多模态小模型 MiniCPM-Llama3-V 2.5 在模型结构、代码、配置文件上高度相似,只是变量名有所不同。
3、面对质疑,斯坦福团队成员删除了在社交媒体上官宣模型的推文,并将项目在 GitHub 和 HuggingFace 上的库一并删除。
4、面壁智能团队通过测试发现,Llama3V 在识别清华简的文字时,结果与 MiniCPM-Llama3-V 2.5 高度相似,不仅在正确的地方一样,在错误的地方也雷同,且两个模型在清华简上的高斯噪声也高度相似。
5、斯坦福团队辩称只是使用了 MiniCPM-Llama3-V 2.5的tokenizer,并声称在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。
6、斯坦福团队的抄袭行为引发了广泛关注和讨论,被认为是对中国国产大模型成果的抄袭。
Reference
https://github.com/OpenBMB/MiniCPM-V/issues/196
END
热门文章
- 最适合写代码的等宽字体Cascadia Code——三年来首次大版本更新:由微软开源、新增两款Nerd字体
- 微软工程师真会整活,将.NET移植到40年前的任天堂NES