斯坦福抄袭清华，世界一流大学实锤了|投资界

最近 AI 圈里又闹出一个大新闻，《 斯坦福团队抄袭中国 AI！》

估计刚看到这个标题，很多人跟世超一样都蒙了。啊？是不是看花眼了？

哪个斯坦福？确定没搞反？

您猜怎么着，这还真就是 QS 排名前五的那个美国斯坦福。

别说国内网友，业内大佬也绷不住，直呼时代变了。

确切的说，应该是斯坦福的一个本科生团队，抄了清华博士创业公司的产品，也就是面壁智能的开源模型：MiniCPM-Llama3-V 2.5 小钢炮。

事儿要从 5 月 29 号说起。

这天有两个斯坦福的印度年轻人，一个还跟佛祖（ Siddharth 悉达多）同名，在世界上* ai 开源社区—— HuggingFace上发布了他们的大模型 Llama-3-V 。

看着他们光鲜亮丽的实习简历，又是特斯拉又是 SpaceX 的，很快，网友们就把这个号称 “500 刀就能练成比肩 GPT-4V 、 Gemini Ultra” 的后起之秀，顶上了 HuggingFace 首页，推文浏览量也超过 30 万。

刚开始可能还有人觉着：我大美利坚江山代有才人出啊，你看看，本科生就能做出比肩大厂的成绩，什么叫世界一流啊～

很快，一些眼尖的业内人士发现不对劲了，你这玩意怎么看着跟21 号那个 MiniCPM 小钢炮差不多，不会是抄的吧，咋不标注来源？

之所以人家一眼丁真鉴定为抄，主要是它宣称的体积小、性能强、多模态的特点，很难不让人把它和清华的 MiniCPM 对比。

但他又申明自己是原创的，没引用人家 MiniCPM 。

不过面对别人的指责，这大学生团队还嘴硬，说 MiniCPM 是引用了 LLaVA-UHD 的，我们也引的这个，读书人的事，那能叫抄吗？真是装糊涂的天才。

问题是 MiniCPM 和 LLaVA-UHD 原来的样子早就不一样了，而你这个 Llama3-V 的长相跟 LLaVA-UHD 不能说一模一样，至少是毫不相关，但是跟人家小钢炮就像一个妈生的。

等放一块儿仔细一瞅，好家伙，模型结构跟人家像也就算了，配置文件怎么都一模一样。

再一看代码，除了加点格式化，改了几个变量名，别的都毫无区别，甚至人家清华专门定义的特殊符号，你这代码里都没变过。

更搞笑的是，有网友发现运行 Llama3-V 时，用斯坦福团队提供的权重文件（神经网络微调用的参数）是跑不起来的，但如果把其中的变量名改为 MiniCPM-Llama3-V 2.5 的，就会丝滑启动。

都锤成这样了，印度老哥还是始终咬死不认。

很快，收到消息的面壁智能官方也下场开锤，表示 Llama3-V 项目的作者并不完全理解 MiniCPM-Llama3-V 2.5 的架构，甚至也不理解他们自己的代码。

换句话说，还挺阴阳的， “ 你抄都没抄明白啊。 ”

除此之外，面壁团队还甩出一个雷神之锤的证据， Llama3-V 居然可以识别清华简！

清华简是清华校友捐赠的重要文物，这些埋藏于战国时代的竹简躲过了秦始皇焚书，保存着包括古本《尚书》、先秦史料、医方哲学等极其珍贵的原始档案，简单来说就是上古版《永乐大典》。

清华简识别其实是 MiniCPM-Llama3-V 2.5 研发时内置的彩蛋，所有训练识别的数据，都是面壁智能和清华大学合作，一个字一个字扫描标注的，从未公开。这些完全私有的数据斯坦福团队不可能拿到，但是两个模型却都能实现识别，甚至犯错的地方都一模一样。

到这，可以说他们抄袭是百分百，板上钉钉的事了。鼓破万人捶，面对全世界网友的唾沫星子，这俩印度哥们怎么做的呢？

答，删库跑路！

他们马上删掉了 HuggingFace 上的 Llama3-V 模型，并表示： “ 非常感谢那些在评论中指出与之前研究相似之处的人。我们意识到我们的架构非常类似于OpenBMB 的 MiniCPM-Llama3-V 2.5 ，他们在实现上比我们抢先一步。我们已经删除了关于作者的原始模型。 ”

不是，过分了啊，还要点脸不？

然后他们又光速滑跪道歉甩锅三连，说我们哥俩只是宣传推广的，代码都是外包给另一个南加州大学老哥干的，冤枉啊！