详细内容或原文请订阅后点击阅览
Llama 3-V与抄袭传奇:斯坦福是否窃取了中国AI算法?
古代著作如何帮助揭露无良学生。
来源:安全实验室新闻频道古代著作如何帮助揭露无良学生。
在发布强大的新人工智能模型 Llama 3-V 后,斯坦福大学的一组研究人员发现自己陷入了丑闻的中心。该模型以其高性能吸引了全世界的关注。在 Llama 3-V 发布时,其创建者、计算机科学家 Aksh Garg 和 Siddharth Sharma 以及研究员 Mustafa Aljaderi 声称,它可以与 GPT4-V、Gemini Ultra 和 Claude Opus 等尖端产品竞争。而且,她的培训费用要低得多——不到 500 美元。
丑闻发布后不久,AI社区的代表开始怀疑这个新开发只是简单地抄袭了清华大学自然语言处理实验室和清华大学自然语言处理实验室联合创建的另一个开放项目——MiniCPM-Llama3-V 2.5。北京初创公司ModelBest。举报人在 GitHub 上发布的调查数据指出,Llama 3-V 和 MiniCPM-Llama3-V 2.5 的结构和源代码几乎相同。
Garg 和 Sharma 承认架构之间存在相似之处,并向原始模型的创建者致歉。他们说:“我们的架构非常相似,我们想真诚地向原作者道歉。”他们还表示,Llama 3-V 的原始版本已经被删除。
ModelBest联合创始人刘志远在创作Llama 3-V时表示几乎百分百确信他们的作品被抄袭。他指出,MiniCPM-Llama3-V2.5具有识别475-221年战国时期古代竹文字的独特能力。公元前。 2008 年,清华大学购买了 2,500 个这些遗物竹板,并将其中包含的字符手动数字化,以创建训练数据集。该数据并未公开,但 Llama 3-V 模型在识别文本方面做得很好,甚至在原始标记中重复了错误。