☰

史丹佛AI团队抄袭北京清华系大模型！　作者道歉：撤下Llama3-V

▲史丹佛AI团队成员先前在X上，发布「Llama3-V」多模态的大模型。（图／翻摄自微博）

记者廖翊慈／综合报导

美国史丹佛大学一AI团队5月29日发布了一个名为「Llama3-V」的多模态大模型，宣称只需500美元，就可训练出一个性能可与GPT4-V媲美的模型。随后，该模型被指抄袭，与中国清华系大模型相似度极高。目前，Llama3-V已被团队撤下，其中一名成员阿克沙·加格（Aksh Garg）也公开道歉。

据《每日经济新闻》报导，史丹佛大学AI团队近期在社交平台X上，发布了一个名为Llama3-V的多模态大模型。Llama3-V不仅在社群媒体上迅速窜红，还一度冲上了HuggingFace趋势榜首页。

▲有网友指出，两边的数据一模一样。（图／翻摄自微博）

然而，一名网友发现，该团队发布的Llama3-V和中国大模型MiniCPM-Llama3-V 2.5有极高的相似度，后者是由中国大模型初创企业「面壁智能」和「清华大学自然语言处理实验室」共同推出的。

网友还在面壁智能GitHub的专案下放出了一系列证据。该网友表示，「这两个模型的结构、程式码、设定档都一模一样，只有变数名被替换了。」

随后，面壁智能首席科学家、清华大学长聘副教授刘知远在知乎上回应，「MiniCPM-Llama3-V 2.5在研发时，内置了一个彩蛋，就是对『清华简』的识别能力，而Llama3-V模型居然也有一模一样的能力。」

▲面壁智能表示，战国竹简资料也被史丹佛AI团队抄袭。（图／翻摄自微博）

报导指出，清华简是清华大学于2008年7月收藏的一批战国竹简，为战国中晚期文物。刘知远透露，识别清华简是MiniCPM-Llama3-V 2.5的实验功能，「训练影像是最近从出土文物中扫描并标注，且尚未公开发布。」

两个模型在辨识的表现上，正确的结果基本上一致，错误的情况也相当相似。遭到大量质疑后，这位史丹佛团队成员已删除他们在X上官宣模型的推文，并将该项目在Github和HuggingFace上的库一并删除。

李大海3日在声明中表达了对此事的深切遗憾，并指出，尽管从某种程度上看，这种模仿可以被视为他们的成果得到了国际团队的某种认可，但他更强调应该构建一个开放、协作且充满信任的科技社群环境。他进一步强调，他们希望团队的努力和优秀工作能吸引更多人的注意和认可，但并非以这种被模仿甚至抄袭的方式。

▲李大海声明。（图／翻摄自微博）

由于抄袭几乎是非常明确，Llama3-V团队的两位作者森德哈斯·沙玛（Siddharth Sharma）和阿克沙·加格（Aksh Garg）于4日在社交平台上，向面壁MiniCPM团队正式道歉，并表示会将Llama3-V模型悉数撤下。

阿克沙表示，「首先，我们要向MiniCPM原作者道歉。我、森德哈斯·沙玛，以及穆斯塔法（Mustafa）一起发布了Llama3-V，穆斯塔法为这个项目编写了代码，但从昨天起就无法联系他。未被告知或意识到OpenBMB（清华团队支持发起的大规模预训练语言模型库与相关工具）之前的任何工作。对所发生的事情承担全部责任，并已撤下Llama3-V，再次致歉。」

Shocked! Llama3-V project from a Stanford team plagiarized a lot from MiniCPM-Llama3-V 2.5!its code is a reformatting of MiniCPM-Llama3-V 2.5, and the model's behavior is highly similar to a noised version of MiniCPM-Llama3-V 2.5 checkpoint.Evidence: https://t.co/L65B6USzJv pic.twitter.com/l7V1OKQIUs

史丹佛AI团队抄袭北京清华系大模型！ 作者道歉：撤下Llama3-V

相关资讯

史丹佛AI团队抄袭北京清华系大模型！　作者道歉：撤下Llama3-V