史丹佛AI团队抄袭北京清华系大模型! 作者道歉:撤下Llama3-V
▲史丹佛AI团队成员先前在X上,发布「Llama3-V」多模态的大模型。(图/翻摄自微博)
记者廖翊慈/综合报导
美国史丹佛大学一AI团队5月29日发布了一个名为「Llama3-V」的多模态大模型,宣称只需500美元,就可训练出一个性能可与GPT4-V媲美的模型。随后,该模型被指抄袭,与中国清华系大模型相似度极高。目前,Llama3-V已被团队撤下,其中一名成员阿克沙·加格(Aksh Garg)也公开道歉。
据《每日经济新闻》报导,史丹佛大学AI团队近期在社交平台X上,发布了一个名为Llama3-V的多模态大模型。Llama3-V不仅在社群媒体上迅速窜红,还一度冲上了HuggingFace趋势榜首页。
▲有网友指出,两边的数据一模一样。(图/翻摄自微博)
然而,一名网友发现,该团队发布的Llama3-V和中国大模型MiniCPM-Llama3-V 2.5有极高的相似度,后者是由中国大模型初创企业「面壁智能」和「清华大学自然语言处理实验室」共同推出的。
网友还在面壁智能GitHub的专案下放出了一系列证据。该网友表示,「这两个模型的结构、程式码、设定档都一模一样,只有变数名被替换了。」
随后,面壁智能首席科学家、清华大学长聘副教授刘知远在知乎上回应,「MiniCPM-Llama3-V 2.5在研发时,内置了一个彩蛋,就是对『清华简』的识别能力,而Llama3-V模型居然也有一模一样的能力。」
▲面壁智能表示,战国竹简资料也被史丹佛AI团队抄袭。(图/翻摄自微博)
报导指出,清华简是清华大学于2008年7月收藏的一批战国竹简,为战国中晚期文物。刘知远透露,识别清华简是MiniCPM-Llama3-V 2.5的实验功能,「训练影像是最近从出土文物中扫描并标注,且尚未公开发布。」
两个模型在辨识的表现上,正确的结果基本上一致,错误的情况也相当相似。遭到大量质疑后,这位史丹佛团队成员已删除他们在X上官宣模型的推文,并将该项目在Github和HuggingFace上的库一并删除。
李大海3日在声明中表达了对此事的深切遗憾,并指出,尽管从某种程度上看,这种模仿可以被视为他们的成果得到了国际团队的某种认可,但他更强调应该构建一个开放、协作且充满信任的科技社群环境。他进一步强调,他们希望团队的努力和优秀工作能吸引更多人的注意和认可,但并非以这种被模仿甚至抄袭的方式。
▲李大海声明。(图/翻摄自微博)
由于抄袭几乎是非常明确,Llama3-V团队的两位作者森德哈斯·沙玛(Siddharth Sharma)和阿克沙·加格(Aksh Garg)于4日在社交平台上,向面壁MiniCPM团队正式道歉,并表示会将Llama3-V模型悉数撤下。
阿克沙表示,「首先,我们要向MiniCPM原作者道歉。我、森德哈斯·沙玛,以及穆斯塔法(Mustafa)一起发布了Llama3-V,穆斯塔法为这个项目编写了代码,但从昨天起就无法联系他。未被告知或意识到OpenBMB(清华团队支持发起的大规模预训练语言模型库与相关工具)之前的任何工作。对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。」
Shocked! Llama3-V project from a Stanford team plagiarized a lot from MiniCPM-Llama3-V 2.5!its code is a reformatting of MiniCPM-Llama3-V 2.5, and the model's behavior is highly similar to a noised version of MiniCPM-Llama3-V 2.5 checkpoint.Evidence: https://t.co/L65B6USzJv pic.twitter.com/l7V1OKQIUs