OpenAI:已掌握DeepSeek盜用其訓練模型證據

美国科技公司OpenAI指控中国新创DeepSeek盗用其模型进行开发。(路透)

中国新创公司DeepSeek(深度求索)引发的疑虑日增。OpenAI于29日表示已掌握证据,显示DeepSeek盗用其模型进行开发;业界也指DeepSeek握有大量辉达H100高阶晶片,形同直接挑战美国出口管制规定。

中国的DeepSeek因标榜低成本也能训练出强大人工智慧(AI)模型,颠覆AI训练不能没有精密昂贵晶片的刻板印象,引发市场强烈震荡。

不过,总部设在旧金山的OpenAI公司向英国「金融时报」(Financial Times)证实,已掌握疑似DeepSeek利用「蒸馏」(distillation) 技术的证据。OpenAI是聊天机器人ChatGPT的开发商。

蒸馏技术可让开发者利用更大、更强的模型输出成果,在较小模型获得更出色的表现,并让他们在特定任务上以更低廉的成本得到类似结果。

尽管蒸馏是AI业界常见做法,但DeepSeek若利用蒸馏技术来打造自家模型,并与OpenAI竞争,将违反OpenAI服务条款,因此产生疑虑。

OpenAI婉拒进一步说明或提供证据细节。根据该公司的服务条款,用户不得「复制」任何OpenAI的服务,或是「利用输出结果,来开发与OpenAI竞争的模型」。

彭博(Bloomberg News)28日引述知情人士说法报导,微软(Microsoft)和OpenAI正在调查一群与DeepSeek有关联的人是否以未经授权的方式,不当取得OpenAI技术输出的资讯。

报导指,微软维安研究员2024年秋天观察到有人利用OpenAI应用程式介面(API)输出大笔数据,他们认为这些人可能与DeepSeek有关。

川普政府的AI专家塞克斯(David Sacks)也在福斯新闻(Fox News)访谈中提及蒸馏技术,并称有「大量证据」显示DeepSeek是仰赖OpenAI模型输出,以协助开发自家技术,但他也没有进一步提出证据。

另一方面,美国Scale AI执行长汪滔(Alexandr Wang)日前表示,DeepSeek应握有多达5万颗Nvidia(辉达,另译英伟达)H100晶片,以开发现有模型。亿万富豪马斯克(Elon Musk)也在社群平台X回应相关推文,并加上「显而易见」的评论,似乎同意这项说法。

由于H100晶片被禁止向中国出口,这形同直接挑战美国出口管制政策。有分析直指,DeepSeek绕道囤积大量晶片以规避美国管制,因此其真实开发成本恐怕远高于宣称的558万美元,未来也势必将引发美方加强管制。