☰

字節跳動模型訓練傳遭實習生攻擊損失或達千萬美元

字节跳动商业化团队模型训练遭传被实习生攻击，消息指，其损失或达千万美元。(路透)

大陆网上近日流传关于字节跳动发生大模型训练被实习生「投毒」事件的消息，有消息指出，事件发生在字节跳动商业化团队，因田姓实习生对团队资源分配不满，利用huggingface平台的漏洞，透过共享模型写入破坏程式码，导致团队模型训练成果受损，无法产生预期的训练成果。据悉，此次遭到入侵的代码已注入8,000多张卡，损失或达千万美元。

据第一财经报导，字节跳动知情人士透露，近期公司确实发生过破坏模型训练一事，但传闻存在夸张和虚构的部分，该事件实际发生在今年6月底，田姓实习生是在公司商业化技术团队实习，因为对团队资源分配不满，使用攻击程式码破坏团队的模型训练任务，不过，该名人士强调千万美元损失的数字也有所夸大。

该人士还称，「受程式码入侵影响的业务不是豆包大模型，而是商业化技术团队的模型训练任务」，这影响了字节跳动的广告部门部分技术工作，实习生透过共享模型进行入侵的部分也不属于集团大模型。目前实习生已被辞退，公司也将相关情况同步给产业联盟与实习生学校。

报导认为，此事件暴露出字节跳动技术训练中存在的安全管理问题，包括权限隔离、共用程式码的稽核等。一位业者说道，进行权限隔离与审计利于保护公司核心资料与智慧财产权，防止资料外泄提高资料与系统的安全性。如即时监控权限使用情况，及时发现权限滥用和异常操作；定期审计权限，检查团队成员的权限是否符合授权策略，是否有权限滥用的情况等，但这件事也有难度，包括跨部门合作成本、经常性维护与更新的资源投入等。

另，凤凰网引述一名前员工透露，字节跳动的实习生权限与正职员工差异不大，也导致这次事件发生，他忧心表示，这次事件可能造成公司警惕，「之后肯定会大大收缩实习生的权限」。

在消息曝出后，涉事实习生试图在社群上辟谣，并将责任推给他人，然而，他的说法很快便遭到接近字节跳动的人士否认。据相关知情人士称，「（田姓实习生）在长达2个月的时间里对集群代码进行恶意攻击，对公司近30位各级员工造成巨大伤害，让同事近一季的工作白费。」

同时，上述人士还分享调查人员对田姓实习生的询问录音档称，在录音中出现田姓实习生的回应承认其「透过update使得code带有了攻击性」，这些审查纪录都是不争的事实。

最新字节跳动大模型资讯公开发生在10月15日，火山引擎在视讯云端技术大会上发布大模型训练视讯预处理方案，助力解决视讯大模型训练的成本、品质和效能等方面的技术挑战。目前，该技术方案已应用于豆包视讯生成模型。

字節跳動模型訓練傳遭實習生攻擊 損失或達千萬美元

相关资讯

字節跳動模型訓練傳遭實習生攻擊損失或達千萬美元