雷军千万年薪挖角AI天才少女罗福莉 曾为DeepSeek关键开发者
▲陆AI天才少女罗福莉。(图/翻摄极目新闻,下同)
记者魏有德/综合报导
小米创办人雷军持续投入AI领域研发,近日不仅传出要建立GPU万卡集群,也耗资千万(人民币,下同)挖角来自北大的AI天才少女罗福莉,将其延揽进入小米AI大模型团队。据悉,罗福莉正是大陆国产大模型DeepSeek「DeepSeek-V2」的关键开发者之一。
《极目新闻》报导,雷军在公开演讲时曾表示,小米做大模型的思路和很多公司不太一样,选择主力突破的是轻量化和本地部署。对于小米这样无论在手机还是造车上都讲究「性价比」的公司而言,如何在烧钱的大模型业务中平衡成本,无疑是雷军考虑的核心问题。而这,或许也是拥有DeepSeek-V2研发背景的罗福莉被雷军看中的原因。
公开资讯显示,罗福莉为四川人,95后,本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。她在2019年还在就读北大读硕士期间便于人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),一战成名,被封为AI天才少女。
当时,罗福莉回应称,「投稿ACL是我近一年的产出,所以我认为自己是付出了足够的努力的,当然也可能也有运气成分加持。」
罗福莉研究所毕业后,先进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发多语言预训练模型VECO。
直至2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后跳槽至DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。
罗福莉在2024年5月DeepSeek-V2发表后撰文称,「单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队...外加1元/百万输入Tokens的价格,只有GPT4价格的1/100,性价比之王。」