GPT-4o背后的神仙团队:项目负责人只有本科学历,北大/清华/交大/中科大校友在列
文|李然
编辑|苏建勋
封面来源|公开资料
在OpenAI一场20多分钟的发布会向世人抛出GPT-4o之后,有不少大佬对于它体现出进步似乎并不买账。
来源:X
OpenAI联合创始人,现在已经离开OpenAI的传奇大神AK对GPT-4o的评价:
“他们发布了一个文本-音频-视觉组合模型,该模型可在一个神经网络中处理所有三种模态,如果用户要求,它还可以在特殊情况下进行实时语音翻译。”
马老板随即附和到,这种对GPT-4o祛魅的描述才更加准确(酸了酸了)。
然而,当Sam Altman转发了开发GPT-4o团队背后的故事,外界才看到,要把大模型做出原生多模态的能力,需要一个什么样的神仙团队。
来源:X
18人核心团队,开创人机交互新历史
马斯克曾经在采访中说到,OpenAI推出ChatGPT最核心的意义其实只是在于,创造了一个人机交互的界面——ChatGPT,让普通人能够用文字与AI交流。然后普通人突然之间意识到,现在的AI到底能做多么不可思议的事情了。因为其实在ChatGPT出现之前,大语言模型的技术已经在实验室中存在了很长时间,并且发展出很强的能力,只是普通人没有机会体验到它到底多么强大。
顺便,也让OpenAI成为了一家估值达到1000亿美元的初创公司。
而照着这个思路走下去,GPT-4o如果能让人类可以通过除了文字以外的媒介和渠道,充分地与AI交流,最终会迸发出多大的影响,也许现在还没人能够充分地意识得到。
而承载着这个重任的OpenAI Omni Team,居然只有18个人,其中4名华人,团队包括项目负责人在内,几乎都是90后。
团队领导 Prafulla Dhariwal
来源:X
领导Omni Team的这位印度大佬根据教育背景推测是个90后,团队成员大部分都是博士毕业生,可他的教育经历仅仅是本科毕业。
来源:linkedin
他在本科毕业之后就以研究实习生的身份直接加入了OpenAI。一直在OpenAI工作到现在。
来源:Linkedin
在他的整个研究生涯中,参与过强化学习,无监督学习,Scaling Law等几乎所有的机器学习的前沿研究,也参与了包括DALL·E 2,GPT-3,DALL·E 3等关键的项目。
来源:Linkedin
他在上大学前,曾经代表印度拿到过IMO(国际奥数)的金牌,也担任过奥数代表队的教练。妥妥的少年天才级别的人物。
从他的经历看来,虽然一般来说,AI研究科学家的门槛是一个博士学位,而领导AI研究科学家的门槛,可能需要是“只有本科学位的AI研究科学家”。
关键研究人员
负责图像,音频,数据和后期训练等各个方面的团队核心:James Betker
来源:Linkedin
他在团队名单被列在第一位,团队负责人对他的评价是:任何任务只要交给他他都能给你搞定!
来源:Linkedin
他在加入OpenAI之前曾经在Garmin和谷歌工作过。
来源:Linkedin
特别是,在他的领英上,有以前一个客户给他写过的一封推荐信:
来源:Linkedin
看来,要在OpenAI工作,要么你是天才本才,要么你是那种让天才都折服的人物。
视频负责人:Rowan Zellers
来源:Linkedin
这位90后博士,对于GPT-4o的贡献是,让模型可以像人类一样看到视频。
来源:Linkedin
他在博士毕业之后就直接来到OpenAI。
来源:Linkedin
在演示视频中演示模型视觉识别功能片段直接出镜的也是他本人。
来源:X
他参与了GPT-4等数个OpenAI的项目,之前的研究方向也集中在多模态上。
来源:Linkedin
音频方向的负责人:Alexis Conneau
项目主管对他的评价是:他是OpenAI第一个提出把《Her》里边的Samantha在现实中复刻,并且无情地执行了自己愿景的人。
来源:X
这一点也许从他的X封面就能感受到。
他来自法国,毕业于法国最顶尖的工程师大学,之后加入了Meta,在FAIR获得了自己的博士学位。
来源:Linkedin
然后在谷歌和Meta AI工作了一段时间之后,加入了OpenAI。
来源:Linkedin
在谷歌和Meta,他参与影响过10亿用户的项目和产品。论文也在EMNLP上拿过最佳论文奖。
来源:Linkedin
5位华人做出关键贡献
就像之前爆火的Sora一样,OpenAI这些瞩目的项目中从来不缺乏华人的身影:
Li JING
来源:Linkedin
这位毕业于北大物理系的华人小哥曾经参与了DALLE-,Sora。
这次GPT-4o的发布也有他的贡献。
他本科毕业于北京大学物理系,博士毕业于麻省理工学院。
来源:Linkedin
他自己曾经创过业,也在Meta全职工作过2年半,在2022年加入了OpenAI。
来源:Linkedin
Jiahui Yu
来源:Linkedin
他本科毕业于中科大,博士毕业于UIUC。他现在是OpenAI感知团队的负责人。
来源:Linkedin
他曾经是谷歌Gemini多模态的负责人之一,2023年被OpenAI挖了过来。
来源:Linkedin
Yu Zhang
来源:Linkedin
他本科毕业于上海交大,博士毕业于MIT。
来源:Linkedin
他在微软亚研院实习过,之后加入了谷歌DeepMind,从2023年起加入了OpenAI。
来源:Linkedin
HUIWEN Chang
来源:Linkedin
她本科毕业于清华大学,之后在普林斯顿大学获得了博士学位。
来源:Linkedin
在加入OpenAI之前,一直在谷歌担任研究科学家。
来源:Linkedin
Qiming Yuan
来源:Linkedin
他在GPT-4o团队中负责语言的预训练数据处理,本科毕业于清华大学,硕士毕业于德州奥斯丁。
来源:Linkedin
在2018年加入OpenAI之前,他曾经在Dropbox和微软工作过。
来源:Linkedin