走出元宇宙阴影、拥抱开源AI模型,Meta实现“扎克伯格式复兴”

来源:腾讯科技

2023年夏季,Meta创始人兼首席执行官马克·扎克伯格(Mark Zuckerberg)面临着一个关键抉择:是否将生成式AI模型“Llama 2”开源,让它与OpenAI的GPT-4一较高下。

在那几个月前,初代Llama面世,它最初只是为研究人员准备的,但在被泄露到网上后,立刻受到了开发者的欢迎,因其免费且开源,与OpenAI、谷歌等公司的收费模型不同。开源意味着,研究人员、开发者和其他用户可以访问底层代码及其“权重”(决定模型如何处理信息),从而使用、微调或改进它。

Meta首席AI科学家杨立昆(Yann LeCun)和AI研究副总裁兼Meta FAIR团队负责人乔勒·皮诺(Joelle Pineau)等高管,都希望Llama 2能更广泛地开源。他们认为,这将使Llama 2以更低的成本、更快的速度变得更强大,帮助Meta在AI竞赛中追赶其他对手。在这场竞赛中,Meta明显落后,尽管它正试图从元宇宙转型的困境中恢复过来。

然而,开源也存在许多挑战。一旦用户习惯了免费产品,公司该如何实现盈利?此外,正如高管们在辩论中指出的,法律风险也不容忽视:如果有人恶意利用这个模型进行黑客攻击,后果不堪设想。更令Meta担忧的是,之前两个开源AI产品都引发了广泛批评,从科学家到参议员,无一不对Meta提出严厉指责。

此时,扎克伯格成为了打破僵局的关键人物。他一直倡导开源技术(Facebook本身便是基于开源软件构建的),但在做出决定前,他广泛听取了各方意见。Meta生成式AI主管艾哈迈德·达勒(Ahmad Al-Dahle)回忆道,扎克伯格与所有持支持、反对者以及持中立立场的人都进行了深入交流。最终,扎克伯格亲自拍板,决定开源Llama 2,供研究和商业使用。

扎克伯格在个人Facebook页面上发文,进一步阐释了他的决定。他坚信开源能够吸引更多开发者使用特定技术,从而推动创新。他写道:“我相信,如果生态系统更加开放,将会带来更多的进步。”

这一事件或许只是AI快速发展历程中的一个小插曲,但对Meta和扎克伯格而言,Llama 2的发布却是一个至关重要的转折点,它标志着Meta将被重塑。到2024年4月Llama 3横空出世,无论在速度还是准确性方面,已基本追上甚至超越了那些闭源的竞争对手。在几个基准测试中,Llama 3模型甚至与OpenAI和Anthropic最好的模型相当,甚至表现得更好。Llama的一大优势在于,Meta利用了数十亿Facebook和Instagram用户公开分享的数据来训练其AI模型。

在开源AI模型(通常更透明、更灵活、更具成本效益,但可能更容易被滥用)与闭源模型(控制更严格,但缺乏透明度,开发成本更高)之间的哲学争议中,Llama的故事或许将成为关键篇章。更重要的是,Llama成为了Meta全力投入生成式AI战略的核心支点。

如今,扎克伯格在硅谷开发者眼中已成为了“科技民主化”的捍卫者,而两年前,他和Meta还因全力投入元宇宙而备受质疑和嘲笑,更因助长政治两极分化、极端主义以及损害青少年心理健康而饱受诋毁。

早在Llama发布之前,Meta首席AI科学家杨立昆就围绕开源展开了研究

Llama模型崛起,

有望树立新的行业标准

尽管ChatGPT在大众心中仍是主流AI工具的代表,但实际上,Llama模型已悄然融入Meta的众多产品中,每天服务着数十亿消费者。从Facebook、Instagram、WhatsApp到Messenger的AI助手,再到用户可自定义的AI聊天机器人,以及广告客户的文本生成工具,Llama变得无处不在。它甚至为Meta与雷朋合作开发的智能眼镜以及Quest头显中的智能助手提供技术支持,让用户能与周围环境进行互动。传闻中,Meta还在研发自己的AI搜索引擎。在开源AI社区Hugging Face等网站上,Llama模型的下载量已突破6亿次大关。

Llama也是Meta聊天机器人Meta AI的“大脑”,该机器人可在Meta四大社交媒体上使用——Facebook、Instagram、WhatsApp和Messenger。Meta报告称,在第三季度末,Meta AI已经拥有超过5亿的月活跃用户。扎克伯格预计,到今年年底,Meta AI将成为使用最多的人工智能聊天机器人,超过OpenAI的ChatGPT、Alphabet的Gemini和其他竞争对手。Meta AI已经悄然确立了自己在生成式AI领域的领导地位。

然而,Meta的这一转型却让不少观察者感到费解。该公司不惜斥资数十亿美元打造Llama,并预计2024年资本支出将高达400亿美元,未来还可能继续大幅增长。同时,Meta还将Llama免费提供给包括高盛、AT&T和埃森哲在内的数千家企业。这让一些投资者不禁疑惑,Meta何时才能实现盈利,以证明这笔巨额支出是值得的。

加州大学伯克利分校哈斯商学院的副教授阿布舍克·那格拉杰(Abhishek Nagaraj)也表示,从经济角度来看,开源Llama对Meta的益处仍是个“大谜团”。

但不可否认的是,Llama的成功让扎克伯格摆脱了外界对其超现实雄心的质疑,也帮助其公司度过了2022年底和2023年初的“效率年”困境。更重要的是,Llama的崛起为扎克伯格提供了一个解决长期痛点的机会:即Meta的服务和产品常受苹果和谷歌规则的限制,这两个竞争对手的应用商店是Meta在移动设备时代的主要分发渠道。扎克伯格曾在博客文章中写道:“我们必须确保自己始终能获得最好的技术,并避免被竞争对手的封闭生态系统所束缚。”

如今借助Llama,Meta和扎克伯格有机会树立新的行业标准。他在财报电话会议上表示:“Llama 3.1将是行业的转折点,开源AI将像Linux一样成为行业标准。”他提到了打破微软Windows等专有操作系统主导地位的开源项目,暗示Llama有望引领这一变革。

或许正是这种潜在的可能性帮助扎克伯格重新恢复了信心。在他与人共同创立Facebook已逾20年后,40岁的他仿佛正经历着一场所谓的“扎克复兴”——个人形象与职业生涯均焕发出新的光彩。他已从往日的短发转变为浓密的卷发,单调的卫衣也被金链子和宽大的黑色T恤所取代,曾经棱角分明的面容如今常挂着轻松的微笑。甚至,在11月份,他还抽空与T-Pain合作翻拍了热门歌曲《Get Low》,以此作为送给妻子普莉希拉·陈Priscilla Chan)的周年纪念惊喜。

扎克伯格与好友T-Pain合作,为纪念与妻子的“约会纪念日”表演《Get Low》

在AI领域深耕十年,

催生出类似互联网的新行业

Meta在AI领域的探索可追溯到2013年,那时扎克伯格慧眼识珠,邀请了长期在纽约大学任教的AI专家杨立昆来掌舵Facebook新成立的FAIR实验室。杨立昆回忆道,当他初谈此职位时,首要关切的便是Facebook是否会将其研究成果开源。他向扎克伯格坦言:“好点子不应被垄断,我们应尽可能广泛地合作。”而扎克伯格给出的答复令他倍感振奋:“哦,你大可放心。我们的平台软件及一切均已开源。”

然而,在生成式AI风起云涌之前,Meta对AI的应用大多局限于幕后,或是深耕于研究领域,或是作为推荐算法和内容审核的底层支撑。至于面向消费者的AI产品,如聊天机器人等,扎克伯格那时并无宏伟蓝图,尤其是当他的心思全然倾注于元宇宙之上时。

随着OpenAI推出ChatGPT,生成式AI领域迎来了爆发式增长,而Meta的转向在当时看来尤为不明智。Meta的支出飙升,消费者却反响平平,其股价更是一路跌至7年来的最低点,引发了诸如“扎克伯格是否陷入大麻烦”等种种质疑。在此背景下,Meta也不得不裁撤了数千名员工。

Meta首次尝试推出的AI项目并未取得显著进展。2022年11月,FAIR发布了名为Galactica的聊天机器人,它基于大语言模型构建,并接受了科学文本的训练。与以往的FAIR模型一样,Galactica也是以开源形式发布的,旨在让研究人员深入了解其运作机制。

然而,当时公众尚未充分认识到大语言模型可能产生的幻觉现象,即它们有时会给出令人信服但错误的答案。Galactica的一些输出内容令科学家震惊,因为它提供了不科学的信息,如引用不存在的研究论文,讨论如何在浴缸中制造“凝固汽油弹”、“吃碎玻璃有哪些好处”等不当言论。这些不当输出引发了广泛的批评,有人称Galactica“不道德”,甚至是“Meta迄今为止制造的最危险的东西”。

在遭受了多天的激烈批评后,Meta的研究人员决定关闭Galactica。而就在12天后,OpenAI发布了ChatGPT,它迅速在全球范围内走红,尽管ChatGPT本身也存在幻觉问题。

在Galactica遭遇强烈反对后,FAIR的研究人员在整个冬季都在对新一代生成式AI模型进行微调,这款模型被命名为LLaMA(Large Language Models Meta AI的缩写)。在Galactica事件后,Meta变得非常谨慎,没有将代码和模型权重完全开放给所有人,而是要求研究人员申请访问权限,并且不提供商业许可。当被问及原因时,杨立昆表示:“因为上次我们向所有人提供大语言模型时,人们对我们嗤之以鼻,告诉我们这将破坏社会结构。”

尽管有这些限制措施,完整的LLaMA模型还是在几周内被泄露到了网上,并在4chan和各种AI社区中传播。Meta对在网上发布该模型的网站提出了下架请求,试图控制其传播范围。然而,一些批评人士警告Meta将面临严重的后果,并严厉批评了它的做法:“准备好迎接大量垃圾邮件和网络钓鱼攻击吧!”

恐慌情绪甚至蔓延至了国会山。2023年6月,两名美国参议员致信扎克伯格,对Llama的发布提出了批评,并发出警告,指出其可能被用于欺诈、传播恶意软件、骚扰以及侵犯隐私等不当行为。信中称,Meta传播先进AI技术的方式“引发了严重的滥用问题”。

然而,与此同时,杨立昆却表示,他和Meta的其他高层领导对于Llama模型的巨大需求感到惊讶。潜在用户所期望的灵活性和控制权,将使得一个极为强大的大语言模型得以开放访问。

例如,律师事务所可以借此训练出专门用于法律领域的模型,并拥有相应的知识产权;医疗保健公司则能够审计和管理模型背后的数据,确保符合各项规定;研究人员也可以对模型的内部工作原理进行试验和检查。杨立昆回忆道:“我们收到了许多请求,他们都表示,‘你们必须将这些资源开源。它极具价值,足以催生出一个全新的行业,就像一个新的互联网一样。’”

这些反馈直接引起了扎克伯格、首席技术官安德鲁·博兹·博斯沃思(Andrew “Boz” Bosworth)以及杨立昆的重视,促使他们每周都要召开一次电话会议,共同探讨应对策略。他们是否应该将下一个版本开源?开源的利是否大于弊?经过深思熟虑,扎克伯格最终下定决心,并获得了多位高管的支持,于2023年7月正式公布了开源模型。

皮诺(左)和达勒共同领导着Meta的生成式AI研发工作

不按套路出牌,

通过开源抢占AI优势赛道

值得注意的是,Llama 2并未实现完全开放。Meta并未透露用于训练模型的数据集,其中包括Facebook和Instagram上的所有数据,这些数据被广泛视为Meta的关键竞争优势。同时,Meta还限制月活跃用户超过7亿的公司使用其服务,主要是为了防止大型科技竞争对手的介入。不过,源代码和模型权重仍然可以下载,Meta也鼓励用户向协作社区贡献改进意见、漏洞修复以及优化结果。

甚至在Llama 2发布之前,扎克伯格就已经为其爆火奠定了基础,并将其视为Meta的下一件大事。在首个Llama模型于2023年2月发布后,扎克伯格迅速从整个公司抽调人员组建了专门的团队,专注于加速生成式AI的研发进程,以便将其应用于Meta应用的各项功能和工具中。他选择了前苹果高管达勒来领导这个全新的团队。达勒于2020年加入Meta,此前从事元宇宙产品的开发工作。

在2023年6月的一次内部全体会议上,扎克伯格分享了他对Meta AI未来的展望。他表示,Meta正在将生成式AI技术融入其所有产品中,并重申了该公司对AI研究采取“基于科学的开放方法”的承诺。达勒也表示:“我肩负着一项艰巨的任务,那就是开发最先进的模型,并以创纪录的速度将它们集成到产品中。”

简而言之:Llama已成为这场游戏的主角。

对于一家年收入高达1350亿美元的公司而言,Meta所采取的策略似乎并不符合常规逻辑。开源软件通常被视为一种技术推广的手段,它更有利于那些与Meta这样的行业巨头竞争的小型初创公司或资源有限的团队。

在2024年7月发布的一篇题为“开源是前进之路”的博客文章中,扎克伯格阐述了开放Llama的动机。他强调,这并不是一个无私的决定,而是出于战略考虑。通过开源,Meta旨在在AI竞赛中占据有利地位,并最终将Llama打造成为生成式AI领域的首选平台。同时,他也指出:“公开发布Llama并不会像OpenAI或谷歌这样的封闭服务提供商那样,削弱我们的收入、可持续性或投资研发的能力。”

开源将打破AI垄断,

暗含新的盈利机会

如今,Llama已经经过了一年多的实践检验,扎克伯格的观点在某些人看来颇具说服力。研究Meta的沃尔夫研究公司分析师什维塔·卡朱莉亚(Shweta Khajuria)认为,将Llama作为开源软件发布是Meta的“天才之作”。这一举措不仅帮助Meta吸引了顶尖人才,还加速了其平台的创新步伐,并为其开辟了新的收入来源。她解释说,开源的Llama使Meta能够迅速赶上OpenAI、谷歌和Anthropic等竞争对手,部分原因在于成千上万的开发者正在以惊人的速度对Llama进行构建和改进。她还指出:“如果Meta没有选择开源,那么它可能需要更长的时间才能与其他前沿模型接轨。”

卡朱莉亚相信,Meta未来将拥有众多新的盈利机会。例如,基于Llama的Meta AI功能可能会推出订阅和广告选项,以及AI驱动的应用内商业信息等。她说:“Meta拥有数十亿用户的庞大基础,这是Perplexity、Claude和ChatGPT等竞争对手所无法比拟的。一旦这些AI服务在全球范围内积累了足够的用户和使用量,它们就有可能实现盈利。”

扎克伯格还暗示,AI生成的内容本身将具有巨大的价值。在最近的财报电话会议上,他表示:“我认为我们将迎来一个全新的内容类别,即AI生成或总结的内容,或者由AI以某种方式整合的现有内容。随着时间的推移,这对于Facebook、Instagram、Threads或其他产品中的推荐体验效果来说,将是非常令人振奋的。”

帕特里克·温德尔(Patrick Wendell)是数据和AI公司Databricks的联合创始人兼工程副总裁,该公司于7月在其平台上部署了Meta的Llama 3.1模型。温德尔认为,Meta的这一举措具有更为深远的影响。如果将互联网视为推动Facebook诞生的第一波科技浪潮,而移动时代则是由苹果和谷歌主导的第二波科技浪潮,那么“我认为扎克伯格已经预见到第三波科技浪潮即将到来,他不希望看到只有一两家公司完全控制所有AI的使用。避免这种情况的一个有效方法就是市场商品化,即免费提供核心知识产权,从而打破垄断格局。”

而一些批评者坚决认为Meta根本无权使用“开源”这一术语。他们指出,当前版本的Llama仍包含传统开源软件所不具备的限制,例如用户无法访问数据集。今年10月,开源术语的创造者——“开源促进会”对此提出了批评,指责Meta错误使用了这一术语,导致用户陷入困惑,同时指出谷歌和微软已经放弃使用该术语。

尽管术语的使用存在争议,但Meta在关键领域取得了显著成就。非营利组织艾伦AI研究所的研究科学家内森·兰伯特(Nathan Lambert)表示,尽管开源的定义可能有分歧,但目前超过90%的开源AI模型都是基于Llama构建的。

在Meta内部,Llama与创收业务之间的联系日益紧密。今年1月,扎克伯格将AI研究团队FAIR与在Meta应用程序中部署生成式AI产品的团队整合到了同一个部门。杨立昆和皮诺现在直接向首席产品官克里斯·考克斯(Chris Cox)汇报工作,达勒也是如此。皮诺表示:“将FAIR与应用产品家族结合在一起是非常有意义的。”她指出,即使在重组之前,她的团队所做的研究也往往能在几个月后就应用到Meta的产品中。

扎克伯格还为FAIR设定了一个更为宏伟的目标:开发通用人工智能(AGI),即拥有类似人类智能的AI。虽然Meta更喜欢用AMI(高级机器智能)这一术语,但皮诺表示,无论名称如何,Meta现在已经有了一个“真正的路线图”来创造这种AI——而这个路线图很可能就是依赖于不断壮大的Llama。与此同时,该公司正在致力于开发Llama 4模型,目前该模型正在一个由超过10万颗英伟达GPU组成的集群上进行训练。

小扎控制61%有表决权股份

不惧投资者质疑

然而,并非所有人都对Llama持乐观态度。多年来,扎克伯格和他的公司一直在努力应对公众对其在Facebook、Instagram和WhatsApp上使用其他类型AI进行个性化新闻推送、内容审核和定向广告的不信任。批评者指责其算法加剧了政治两极分化、青少年心理健康危机以及错误信息的传播。因此,Llama可能会面临更加严格的审查。

一些批评人士还担心,像Llama这样的开源模型在恶意行为者手中可能会变得非常危险,正是因为其开放性过高。在当前紧张的地缘政治氛围中,这些担忧可能会进一步加剧。

即将上任的特朗普政府可能会为Llama的开放之路增添更多变数。特朗普的经济民族主义(Trump's economic nationalism)立场表明,他很可能不愿意看到其他国家获得美国制造的最先进AI模型。然而,Llama的未来走向可能取决于特朗普政府内部的不同声音。副总统当选人万斯(JD Vance)过去曾公开表达过对开源AI的支持,而像埃隆·马斯克(Elon Musk)的xAI也已经将其聊天机器人Grok开源。

尽管如此,扎克伯格的一些老朋友对这种AI军备竞赛表示担忧。Facebook的联合创始人、现任Asana首席执行官达斯汀·莫斯科维茨(Dustin Moskovitz)就指出,虽然他不反对开源大语言模型,但他认为不断发布更强大的模型可能并不合适。

然而,扎克伯格及其盟友坚信,开源模型的风险实际上比那些封闭的专有模式要小。他们主张,对开源AI进行过度的监管可能会扼杀创新。扎克伯格和Spotify联合创始人丹尼尔·埃克(Daniel Ek)在今年8月共同撰写的一篇文章中指出,开源开发是“利用AI推动进步、为每个人创造经济机会和确保安全的最佳途径。”

无论Meta的开源行动最终结果如何,扎克伯格都被视为这一变革的关键推动者。内部人士透露,他个人深度参与了推动Llama和开源的工作,这是Meta能够如此迅速和专注发展的关键原因。克莱格表示,扎克伯格是少数几个在创建大型科技公司后依然留任的领导者之一,他的直接参与使得决策过程更加高效。

为了推动这一变革,扎克伯格一直在积极招募AI人才,并亲自参与招募过程。据报道,他曾用个人电子邮件从谷歌DeepMind挖角研究人员,这些邮件中强调了AI对Meta的重要性。

埃里克·梅杰(Erik Meijer)曾在Meta工作了8年,领导一个专注于机器学习的团队。他认为,只有像扎克伯格这样的高管才能实现这种彻底的转变。他比喻说,这就像一艘超级巨轮在转向,需要强有力的领导人来引领整个公司向同一个方向前进。从某种意义上说,扎克伯格在公司内部就像是一个受人崇拜的英雄。

然而,随着资本支出的飙升和Meta的转型,投资者的耐心可能会受到考验。沃尔夫分析师卡朱里亚表示,目前投资者对Meta的转型持容忍态度,因为Meta已经奠定了基础并展示了未来的机会。但如果从2025年到2026年收入没有开始加速增长,投资者可能会开始失去耐心。尽管如此,扎克伯格控制着Meta约61%拥有表决权的股份,因此他在一定程度上可以免受投资者不满的影响。

杨立昆表示,Meta在GPU和生成式AI方面的巨额投资需要一个愿意冒险的领导者。幸运的是,Meta不仅有这样的领导者,还有一个利润丰厚的核心业务来为这一愿景提供资金。因此,Meta再次回到了科技和商业交汇处的对话中心,而这次讨论的重点不再是虚拟化身等边缘话题,而是关于AI的未来及其在商业中的应用。(腾讯科技特约编译金鹿)

阅读最新前沿科技研究报告,欢迎访问欧米伽研究所的“未来知识库”

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。

截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告