谁躲在英伟达背后发大财?

大模型 革命 爆发后,英伟达的GPU一跃成为比黄金还珍贵的资源。 台积电的产线全速运转,订单交付依旧遥遥无期。 科技公司们干着急的同时,开始思考起一个问题:

谁能提供替代品,打破英伟达的垄断?

最受期待的是英伟达的老对手AMD。昨天凌晨,AMD推出了新一代AI芯片MI300X,并拉来了微软、Meta等科技公司高管站台,正式向“垄断者”英伟达发起冲锋。

然而,据AMD自己的估算,2024年公司的AI芯片收入大约是20亿美金——还不到英伟达三季度数据中心收入的1/7[1]。这么一对比,AMD显然更适合坐小孩儿那桌。

事实上,如果按照收入计算,AMD甚至不是全球第二大AI芯片公司,这个称号其实属于博通。

博通是全球最大的通信公司之一。研究机构Semianalysis的预估,AI芯片会在2024年给博通带来80-90亿美金的收入,几乎是AMD的4倍有余[2]。过去一年,博通的市值因AI芯片节节攀升,令同为通信巨头的高通羡慕不已。

估计黄仁勋也没想到,前有产能问题后有出口禁令,自己忙前忙后还得挨骂,你小子居然躲在后面闷声发大财。

在英伟达的芯片霸权之下,博通为什么成了大赢家?

1+1<2

博通的故事,要从谷歌讲起。

2016年,谷歌DeepMind团队带着AlphaGo惊艳亮相,以4-1战胜韩国围棋国手李世石,又在第二年击败了柯洁。伴随着AlphaGo的出圈,幕后功臣TPU也走到台前。

TPU是谷歌自研的AI芯片,用于取代英伟达的GPU。当时,英伟达的GPU主要服务于游戏玩家,在AI训练时图形单元集体摸鱼,存在明显的性能浪费。

因此,谷歌重新设计了芯片架构,并找到了一个关键的合作方——博通。谷歌设计的芯片蓝图,都由博通进行物理实现。

物理实现是芯片设计的后半程,是将逻辑电路转换为有物理连接的电路图的过程。博通绘制好物理版图后,再送去台积电流片,流片成功后的芯片正式进入制造环节,整个过程也都由博通和台积电进行反馈和调整。

简单来说,博通算是谷歌自研TPU时找的外包商。

装载了TPU的数据中心

谷歌之所以找博通合作,不仅是看中了博通的芯片设计能力,更因为它能解决一个关键问题:芯片之间的通信问题。

众所周知,算力不足是制约人工智能行业前进最重要的因素,这背后其实是通信的锅。

通常情况下,AI芯片中的计算单元其实已经完成了计算,但受制于通信效率,只能传输那么多算力。也就是两块芯片合作工作,性能并不是简单的1+1=2。

换个简单易懂的说法,AI芯片相当于一家做外卖的商铺,它一小时能做100单的外卖,但同一时间段的外卖骑手最多只能送50单。

所以美国在第一轮芯片制裁时,选择一刀砍在芯片通信速率上,显然是知道七寸在哪儿。

两个芯片之间的通信有损耗可能不是大问题,但数据中心内动辄成百上千个芯片共同运作,由此带来的性能损耗就足够让资本家肉疼了。考虑到AI训练对大规模并行计算的苛刻需求,怎么让1+1尽可能等于2,成了迫在眉睫的问题。

博通作为通信巨头,恰巧拥有能让1+1尽可能接近于2的工具,最关键的是一个叫做SerDes(串行器/解串器)的通信技术。

SerDes接口通过在传输之前将低速并行数据转换为高速串行数据,然后在接收端转换回并行数据,目的在于允许数据从一个TPU高速移动到另一个TPU,提升信号传输效率。

而在该领域,博通是无可争议的垄断巨头。在全球50GB/S的SerDes市场中,博通占据了76%的市场份额[4]。

有了博通的加持,谷歌自研芯片的项目进展出人意料地顺利。TPU从设计开始,仅用15个月时间就部署进了自家数据中心。

经过测试,初代TPU的性能和功耗都大大胜过了英伟达同期的GPU。随着大模型战争拉开序幕,谷歌大举增加了TPU订单,使得博通一跃成为仅次于英伟达的AI芯片厂商。

谷歌吃完自研AI芯片的螃蟹,Meta、亚马逊、特斯拉这些不想交英伟达税的科技巨头,自然是拿起谷歌的作业就抄,也就无一幸免地复刻了谷歌的关键步骤:与博通合作。

也许有人会问:这么关键的技术,怎么就落到博通手里了?

答案可能有些出人意料:不能说是天上掉馅饼,但也差不多。

买来的护城河

2021年,有着美国芯片界奥斯卡之称的DesignCon,将“年度工程师奖”的殊荣颁给了一位华人女性:Cathy Liu。

她毕业于清华大学,2002年开始研究SerDes相关技术,在美国拥有20多项专利。如今,她领导着博通的SerDes团队,担任首席架构师。

博通能拿下半个硅谷的定制芯片订单,可以说与Cathy Liu的个人奋斗息息相关。

奖项颁布第二天,这名芯片设计师的职业经历就在各大媒体间流传,人们很快发现了一个有趣的事情:过去20多年,刘女士从未主动请辞,简历上却有4个老东家。

在美国完成博士学业后,Cathy Liu于2002年在一家名为DataPath Systems的公司,开启职业生涯。然而不到一年,DataPath就芯片公司LSI所收购。

几年后,LSI又从“猎手”变成了“猎物”,被安华高(Avago)所收购。后来,安华高又收购了博通,顺便把自己的名字也改成了博通。而Cathy Liu则伴随几次收购,历经辗转最终成为博通的一员[6]。

在这期间,她本人的工作重心倒是没什么变化,一直专注于SerDes技术的解决方案,很可能办公室都没搬过,就莫名其妙换了四次东家。

Cathy Liu的职业经历,其实是通信行业竞争格局的一个缩影。

博通所处的通信行业,本质是解决信息传输的问题。为了让信息能在不同的设备、地区之间畅通无阻,就需要一套全世界都认可的标准,就像人与人沟通的最基本条件是语言通用。

然而,最高效的标准通常由技术先发者制定,并且早早申请专利构建护城河。先发者可以率先打造一座距离最短的桥梁,后来者再想入场,只能想方设法绕路。

通信技术处处涉及协议、标准、接口,追赶一项通信技术往往会在前人的专利墙上折戟。

通信公司想要进入对方的专利领域,其中一个常用的方法是“交叉授权”。今年9月,华为和小米就刚结束一场纠缠半年的专利战,双方达成包括5G在内的通信技术的交叉许可协议。

但这通常发生在两个互相忌惮的巨头之间。当双方力量悬殊时,行业内更为简单粗暴的解决方案是:收购。

博通的前身安华高,本身仅约5000件专利与申请案,但经过针对LSI、PLX、Emulex、CyOptics以及英飞凌光学部门的一系列收购,专利总数增长至2.3万件。

而最后收购的原博通公司,专利高达2.7万件。这也是为什么安华高以小吞大原博通后,直接将自己改名为博通公司[5]。

高通在基带芯片上把苹果的脖子卡的死死的,也是因为高通的老本行其实是通信。相比芯片公司在晶体管的缝隙里挑战物理学极限的浪漫,通信公司的商业模式大多朴实无华:收专利费。

不仅是SerDes这项技术,连博通向谷歌提供的芯片定制外包服务,也是来源于LSI。顺带一提,黄仁勋在创办英伟达之前,曾在LSI工作过;昔日东家今日对手,缘分有时就是这么奇妙。

过去数十年,这种“大鱼吃小鱼、小鱼吃虾米”式吞并,曾反复在通信行业上演。目前仅剩的通信企业,大多都是巨无霸,布满了通信技术的各个节点。

博通在AI芯片的胜利很难说是高瞻远瞩,更像是行业竞争与自身业务扩张需求,推动着它四处“吃小鱼”,而那枚定制AI芯片的“小鱼”刚好成了博通的盘中餐。

老黄可以说自己高瞻远瞩地在2006年推出了CUDA,你说博通早二十年就预见了人工智能的浪潮,大概率是没人信的。

当科技公司们风驰电掣地驶进人工智能的高速公路,都被博通早早修好的收费站拦了下来。

又一条恶龙

谷歌在TPU项目初期把订单交给博通,其实还有两个原因:

一方面,谷歌是家互联网公司,芯片都没怎么做过,在封装、内存、连接性和光学等领域更是文盲水平,很难自力更生。另一方面,谷歌当时对TPU的需求量并不大,因此外包给博通是最为省力且经济的选择。

但当谷歌需要大规模量产TPU时,矛盾就出现了。

众所周知,谷歌、亚马逊等公司选择自研芯片,是为了降低成本,避开“英伟达税”。如果选择自研芯片,定制化程度更高不说,还可以省去大量数据中心成本。

但结果是躲得过英伟达,躲不过博通。

据The Information爆料,博通从TPU订单中获得了70%的利润率;虽然没“英伟达税”那么夸张,但也不是个小数字。

更何况,手握大量专利的博通在合作中格外强势。2021年,博通就曾趁着全球缺芯潮的间隙,张口就告诉谷歌要涨价30%,没有回旋余地。双方因此僵持数月,最终还是谷歌认了怂。

早年,亚马逊在购买博通的网络芯片时,也曾对博通的“霸总行径”苦不堪言:

CEO陈福阳(Hock Tan)经常在谈判时即兴涨价,并要求签署排他协议。如果亚马逊提出抗议,博通还会大幅延长交货时间作为回击[8]。

很显然,“霸道总裁”风格是刻在博通基因里的。

博通CEO陈福阳

因此在2019年,谷歌默默在内部组建了一个新的团队,从英特尔和AMD疯狂挖人,“摆脱博通”的计划已成为公开的秘密。

这让博通陷入了与英伟达非常相似的难题:自己的客户,都会变成自己的敌人。

博通虽强,但也并非唯一的选择。博通狮子大开口之后,谷歌的备胎——Marvell也走入大众的视野。在SerDes市场,Marvell的市场份额为23%,是行业内第二大玩家。

不过,至少截至目前,“摆脱博通”都只是一个美好的愿景。

谷歌、亚马逊一面加速自研,一面和博通讨价还价,最终都选择硬着头皮买单。关于“谷歌要离开博通”的新闻发酵当天,谷歌就立马站出来辟谣,表示博通是“优秀的合作伙伴”。

金融分析师们也普遍站队博通。德意志银行在报告里写到:

“我们毫不怀疑博通每推出一代产品都会与其主要客户展开激烈的价格谈判,但博通成功地维持了这些合作关系,我们预计这一次最有可能的结果也是如此[9]。”

华尔街日报的总结则更不客气:谷歌想抛弃博通,还远不到时候。

因此,谷歌目前的目标听上去也很实际:预计2027年实现自力更生。但这话也没有说得太满:“如果博通降价,继续合作也是可以考虑的。”

但对博通来说,他们也许有着更深远的顾虑。

尾声

今年以来,英伟达的股价如同一辆两只踏板都是油门的超跑,一路暴涨约220%,冲到了全球市值第六。然而,有女版巴菲特之称的Cathie Wood却选择在此时清仓英伟达,惊得一众基金经理摸不着头脑。

木头姐清仓的理由其实很简单:英伟达的处境和顶峰时期的思科太过相似了。

思科是一家售卖网络硬件设备的通信公司,曾经被视为“互联网淘金时代的卖铲人”,大受追捧。1994年到2000年期间,思科股价上涨了55倍,营收上涨10倍。

但随着全球互联网基础设施搭建完成,思科的“铲子”渐渐卖不动了。此后20年,反倒是谷歌、亚马逊、Facebook这样的软件公司,成功挖到“金矿”并一跃成为全球最有价值的公司。

历史上,卖铲子的公司在一飞冲天之后,往往都有着相同的宿命:产品饱和乃至过剩-技术和生产能力开始转移-最终重新沉寂。

当人工智能的基础设施铺设完毕,新的芯片可以卖给谁?

对英伟达来说,这番“灵魂拷问”其实并不完全适用,因为它还有CUDA搭建起来的软件护城河,还有多元化的产品组合。

相比之下,博通才是更像思科的那一个。

参考资料

[1] AMD forecasts $2 billion sales of AI chips, helping shares rebound,Reuters

[2] Broadcom’s Google TPU Revenue Explosion, Networking Boom, VMWare Integration,semi analysis

[3] To Reduce AI Costs, Google Wants to Ditch Broadcom as Its TPU Server Chip Supplier,The Information

[4] Marvell收购的Innovium,是唯一能抢下博通份额的网络芯片厂商,EETimes

[5] Avago+Broadcom=专利新强权,中国电子报

[6] Broadcom’s Cathy Liu Wins DesignCon 2021’s Engineer of the Year Award,all about circuits

[7] Nvidia Makes Nearly 1,000% Profit on H100 GPUs: Report,Toms Hardware

[8] Amazon Steps Up Silicon Ambitions With New Networking Chip,The Information

[9] 博通的AI业务前路崎岖,但不会轻易流失,华尔街日报

[10] Cathie Wood:我为何抛弃了英伟达,新硅NewGeek

封面图片来自shotdeck

编辑:陈彬

视觉设计:疏睿

责任编辑:陈彬