自研Arm CPU 谷歌造芯突围

本报记者 李玉洋 上海报道

就在英特尔推出最新AI芯片产品Gaudi 3加速卡来硬杠英伟达、AMD的同一天,谷歌也祭出了首款为数据中心设计、基于Arm架构定制的新型CPU Axion,谷歌造芯系列最新的一集来了。

美国当地时间4月9日,科技巨头谷歌在云年度大会Google Cloud Next 24上宣布了Axion的存在,并表示Axion性能比通用ARM芯片高30%,比英特尔生产的当前一代X86架构芯片性能高50%,且能效高出60%。

“基于Arm架构的芯片一般都能达到高能源效率,所以不是很出奇,而更好的性能则见仁见智,因为计算性能的评估需要考虑工作类型。”研究机构Omdia AI行业首席分析师苏廉节对《中国经营报》记者表示。

对于此番谷歌自研CPU这件事,苏廉节并不感到意外:“云大厂都在走这条路,华为的鲲鹏和阿里的玄铁就是最好例子。”需要指出的是,玄铁采用的是另一种非X86架构——RISC-V架构。

尽管当前数据中心CP市场相对稳定,但苏廉节认为目前的芯片大厂不该掉以轻心,来自云大厂的订单或许会下降,预计到2030年云厂商自研CPU会占据整体CPU出货量的20%。而投资机构ARK invest的预测更为激进:到2030年,在云业务领域取代X86架构,Arm+RISC-V的组合所占据的市场份额将增加至71%。

首款Arm架构CPU

公开资料显示,谷歌造芯之路是这样的:自2015年以来,谷歌推出专用芯片张量处理单元(TPU),迄今已发布了五代;2018年,谷歌发布了第一个视频编码单元(VCU);2021年,谷歌通过投资“片上系统”(SoC)设计,加大了定制计算的投入,并发布了用于移动设备的三代Tensor芯片中的第一款。

而Axion则是谷歌自研芯片家族的最新成员,其基于Arm的Neoverse 2,专为数据中心设计。根据谷歌云内部的数据,与当今云中最快的、基于Arm的处理器相比,Axion提供的实例性能高出了30%;而与当代基于X86的同类处理器相比,Axion的性能高出50%,能效高出60%。

需要指出的是,在此次Google Cloud Next 24大会上,谷歌还推出最新的TPU:TPU v5p,用于训练和推理的AI加速器,官方宣称其计算能力是上一代的4倍。据悉,谷歌的TPU是少数英伟达先进AI芯片的替代品之一,而开发者只能通过谷歌的云平台使用,不能直接购买。博通是谷歌生产前几代TPU芯片的合作方,谷歌并未透露设计Axion是否有合作方,以及博通参与推出谷歌云第五代TPU v5p的情况。

Axion的推出,也意味着谷歌成为继微软和亚马逊之后第三家用基于Arm架构推出CPU的云厂商巨头。2018年,亚马逊的AWS推出了基于Arm的Graviton处理器;去年,微软推出了Cobalt 100,同样是Arm的架构。

视线再转移到Axion身上。据悉,Axion适用于支持谷歌的搜索引擎和人工智能等一系列任务,将被用于多种谷歌旗下的服务,例如YouTube广告投放、大数据分析,将于今年晚些时候提供给Google Cloud客户使用。

谷歌官方表示,Axion该芯片可以通过帮助处理大量数据并为数十亿名用户部署服务,将在AI领域发挥重要的支持作用。不过,谷歌并没有将该芯片视为一种竞争之举,谷歌负责自研芯片业务的副总裁Amin Vahdat说:“我觉得这是做大蛋糕的基础。”

相关数据显示,虽然广告依然是谷歌最大收入源,但云计算的增长更快,在谷歌的收入中占比不断提高,已接近占公司总收入的11%。据市场研究公司Gartner估算,2022 年,谷歌占云基础设施市场7.5%的份额,而亚马逊和微软合计控制着约62%的市场份额。

“X86 CPU的通用性很强,既能兼容前几代的系统,也能进行新型的应用,但正是由于兼容性的需求导致芯片无法进行彻底的优化,和新型的Arm芯片对比,某些性能还是欠缺。”苏廉节表示,云大厂都在自研CPU,所以英特尔、AMD等传统数据中心CPU芯片大厂不能掉以轻心。

Arm+RISC-V的市场份额将超70%?

在去年Arm上市路演的视频中,英伟达CEO黄仁勋表示:“数据中心芯片将是驱动未来计算的重要力量,如果没有Arm芯片技术架构、没有高性能的Arm CPU支撑、没有Arm的IP授权系统,英伟达无法制造出超级AI芯片。”

集邦咨询研究显示,近年企业对于人工智能、高效能运算等数字转型需求加速,带动云端采用比例增加,全球主要云端服务业者为提升服务弹性,陆续导入Arm架构服务器,预期至2025年Arm架构在数据中心服务器渗透率将达22%。

那么,为什么Arm等非X86架构的CPU能在数据中心中分得市场?市场研究公司Counterpoint高级研究分析师 Akshara Bassi曾表示:“尽管英特尔仍然是市场领导者,但其市场份额的损失表明AMD不断增加的产品组合和优于英特尔的业绩。正如AWS和阿里巴巴所证明的那样,由于各种工作负载部署和Ampere Computing的现成解决方案提供的投资回报率,基于Arm的架构芯片继续获得发展势头。”

事实上,蚕食X86架构的CPU市场份额,不只是Arm架构,还有开源的RISC-V架构。北京嘉楠捷思信息技术有限公司副总裁汤炜伟曾表示,一个新架构想渗透到一个原来的市场里面去,往往都是“从低向高”渗透的,但这个路线不适合RISC-V。

“Arm是从C端向B端发展过程中渗透到X86市场的,server(服务器)最终使用者是B端,而PC(个人电脑)最终使用者是C端,C端的一个特点是软件需求非常多、使用非常友好,才能够得到广泛认可,体验足够好。”汤炜伟认为,RISC-V会优先渗透server而不是PC,由于server所使用的软件偏少,只要能在两三种软件取得优势,就能打开一定市场空间。

记者还注意到,芯片大神Jim Keller加入的加拿大AI芯片独角兽Tenstorrent也在用RISC-V做CPU。Tenstorrent首席CPU架构师练维汉认为,AI模型的计算不只是矩阵型运算,还有很多需要CPU来做,比如大语言模型的存取非常破碎、混乱,而这是CPU最擅长做的。

“大语言模型有所谓的KV cache,它是给语言模型的一个情景,比如说我谈狗的时候,是你的狗还是我的狗?所以说先把token(令牌)碰到KV cache里,它去找聊天记录,像这样的项目非常多,每次开始一个对话,它就做这样的事情。”练维汉表示,这是一种不同寻常的随机存取,所以CPU是个好选择,未来这样的情况预计会越来越多,所以CPU+AI引擎是一种好的异构组合。

谈及为何选择RISC-V来做CPU,练维汉认为开源和灵活性是选择RISC-V的重要原因。“RISC-V是开源的,开源的好处是可以做任何修改;从整个计算需求的过程看,灵活性很重要,因为从客户端到云端有很多不同的优化,就需要指令集做灵活的改动。假如用Arm架构的话,任何事情都要和Arm汇报,获得授权。”练维汉表示,RISC-V是一个非常有灵活性的ISA(指令集架构),是一种计算的未来。

根据ARK invest的预测,到2030年,Arm和RISC-V可能成为新的处理器标准,在云业务领域取代X86架构,Arm+RISC-V的组合所占据的市场份额,将从2020年的零,增加至2030年的71%。

(编辑:吴清 审核:李正豪 校对:颜京宁)