赛道Hyper | Vera Rubin:英伟达君临AI天下秀

6月5日,英伟达股价创出新高,报收1224.40美元,涨幅5.16%,市值超越苹果,为3.012万亿美元,成为美股市值第二的科技公司。苹果市值为3.0035万亿美元。6月3日,COMPUTEX(台北国际电脑展)2024开幕,AI成了当仁不让的主角和焦点。

在包括英伟达、Intel、AMD、高通、联发科和Arm等在内的一众各种终端芯片设计商中,英伟达当属最受瞩目者。

英伟达联合创始人兼CEO黄仁勋在COMPUTEX2024大会上更新了AI GPU技术路线图:2025年,英伟达将发布Blackwell Ultra,2026年推出新架构Rubin,2027年发布Rubin Ultra。

从2023年10月的投资者会议开始,英伟达将原本两年一更新芯片新品的节奏,改成一年一更新。在那次会议上,黄仁勋宣布,预计今年会推出H200和B100 GPU;2025年,英伟达X100 GPU也将面世。

根据去年10月的规划框架,英伟达AI芯片规划的战略核心是“One Architecture”统一架构,支持在任何地方做模型训练和部署,无论是数据中心(IDC)还是边缘设备,抑或x86和Arm架构。

也就是说,英伟达AI芯片解决方案适用于超大规模数据中心的训练任务,也可以满足企业级用户的边缘计算需求,涵盖x86或新兴的Arm架构生态。

目前,英伟达同时拥有GPU、CPU和DPU(数据处理单元:Data Processing Unit)的计算芯片和系统公司。通过NVLink、NVSwitch和NVLink C2C技术,英伟达将CPU和GPU做了灵活连接组合,形成统一的硬件架构,并与CUDA一起,形成完整的软硬件生态。

DPU是一种专门用于数据处理的处理器。与通用处理器(CPU)和图形处理器(GPU)不同,DPU专注于数据处理,可以实现更高效的数据处理和计算。

抛开黄仁勋的软广告宣传,比如回顾了英伟达在过去的成功历程、在算力方面降低成本的努力,以及“是英伟达促成了当今的AI时代”,并且再次强调CUDA的AI平台级价值——正是因为有了CUDA,全球的深度学习科学家们才能充分利用其潜力,从而推动了整个行业的进步——黄仁勋也展望了生成式AI时代的未来,这部分是本次大会英伟达的战略公示重点。

黄仁勋说,“我们现在所处的不是简单的AI时代,而是一个生成式AI时代。在这个时代,几乎所有事物都可以转换成Token(词元),并通过生成式AI进行处理和优化。”

“生成式AI将重塑各行各业,推动整个价值3万亿美元的IT产业转型为AI工厂,为每个行业制作AI产品。”黄仁勋说,“未来每台装有RTX显卡的PC都将成为AI PC,能够高效地处理和生成各种数据。”

这是不是相当于AI PC有了黄氏定义?“每台装有RTX显卡的PC都将成为AI PC”。

更核心的焦点,实际上就是黄仁勋公布英伟达AI GPU技术路线图:到2027年之前,英伟达会更新GPU和CPU架构,以及CPU+GPU二合一超级芯片。

黄仁勋表示,英伟达将坚持使用统一架构覆盖整个数据中心GPU产品线,每年更新迭代一次。其中的核心,就是英伟达官宣了替代“Blackwell”架构的新一代GPU架构“Rubin”。

截至目前,英伟达高性能GPU架构代号“Blackwell”,已实现量产,相关产品包括用于HPC/AI领域的B200/GB200,以及用于游戏的RTX 50系列。

2025年,Blackwell迭代版Blackwell Ultra将得以面市;2026年,新架构“Rubin”会推出:搭载下一代HBM4高带宽内存(8层堆栈);2027年,“Rubin”的迭代版“Rubin Ultra”会推出,标准版的HBM4内存,由8层堆栈升级为12层堆栈。

这里有个细节很值得注意:“Rubin”命名源于美国女天文学家Vera Rubin(薇拉·鲁宾)。

CPU方面,“Vera”架构会取代2022年3月推出的Grace CPU超级芯片。“Vera”架构名称同样源于Vera Rubin——前者用于英伟达新一代CPU架构名称,后者Rubin则成为英伟达新一代GPU架构的名称。

此前,英伟达在其AI路线图中,并没有将“Grace”作为一个独立的CPU架构,而将之纳入“Grace+GPU”的SuperChip超级芯片范畴。

这在营销层面的表达或许不够清晰,但实际上体现了英伟达“CPU+GPU二合一超级芯片”的策略;而此次官宣“Vera Rubin”之“CPU+GPU”架构,让竞对看到了英伟达在AI领域强悍的统治力。

在SuperChip超级芯片架构中,NVLink-C2C和NVLink互联技术在英伟达未来的AI芯片架构中,将持续发挥关键作用。

本次大会上,黄仁勋公示了Vera CPU和Rubin GPU组成新一代超级芯片的最新规划:采用第六代NVLink互连总线,带宽高达3.6TB/s。

NVLink-C2C互联技术的作用是什么?

英伟达以之构建GH200、GB200和GX200超级芯片;再通过NVLink互联技术,两颗GH200、GB200和GX200能被链接成GH200NVL、GB200NVL和GX200NVL模组。之后,英伟达能将之通过NVLink网络组成超节点,再用InfiniBand或Ethernet网络,最终组成更大规模的AI集群。

InfiniBand或Ethernet网络是什么?这是英伟达交换芯片技术:前者瞄准AI Factory,后者侧重AIGC Cloud。相较于NVLink总线域网络,InfiniBand和Ethernet属于传统网络技术,两种网络带宽比例大约为1:9。

在此次大会上,黄仁勋公布了这两条开放的芯片交互技术路线中的InfiniBand技术和产信息更新:新一代数据中心网卡CX9 SuperNIC,最高带宽可达1600Gbps,也就是160万兆,搭配新的InfiniBand/以太网交换机X1600。

根据2023年10月举行的英伟达投资者会议内容,以InfiniBand为基础的Quantum系列和以Ethernet基础的Spectrum-X系列将持续升级。预计到2024年,基于100G SerDes的800G接口的交换芯片将实现商用;2025年,基于200G SerDes的1.6T接口的交换芯片也会面市。