英伟达最受欢迎的产品,暂停开发!

如果您希望可以时常见面,欢迎标星 收藏哦~

来源:内容编译自tomshardware,谢谢。

据知名分析师郭明錤在Medium上的报道,英伟达已暂停开发基于GB200的双机架72路NVL36×2,以集中资源开发单机架的NVL72和NVL36。这位分析师以其内部消息来源的准确性而闻名。单机架的NVL36和NVL72机器将按计划上市,英伟达此举的原因据称是由于资源有限以及客户的偏好。然而,早前的报道显示,双机架的NVL36×2被认为是英伟达客户中最受欢迎的选择。

最初,英伟达计划开发三款基于Blackwell GPU的GB200型号,用于AI和高性能计算(HPC)工作负载,分别为NVL36、NVL72和NVL36×2。然而,管理所有三个项目变得具有挑战性,尤其是在同时开发两个不同的72 GPU版本(NVL72和NVL36×2)的情况下。因此,英伟达现在只专注于NVL72和NVL36。

英伟达的GB200 NVL72机架包含18个计算托盘和9个NVSwitch托盘(18个NVSwitch ASIC),每个托盘有两块Bianca板,每块板上有一个Grace CPU和两个Blackwell GPU。这是英伟达最强大的产品,但也是功耗最高的解决方案,耗电约120kW。

根据SemiAnalysis的预计,由于极端的功率和密度需求(典型机架功率为12kW,而基于H100的机架消耗约40kW),大多数数据中心无法支持这一配置的广泛使用。然而,有一个主要客户计划大规模部署该产品,郭明錤指出,微软明显倾向于选择NVL72而非NVL36×2。

GB200 NVL36×2原计划由两个互联的机架组成,最初被认为是更常见的配置。每个机架有18个Grace CPU和36个Blackwell GPU,能够保持72个GPU之间的完全互联。然而,它需要36个NVSwitch ASIC,因此功耗比NVL72更高,性能略低。一个GB200 NVL36×2机架预计每个机架消耗66kW(总计132kW),尽管功耗稍高,但其较大的尺寸更适合现有的数据中心。

GB200 NVL72在空间利用率上远胜于GB200 NVL36×2。然而,大多数英伟达客户无法支持NVL72的功率和冷却密度需求。此外,复杂性可能导致GB200 NVL72的发货时间推迟至2025年下半年。郭明錤称,尽管早前的报道显示,部分NVL72机器将在今年12月交付,预计是交付给微软。

“我最新的供应链调查显示,NVL72的大规模生产可能会推迟到2025年下半年(相比英伟达乐观预测的2025年上半年),”郭明錤写道。

今年早些时候,英伟达在其B100和B200 GPU的封装中遇到了导致产量下降的问题,这促使公司生产低产量的Blackwell硬件以满足需求,并且改进了这些处理器的设计。改进后的GPU预计将在10月下旬开始大规模生产,因此将在明年1月底投入使用。在此背景下,专注于面向最苛刻客户的GB200 NVL72设计,对于追求最大性能的英伟达来说是完全合理的。

还需要注意的是,基于x86的搭载Blackwell处理器的服务器要到2025年才会推出。此阶段,这些机器的外形规格尚未确定,初步报告显示可能会采用NVL72和NVL36×2的配置。不过,现在看来,英伟达的重点已转向首先推出NVL72和NVL36机架,随后将由第三方定制解决方案推出。

https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-reportedly-cancels-development-of-dual-rack-72-gpu-gb200-analyst-says-the-company-intends-to-focus-on-single-rack-offerings