NVIDIA乙太网路技术加速全球最大AI超级电脑Colossus建设 助力xAI突破大型模型训练
Colossus的建设速度令人瞩目,仅用122天便完成配套设施及系统建设。从安装首个机架到启动模型训练仅历时19天,成为业界速度标竿。作为全球最大的AI超级电脑,Colossus在运行Grok模型时,展现卓越的网路效能。其三层网路结构中未出现任何流量碰撞、封包遗失或应用程式延迟。凭借Spectrum-X的壅塞控制功能,Colossus实现高达95%的资料输送效率,而标准乙太网路仅能提供60%的资料传输,且伴随数千次流量碰撞。
NVIDIA网路事业部资深副总裁Gilad Shainer表示:「AI成为现今关键业务需求,须具备更高效能、增强安全性和扩充能力。NVIDIA Spectrum-X乙太网路平台为xAI等创新公司提供前所未有的计算效能,使他们能够更快速地处理并部署AI解决方案,缩短AI产品上市时间。」
Spectrum-X 平台的核心为 Spectrum SN5600 乙太网路交换器,具备高达800Gb/s的连接埠速度,并内建Spectrum-4交换器ASIC。xAI 进一步选用 NVIDIA BlueField-3 SuperNIC,以取得更高效能和可靠性。此乙太网路技术采用先进的自适应性路由、壅塞控制和NVIDIA Direct Data Placement技术,提供低延迟、短尾延迟的高扩充性频宽,是生成式AI云端及多租户环境的理想方案。
xAI创办人Elon Musk在X平台赞扬Colossus的建设成就:「Colossus 是世界上最强大的训练系统,感谢 xAI 团队、NVIDIA 及众多合作伙伴的卓越贡献。」xAI发言人则表示:「这是全球最大、性能最佳的AI超级电脑,NVIDIA Hopper GPU与Spectrum-X技术助力我们实现更大规模的AI训练速度与效率。」
NVIDIA Spectrum-X不仅提升Colossus的效能,亦展示乙太网路在AI运算领域中的无限潜力,为AI大规模运算带来革命性突破。