攻AI资料中心 台达电火力全开

全球资料中心即将「瓦数暴冲」,电源与散热的关键供应商必须提早对应布局,且面对辉达晶片运算规模提升,台达电逐步打造「从电网到晶片」全方位解决策略,包含电源供应、电源管理及散热管理一应俱全。图/美联社

辉达AI伺服器功率及散热设计

面对辉达(NVIDIA)晶片运算规模提升,台达电逐步打造「从电网到晶片」(From Grid To Chip)全方位解决策略,包含电源供应、电源管理及散热管理一应俱全,未来Rubin、Feynman平台上线,台达可望在电源升级上,自Power Shelf(机架式电源)扩大到Power Rack(电源机柜),持续成为AI资料中心的「重要标配」。

辉达执行长黄仁勋在GTC主题演讲上一口气发布AI伺服器架构,今年将从GB200走向GB300,并在三年内从Blackwell Ultra NVL72扩展至Rubin Ultra NVL576、单柜功率从120kW飙升至600kW,这意味着全球资料中心即将「瓦数暴冲」,电源与散热的关键供应商必须提早对应布局。

伺服器机柜功率升高,传统50V直流配电方式将无法负荷高电流的传输需求,为此,台达电推出HVDC(高压直流)及多阶段DC-DC降压架构,将电压从50V拉高至800V来供应IT机柜电力需求,不但大幅降低电流、减少能量损耗及线材体积,当800V直流进入后,还能降至50V或12V直流作为晶片所需电压,能源转换效率达98.5%。

台达电源及零组件事业范畴执行副总裁史文景表示,从50V到800V,就像从火车升级到高铁,设计逻辑及架构已全然不同。台达目前Power Shelf从原先33kW进阶至72kW设计,如今也正计划推出全新的Power Rack,将电力模组从IT机柜中独立出来,不仅减少了传统低压大电流带来的能量损耗,也腾出了更多IT机柜空间以安置更多GPU节点。

在AI模型训练过程中,大量GPU会导致「群体同步」进行高功率运算,瞬间拉高或降低功率负载,对电网造成巨大压力,严重时更有可能跳电。比起市场常提到的BBU(电池备援模组)及UPS(不断电系统)等方案,台达提出的对策是再开发出一款功率调节系统(PCS)的高功率电容缓冲模组,具备5秒内供应15kW负载调节,并进行快速充放电,犹如GPU负载快速变动的「避震器」来保障电源稳定性。

此外,电源供应器(PSU)的单体功率也从过往的5.5kW一路跃升至30kW,台达不仅调整电路设计而导入三相电,更进一步导入碳化矽(SiC)等宽能隙半导体材料,取代传统MOSFET。台达电源及系统事业群总经理陈盈源表示,从材料、封装到系统全部都重新设计,将大量功率元件如电感、电容模组打造成「黑盒子」般的高机密模组,不但提升效率,更不轻易被竞争业者复制。