高效能运算带动零组件需求、产品创新
全球高效能运算供应商市占率
高效能运算的零组件可分为伺服器、储存、网路设备、云端与其他支援软硬体服务,其中伺服器在2021年为主流,这归因于厂商在数位化转型趋势下,持续投资托管与本地基础设施以支撑对公有云或混合云的需求,推进企业资源整合、弹性生产系统、供应链管理等数位化转型项目进程,从而带动资料中心市场快速成长,促使资料中心数量逐年递增。
该零组件市场重点在于主要的高效能运算伺服器供应,例如Fujitsu、联想与IBM,因这些供应商能针对自研的高效能运系统,长期提供解决方案、维护管理与升级,以确保资料中心与设备可以正常运行。
再者,随着资料中心持续扩建和伺服器的规格与效能要求提升,将带动其垂直产业成长与创新,特别是储存、通讯设备、晶片与系统,以维持资料中心运行,并利于解决方案、维护管理与软硬升级。
HPC设计与软体重要性
晶片虽是高效能运算的重要组成,但并不是高效能运算技术的全部,因高效能运算使用的CPU涉及到体系结构设计、高速互联网路、并行档案系统、储存阵列等方面,因此对CPU堆砌较为复杂、技术壁垒高,即使堆再多的CPU高效能运算,其整体效能提高的程度也有限。
此外,随着运算力增强、应用课题规模与复杂度的增加,Supercomputer对并行档案系统的效能要求也随之提高。
故高效能运算的技术溢出效益也相对明显,尤其伺服器可平滑地采用高效能运算的互联技术、CPU技术、作业系统技术与并行软体设计等技术,使得在高效能运算方面的技术累积也能自然溢出到伺服器产业,甚至可以应用在资料中心、智慧运算中心,透过云端形式提供服务。
以实现AI需求为例,推理、训练与模拟为AI的3个主要任务,在此维度上,晶片的应用上限由其底层构造决定,即使采用软体优化也无法再提升。
从晶片层面来看,若底层晶片采用的是CPU+专用AI晶片,其只能完成AI推理和训练的任务,无法完成模拟。
因AI晶片无法实现双精度浮点运算,双精度浮点运算大量涉及线性代数求解,这也是HPE与Intel于2021年共同合作并参与Argonne National Laboratory(隶属美国能源部)的Aurora百亿亿级电脑系统开发案,HPE也针对高效能晶片特性提供Apollo Systems、Superdome Flex伺服器,协助解决AI与端到端基础设施的问题。