英特尔推出新一代AI解决方案Xeon 6与Gaudi 3
英特尔发表次世代AI解决方案Gaudi 3。图/英特尔提供
随着AI技术不断颠覆各行各业,企业对于兼顾成本效益与快速部署的AI基础设施需求日益增长。英特尔24日正式发表搭载效能核心(P-core)的全新Xeon 6处理器与Gaudi 3 AI加速器,进一步巩固其在AI与高效能运算(HPC)领域的领导地位,新产品强调提升每瓦效能并降低总持有成本(TCO),协助企业建构更强大、灵活且具成本效益的AI系统。
Xeon 6处理器采用效能核心(P-core)设计,专为运算密集型工作负载打造,特别针对AI应用进行了全面优化;与前一代相比,Xeon 6在处理效能上实现了2倍的提升,核心数与记忆体频宽均加倍,并且在每个核心中嵌入AI加速功能,使其能够轻松应对从边缘设备到资料中心、云端环境等多样化场景中的AI需求。
Gaudi 3 AI加速器专为生成式AI设计,具备64个张量处理器核心(TPC)和8个矩阵乘法引擎(MME),能显著提升深度神经网路的运算效能。此外,配备128 GB的HBM2e记忆体,能处理大规模AI模型的训练与推论。Gaudi 3的吞吐量相比前一代提高了20%,且在与Nvidia H100的竞争中展现出强大优势,在相同成本下执行LLaMa 2 70B模型推论时,其效能高出2倍。
Gaudi 3完美支援PyTorch框架,并与Hugging Face Transformer和diffuser模型无缝相容。英特尔与IBM的合作将Gaudi 3作为服务布署至IBM Cloud,进一步扩大生成式AI的应用范畴,帮助企业在提升AI效能的同时,降低整体的总持有成本。
为了促进企业AI的规模化应用,英特尔与多家OEM合作伙伴,包括戴尔科技与美超微,共同设计针对Gaudi 3与Xeon 6的AI解决方案,尤其是基于检索增强生成(RAG)技术的系统。这些解决方案建立在Open Platform For Enterprise AI(OPEA)平台上,整合Kubernetes、Red Hat OpenShift AI等技术,并针对Xeon和Gaudi AI系统进行最佳化,旨在帮助企业轻松应对AI部署过程中的安全性、扩展性与监控等挑战。
英特尔持续推动AI技术的创新,并推出了Tiber产品组合,专为解决横跨AI、云端与边缘环境的挑战而设计。企业客户现可透过Intel Tiber Developer Cloud,提前体验Xeon 6与Gaudi 3的强大效能,进行技术评估与测试。Gaudi 3预计下一季开始大规模布署,进一步加速AI解决方案的普及,透过此次全新AI技术的发表,英特尔再次展示其在企业AI应用领域的深厚实力,并为各行各业开启了更高效、更具成本效益的AI应用新纪元。