☰

英特尔推出新一代AI解决方案Xeon 6与Gaudi 3

英特尔发表次世代AI解决方案Gaudi 3。图／英特尔提供

随着AI技术不断颠覆各行各业，企业对于兼顾成本效益与快速部署的AI基础设施需求日益增长。英特尔24日正式发表搭载效能核心（P-core）的全新Xeon 6处理器与Gaudi 3 AI加速器，进一步巩固其在AI与高效能运算（HPC）领域的领导地位，新产品强调提升每瓦效能并降低总持有成本（TCO），协助企业建构更强大、灵活且具成本效益的AI系统。

Xeon 6处理器采用效能核心（P-core）设计，专为运算密集型工作负载打造，特别针对AI应用进行了全面优化；与前一代相比，Xeon 6在处理效能上实现了2倍的提升，核心数与记忆体频宽均加倍，并且在每个核心中嵌入AI加速功能，使其能够轻松应对从边缘设备到资料中心、云端环境等多样化场景中的AI需求。

Gaudi 3 AI加速器专为生成式AI设计，具备64个张量处理器核心（TPC）和8个矩阵乘法引擎（MME），能显著提升深度神经网路的运算效能。此外，配备128 GB的HBM2e记忆体，能处理大规模AI模型的训练与推论。Gaudi 3的吞吐量相比前一代提高了20％，且在与Nvidia H100的竞争中展现出强大优势，在相同成本下执行LLaMa 2 70B模型推论时，其效能高出2倍。

Gaudi 3完美支援PyTorch框架，并与Hugging Face Transformer和diffuser模型无缝相容。英特尔与IBM的合作将Gaudi 3作为服务布署至IBM Cloud，进一步扩大生成式AI的应用范畴，帮助企业在提升AI效能的同时，降低整体的总持有成本。

为了促进企业AI的规模化应用，英特尔与多家OEM合作伙伴，包括戴尔科技与美超微，共同设计针对Gaudi 3与Xeon 6的AI解决方案，尤其是基于检索增强生成（RAG）技术的系统。这些解决方案建立在Open Platform For Enterprise AI（OPEA）平台上，整合Kubernetes、Red Hat OpenShift AI等技术，并针对Xeon和Gaudi AI系统进行最佳化，旨在帮助企业轻松应对AI部署过程中的安全性、扩展性与监控等挑战。

英特尔持续推动AI技术的创新，并推出了Tiber产品组合，专为解决横跨AI、云端与边缘环境的挑战而设计。企业客户现可透过Intel Tiber Developer Cloud，提前体验Xeon 6与Gaudi 3的强大效能，进行技术评估与测试。Gaudi 3预计下一季开始大规模布署，进一步加速AI解决方案的普及，透过此次全新AI技术的发表，英特尔再次展示其在企业AI应用领域的深厚实力，并为各行各业开启了更高效、更具成本效益的AI应用新纪元。

英特尔推出新一代AI解决方案Xeon 6与Gaudi 3

相关资讯