開發者大會宣布 微軟搭載AMD Instinct MI300X虛擬機器全面上線
超微执行长苏姿丰展示全新「Instinct MI300」系列AI晶片;微软搭载AMD Instinct MI300X的虚拟机器全面上线。图/AMD提供
超微(AMD)今日在微软开发者大会(Microsoft Build)宣布,全新Microsoft Azure ND MI300X虚拟机器(VM)现已全面上线,协助Hugging Face等客户为其要求最严苛的AI工作负载挹注优异效能与效率。
AMD总裁Victor Peng表示,AMD Instinct MI300X与ROCm软体堆叠助力执行Azure OpenAI Chat GPT 3.5与4版本服务,处理许多全球要求最严苛的AI工作负载。在Azure全新VM全面上线后,AI客户可更广泛的透过MI300X为AI应用带来高效能与高效率的解决方案。
微软技术长暨AI执行副总裁Kevin Scott表示,微软与AMD在多种运算平台上有长久的合作历史,从最初的PC、为Xbox开发的客制化晶片、HPC一直到现今的AI。在不久之前,我们察觉到将强大运算硬体结合所需的系统与软体最佳化的必要性,如此才能提供令人赞叹的AI效能与价值。我们与AMD合作,运用ROCm与MI300X协助微软AI客户与开发人员为最先进与运算密集型前沿模型取得出色的性价比成果。我们致力与AMD合作,持续推动AI进程。
Azure ND MI300x v5 VM系列是在2023年11月发布预览版本,现已在加拿大中部地区上线,供客户执行其AI工作负载。这些VM以领先业界的效能带来令人印象深刻的HBM储存容量与记忆体频宽,让客户在GPU记忆体中安装更大模型和/或减少使用GPU,最终有助于节省功耗与、成本并加速解决方案进程。
这些VM与在其中提供支援的ROCm™软体也用于Azure AI生产力工作负载,包括让客户能使用GPT-3.5与GPT-4模型的Azure OpenAI服务。借由AMD Instinct MI300X以及成熟且就绪的ROCm开放软体堆叠,微软得以在GPT推论工作负载上达成领先性价比。
除了Azure AI生产力工作负载外,Hugging Face为首波采用这些VM的客户之一。Hugging Face仅花一个月就将其模型迁移到ND MI300X VM上,使其模型达到令人惊艳的效能与性价比。ND MI300X VM客户能基于此将Hugging Face模型迁移到VM,轻松且高效地组建与部署自然语言处理(NLP)应用。
Hugging Face推广长Julien Simon表示,微软、AMD与Hugging Face在ROCm开放软体产业体系上的深度合作,将让Hugging Face使用者无须改写程式码就能运用搭载AMD Instinct GPU的Azure来运行数十万种Hugging Face Hub提供的AI模型,Azure客户将能更轻松地透过开放模型与开放资源来打造AI。