Google DeepMind推出可用於單一GPU或TPU的「Gemma 3」人工智慧模型

Google DeepMind稍早宣布推出名为「Gemma 3」,并且能在单一GPU或TPU运行人工智慧模型,更标榜能在LMArena测试排行的初步人类偏好评估项目超越Llama-405B、DeepSeek-V3与o3-mini等模型表现,同时也强调能在一般规格硬体布署高效能人工智慧应用功能。

「Gemma 3」支援超过140种语言、提供128K词元长度的上下文扩展能力,同时也具备先进的文字与视觉分析推理能力,并且提供10亿、40亿、120亿及270亿组参数规模版本,可让开发者依照硬体及效能需求选择合适规模版本模型。

而「Gemma 3」更与多种开发工具相容,包括Hugging Face Transformers、Ollama、JAX、Keras、PyTorch等,另外也能在NVIDIA GPU、Google Cloud TPU、AMD GPU进行最佳化运作,目前已经可以透过Google AI Studio、Kaggle或Hugging Face等托管平台取得「Gemma 3」模型。

除了「Gemma 3」,Google DeepMind也同步推出40亿参数规模的图像安全检查工具ShieldGemma 2,可依照具风险内容、露骨内容与暴力内容设置安全标签,借此让开发者能打造更负责任且安全的人工智慧应用服务。

另外,Google也宣布推出「Gemma 3」学术计划,借由提供每项价值1万美元的Google Cloud点数,让学术研究人员以此进行更多基于「Gemma 3」的相关研究。至于目前基于Gemma打造的衍生人工智慧模型目前已经累积超过6万种,而Gemma系列模型至今也已经累积下在超过1亿次。

《原文刊登于合作媒体mashdigi,联合新闻网获授权转载。》