Gemma 3 是目前 Google 最强的开源模型,可以处理文本、图像,甚至是短视频!

Gemma 3

图表分析

此图表按 Chatbot Arena Elo 得分对 AI 模型进行排名。得分越高(数字越大),表示用户偏好越高。点表示估计的 NVIDIA H100 GPU 要求。Gemma 3 27B 排名靠前,只需要一个 GPU,而其他模型则需要多达 32 个。

Gemma 3 最新功能

  • 最佳单加速器模型: Gemma 3 在 LMArena 排行榜上超越 Llama3-405B、DeepSeek-V3 和 o3-mini,提供领先性能。
  • 多语言支持: 支持超过 35 种语言的开箱即用,预训练支持超过 140 种语言。
  • 多模态能力: 具备高级文本和视觉推理能力,可分析图片、文本、短视频等。
  • 扩展的上下文窗口: 提供 128k 令牌上下文窗口,处理和理解大量信息。
  • 函数调用: 支持函数调用和结构化输出,实现 AI 驱动的工作流程和代理体验。
  • 量化模型: 引入官方量化版本,减少模型大小和计算要求,同时保持高精度。

本地安装建议

本地安装,单显卡可以选择 1B、4B、12B、27B 版本。推荐选择 27B,因为它处于帕累托最优位置。

Gemma 3 模型概览

预训练指令调整多模态多语言输入上下文窗口
gemma-3-1b-ptgemma-3-1b-it英语32K
Gemma-3-4b-ptgemma-3-4b-it+140 种语言128K
gemma-3-12b-ptgemma-3-12b-it+140 种语言128K
gemma-3-27b-ptgemma-3-27b-it+140 种语言128K
  • 1B 版本输入上下文窗口从 Gemma 2 的 8k 增加到 32k,其他版本增加到 128k。
  • Gemma 3 可根据用户输入生成文本(文本或图像),适用于问答、图像分析、文档总结等。

本地部署

1、下载 Ollama 【直达链接】 ,并然后在 cmd 命令终端执行部署:

ollama run gemma3:1b
ollama run gemma3:4b
ollama run gemma3:12b
ollama run gemma3:27b

cmd.webp