Gemma 3 是目前 Google 最强的开源模型,可以处理文本、图像,甚至是短视频!
图表分析
此图表按 Chatbot Arena Elo 得分对 AI 模型进行排名。得分越高(数字越大),表示用户偏好越高。点表示估计的 NVIDIA H100 GPU 要求。Gemma 3 27B 排名靠前,只需要一个 GPU,而其他模型则需要多达 32 个。
Gemma 3 最新功能
- 最佳单加速器模型: Gemma 3 在 LMArena 排行榜上超越 Llama3-405B、DeepSeek-V3 和 o3-mini,提供领先性能。
- 多语言支持: 支持超过 35 种语言的开箱即用,预训练支持超过 140 种语言。
- 多模态能力: 具备高级文本和视觉推理能力,可分析图片、文本、短视频等。
- 扩展的上下文窗口: 提供 128k 令牌上下文窗口,处理和理解大量信息。
- 函数调用: 支持函数调用和结构化输出,实现 AI 驱动的工作流程和代理体验。
- 量化模型: 引入官方量化版本,减少模型大小和计算要求,同时保持高精度。
本地安装建议
本地安装,单显卡可以选择 1B、4B、12B、27B 版本。推荐选择 27B,因为它处于帕累托最优位置。
Gemma 3 模型概览
预训练 | 指令调整 | 多模态 | 多语言 | 输入上下文窗口 |
---|---|---|---|---|
gemma-3-1b-pt | gemma-3-1b-it | ❌ | 英语 | 32K |
Gemma-3-4b-pt | gemma-3-4b-it | ✅ | +140 种语言 | 128K |
gemma-3-12b-pt | gemma-3-12b-it | ✅ | +140 种语言 | 128K |
gemma-3-27b-pt | gemma-3-27b-it | ✅ | +140 种语言 | 128K |
- 1B 版本输入上下文窗口从 Gemma 2 的 8k 增加到 32k,其他版本增加到 128k。
- Gemma 3 可根据用户输入生成文本(文本或图像),适用于问答、图像分析、文档总结等。
本地部署
1、下载 Ollama 【直达链接】 ,并然后在 cmd 命令终端执行部署:
ollama run gemma3:1b
ollama run gemma3:4b
ollama run gemma3:12b
ollama run gemma3:27b