Google 推出开源多模态模型 Gemma 3
3 月 12 日,Google 正式推出新一代开源多模态模型 Gemma 3,该模型采用与 Gemini 2.0 相同的研发和技术,同时也是 Google 迄今为止最先进、最便携的开源模型。
Google 介绍,Gemma 3 专为端侧设备设计:从手机和笔记本电脑到工作站,帮助开发者在任何需要的地方进行 AI 应用开发。值得关注的是,Google 称 Gemma 3 是「全球最佳单加速器模型」,能够在单个 GPU 或 TPU 主机上运行。Gemma 3 在 LMArena 排行榜上的初步人类偏好评估中,超越了 Llama-405B、DeepSeek-V3 和 o3-mini。
Gemma 3 也提供多个尺寸的版本,分别为 1B、4B、12B 和 27B。除 1B 参数的版本,其他版本均支持理解 140+ 种语言,其中 35 种语言支持开箱即用;同时具备分析文本、图像及短视频的能力;Gemma 3 还提供 128k tokens 的上下文窗口,从而处理复杂任务;此外,Gemma 3 支持函数调用和结构化输出。
目前,Gemma 3 已上线 Google AI Studio,并且能够通过 Hugging Face、Kaggle 下载该模型。