刚刚，Gemini 2.5 Pro升级，成编程模型新王_

刚刚，Gemini 2.5 Pro升级，成编程模型新王

机器之心

05/07 08:33机器之心官方账号来自北京

编辑：Panda

你的默认编程模型是什么？或许可以换一换了。

刚刚，Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本：Gemini 2.5 Pro (I/O edition)。

其最大的进步是编程能力大幅提升，不仅在 LMArena 编程排行榜上名列第一，同时也在 WebDev Arena 排行榜上更是以显著优势超过了昔日霸主 Claude 3.7 Sonnet (20250219)！

不仅如此，现在用户只需使用一个提示词即可构建 Web 应用、游戏和模拟程序等，甚至用户仅需提供一张手绘草图 + 功能描述，就能得到一个带有自己设计的 UI 的功能完备的应用。

此外，下面的视频还展示了 Gemini 2.5 Pro (I/O edition) 的另一项能力，可以根据自然图像生成代码，而这些代码可以动态表示自然图像中内容。

打开凤凰新闻客户端提升3倍流畅度

自家模型更新，谷歌的多位大佬也纷纷出来站台。

诺贝尔奖得主、DeepMind CEO Demis Hassabis 表示 Gemini 2.5 Pro (I/O edition) 已经在 Gemini APP、Vertex AI 和 Google AI Studio 中开放，并且其尤其擅长构建交互式 Web 应用，下面的演示展示了该模型根据草图构建应用的能力。

打开凤凰新闻客户端提升3倍流畅度

可以看到，只需一张描述画板应用的简单草图加上一句简单的提示词，Gemini 2.5 Pro (I/O edition) 就创建出了一个功能完备的 Web 应用。

另外，谷歌母公司 Alphabet CEO、Google AI 负责人 Jeff Dean 也都各自发布了宣传推文。

谷歌博客表示，他们原计划在几周后的 Google I/O 大会上发布 Gemini 2.5 Pro Preview (I/O edition)，「但由于大家对这一模型的热情高涨，我们希望尽快将其交付到大家手中，以便人们能够立即开始构建。」

「Gemini 2.5 Pro 的编程和多模态推理功能获得了广泛好评，此次更新正是基于此。除了专注于 UI 的开发之外，这些提升还扩展到了其他编程任务，例如代码转换、代码编辑和开发复杂的智能体工作流。」

这些增强能力让 Gemini 2.5 Pro 在 WebDev Arena 中的 Elo 分数大幅提升：比上一版本高出 147 分！WebDev Arena 排行榜衡量的是人类对模型构建美观且功能强大的 Web 应用能力的偏好。

此外，新版 Gemini 2.5 Pro 在原生多模态和长上下文方面依然强势；它在视频理解方面表现一流 —— 在 VideoMME 基准测试中获得了 84.8% 的分数。

以下视频展示了 Gemini 2.5 Pro 根据单条 YouTube 视频生成交互式学习应用的示例，同时还给出了新旧 Gemini 2.5 Pro 的对比。

打开凤凰新闻客户端提升3倍流畅度

网友实测，新版 Gemini 2.5 Pro 真的行

既然是编程模型新王，网友们的测试热情可以说被瞬间激发。随便检索一下互联网，我们就能找到大量网友们分享的测试案例。

比如网友 @thenomadevel 让 Gemini 2.5 Pro Preview (I/O edition) 用 p5.js 编写了一个直接可玩的记忆配对游戏。

打开凤凰新闻客户端提升3倍流畅度

https://x.com/thenomadevel/status/1919823630143213715

DeepMind 产品设计师 Tim Bettridge 则 Vibe Code（氛围编程）了好几个不同的游戏和应用，比如这个看起来相当不错的星球飞行游戏：

打开凤凰新闻客户端提升3倍流畅度

https://x.com/TimBettridge/status/1919847724645789721

又比如这个功能完备的书架应用：

还有一个支持 3D 浏览的虚拟版芝加哥艺术博物馆。

打开凤凰新闻客户端提升3倍流畅度

更有网友用不到 20 分钟的时间构建了一个完整的城市交通模拟器。

打开凤凰新闻客户端提升3倍流畅度

https://x.com/WesRothMoney/status/1919887823257108941

机器之心也做了简单的尝试，将我们手绘的一张动物图片变成了一个简单的电子宠物游戏：

打开凤凰新闻客户端提升3倍流畅度

看起来，Vibe Coder 们又有新选择了。

打开APP阅读更多精彩内容