最强开源多模态模型来了,还顺带拉来了国产 GPU 的半壁江山。
今天下午,阶跃星辰在 WAIC 2025 开幕前夕发布新一代基础大模型 Step 3,并宣布将在 7 月 31 日面向全球企业和开发者开源。
阶跃星辰创始人姜大昕博士
阶跃 Step 3 的两个关键词是:多模态推理能力领先开源阵营+推理效率在国产芯片上提升至行业顶尖的 300%。
发布会现场,阶跃还宣布成立「模态生态创新联盟」,联合多家国产芯片头部厂商,共同打通从模型到芯片、终端和工业应用的全链路。
一句话概括 Step 3 的定位:不只是「更强」,而是「更综合」。
而这场重磅发布的逻辑,其实早有迹可循。早在 5 月份,阶跃创始人姜大昕就曾在接受 AppSo 采访时表示;
AI 行业的技术发展非常快,依然处于非常陡峭的区间。阶跃不想在这个过程中放弃主流增长或前进的趋势,所以我们还是会坚持做基础模型的研发。
多模态与高效:兼顾能力与落地
Step 3 是一款主打推理能力和推理效率的旗舰模型产品,无论是文本推理、代码、数学能力,以及最重要的多模态能力,Step 3 都可以胜任,它在多个榜单上的测试结果都非常出色。
在 SimpleVQA 榜单上,Step 3 的得分超过了国内外所有开源的同类模型,成为了最强的开源多模态推理大模型。
阶跃 Step 3 在语言榜单、多模态等榜单上的成绩
而在评估推理效率上,阶跃 Step 3 真正做到了在模型足够好的情况下,推理效率高,应用成本低。
Step 3 从设计伊始就结合多种硬件优化,在主流国产芯片上的推理效率,提升至行业翘楚 DeepSeek 推理效率的 300%;在英伟达 H800 平台上,对比 DeepSeek,也提升 70%,显著降低模型推理的成本压力。
与 DeepSeek 模型对比,左边是在国产芯片上的测试,右边是 NVIDIA H系列芯片的测试
黄金法则:「多、开、好、省」
在大模型「卷各种榜单」的今天,阶跃关注的不仅仅是模型智能的上限,更加关注模型是否能做落地应用,能否实现价值。
阶跃 Step 3 在保留基础模型强大推理能力的同时,更强调落地适配。强调在「低算力」环境下也能保持较强的响应速度和处理能力。
姜大昕进一步归纳了评估模型价值的四个维度:多模态(多)、开源(开)、能力强(好)、成本低(省)。而这四点正是 Step 3 发力的核心。
「多」,意味着模型的多模态能力,而不是针对某一项数学能力、代码能力。姜大昕在现场也举例说我们在很多场合,需要的并不是一个能够拿奥数金牌的模型,而是能够读懂一张纸的含义、能够语音和我们交流。
「开」指的是开源,此次发布的阶跃 Step 3,也将在 7 月 31 日向全世界开源。
「好」则是代表模型的能力要足够强,而「省」则是在模型能力足够好的前提下,尽可能降低成本。
阶跃星辰把 Step 3 放在一个二维坐标系里,能力和是否开源。国际头部模型集中在能力强但不开源区;而许多开源模型缺少多模支持或能力不足。Step 3 填补的正是 开源、多模态、推理顶尖 的象限。
这个「黄金法则」也正说明,阶跃 Step 3 不仅「更聪明」,而且更能「跑得起」「用得起」。
面面俱到:从读图识字到复杂分账
现场也展示了几个阶跃 Step 3 多模态能力的演示案例,
首先是色盲测试图片识别,Step 3 快速读出隐藏字母「Step 3」,甚至在推理思维链里自嘲「巧合」。