摘要:
Grok 4目前是地表最强AI,但也是地表最贵AI。能不能突破AI与物理世界的连接就看它了。
凤凰网科技 出品
作者|董雨晴
北京时间7月10日中午12时左右,马斯克旗下xAI公司推出的Grok-4系列模型终于发布。只是开始的比原定计划时间整整晚了一个小时。
直播一开场,马斯克就搬出一句熟悉的台词:“这是世界上最好的AI,让我们来展示一下”。只不过最豪迈的发言搭配的发布形式“略显潦草”,有观看直播的网友吐槽,“老马满脸疲惫”。
马斯克特别表示,在学术问题上,Grok 4能在所有学科中达到甚至超越人类博士水平。他还特别自信地预测,Grok 4有望在今年内为人类带来“发现新科学技术”的突破,并可能在明年发现新的物理现象。
根据规划,xAI还将在8月发布编程模型,9月发布多模态智能体,10月发布视频生成模型。
Grok-4到底有多强?比最强(SOTA)更强
在多项严苛的基准测试中,Grok 4都堪称领先。在被称为“人类最终考试”的HLI(Humanities Last Exam)基准中,该模型在未使用工具的情况下解决了25%的问题。
而其多智能体版本Grok 4Heavy,通过并行协作,多一点时间思考,进一步将文本子集问题的解决率提升至超过50%,也是所有模型中首次突破这一数值的。
此外,Grok 4还在包括PhD级别问题集在内的所有推理基准测试中表现出色,甚至在编码基准和数学竞赛中取得了满分,通常比第二名模型有显著领先。
xAI方面介绍,本次发布能够实现远超各类SOTA的成绩,本质上是范式和计算量的跃迁。
与Grok 2相比,Grok 4训练量增加了100倍,并且还在持续扩张。特别是在推理和强化学习(RL)方面,Grok 4投入了大量计算资源,其RL计算量是其他任何模型的10倍以上。
要知道在AI领域,xAI一直以“豪”著称,拥有包含10万块H100 GPU的“世界超级计算机”。Grok 2在12个月前还只是一个概念,而如今的标准下,Grok 2的模型智能水平已相当于高中生。
目前,Grok 4的订阅费是30美元/月,Grok 4 Heavy的费用为300美元/月,Grok 3维持免费状态。换算下,最贵的Heavy年费直逼2.1万元人民币了。
除了基础模型能量的大幅提升外,xAI还公布了Grok语音模式的大升级,端到端延迟降低一半,并引入了多款更自然、富有情感的新声音,例如具有史诗般低沉声线的Sal和能表达丰富情感的英伦女声Eve。
尽管Grok 4在多模态理解(特别是图像理解和生成)方面仍存在“部分盲点”,但xAI表示,其基础模型的第七个版本(计划在几周内完成训练)将解决这一弱点,未来模型将能够像人类一样“听到和看到世界”。
在Google等已经取得显著突破的视频生成领域,xAI也紧咬不放,称正在推进模型的训练,预计今年将出现首部可观看的AI生成电视节目片段,明年有望出现首部AI电影。