DeepSeek刚刚开源新模型:不是R2,但参数量超大

Prover是DeepSeek团队开发的注于数学定理证明的开源大模型。

凤凰网科技讯(作者/于雷)4月30日,DeepSeek刚刚在全球最大AI开源社区Hugging Face发布了一个名为DeepSeek-Prover-V2-671B的新模型。从命名上看,这款参数高达6710亿的模型是去年发布的数学AI模型Prover-V1.5的升级版。

DeepSeek刚刚开源新模型:不是R2,但参数量超大

DeepSeek-Prover-V2-671B使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达16.38万,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

DeepSeek-Prover是DeepSeek团队开发的一系列专注于数学定理证明的开源大语言模型,通过大规模合成数据训练并结合强化学习(RL)与蒙特卡洛树搜索(MCTS)等优化技术,在形式化定理证明领域取得了显著进展。

DeepSeek-Prover通过创新的训练框架与高效的推理策略,在形式化数学证明领域树立了新标杆。其结合合成数据、强化学习与树搜索的技术路径,不仅提升了模型性能,也为AI在严谨数学推理中的应用开辟了新方向。

打开APP阅读更多精彩内容