DeepSeek刚刚开源新模型：不是R2，但参数量超大_凤凰网科技

DeepSeek刚刚开源新模型：不是R2，但参数量超大

Prover是DeepSeek团队开发的注于数学定理证明的开源大模型。

凤凰网科技讯（作者/于雷）4月30日，DeepSeek刚刚在全球最大AI开源社区Hugging Face发布了一个名为DeepSeek-Prover-V2-671B的新模型。从命名上看，这款参数高达6710亿的模型是去年发布的数学AI模型Prover-V1.5的升级版。

DeepSeek刚刚开源新模型：不是R2，但参数量超大

DeepSeek-Prover-V2-671B使用了DeepSeek-V3架构，采用MoE（混合专家）模式，具有61层Transformer层，7168维隐藏层。同时支持超长上下文，最大位置嵌入达16.38万，使其能处理复杂的数学证明，并且采用了FP8量化，可通过量化技术减小模型大小，提高推理效率。

DeepSeek-Prover是DeepSeek团队开发的一系列专注于数学定理证明的开源大语言模型，通过大规模合成数据训练并结合强化学习（RL）与蒙特卡洛树搜索（MCTS）等优化技术，在形式化定理证明领域取得了显著进展。

DeepSeek-Prover通过创新的训练框架与高效的推理策略，在形式化数学证明领域树立了新标杆。其结合合成数据、强化学习与树搜索的技术路径，不仅提升了模型性能，也为AI在严谨数学推理中的应用开辟了新方向。

打开APP阅读更多精彩内容