还有大招?DeepSeek的研究员Daya Guo在线透露了一个消息:R1的训练过程仅仅耗时两到三周,研究员们在春节期间也未停歇,继续全力推进研究,接下来还有大招。

他还透露团队正在尝试将R1应用于形式化证明环境,并希望尽快向社区发布更加优秀的模型。从Daya Guo的言辞中不难看出,他们在这方面已经取得了进展,未来或将有更多重量级的模型问世,令人充满期待。