今天凌晨，Anthropic 正式发布 Claude 3.7 Son_凤凰网科技

今天凌晨，Anthropic 正式发布 Claude 3.7 Sonnet，成为全球首款双模式混合推理模型；同时 Anthropic 还发布了一款智能编程工具「Claude Code」。

Claude 3.7 Sonnet 在标准模式能够快速响应，而切换到扩展思考（Extended Thinking）模式，能进行深度自我反思，在数学、物理和编程等复杂任务上表现卓越，注重实用导向，不必要拒绝减少 45%，强化代码协作能力。

从基准测试结果来看，Claude 3.7 Sonnet（扩展思维版）适用于强逻辑推理和数学任务。具体来看，在评估 AI 解决真实软件问题能力的 SWE-bench Verified 基准测试中，Claude 3.7 Sonnet 达到了行业领先水平。同时，该模型在 TAU-bench 测试中也表现不错，超越其旧版本与 OpenAI o1。

值得一提的是，Claude 3.7 Sonnet 在 Anthropic 内部的 Pokémon 游戏测试中超越了所有前代模型，展现了更强的决策与规划能力。

与 DeepSeek R1 展示的思考过程相比，Claude 3.7 Sonnet 公开的思考过程相对客观、缺乏个性化表达。Anthropic 表示，未对模型的思维过程进行标准角色训练，希望给予 Claude 最大自由度进行自主思考；并且其认为所谓「思考」过程不一定真实反映了 AI 的内部决策逻辑，因此，Anthropic 未来将基于用户反馈和研究决定是否继续公开 Claude 的思维链。

而 Claude Code 支持直接在终端理解并操作代码库，能一次完成需 45 分钟以上的人工编程任务，专长于测试驱动开发、复杂调试和大规模代码重构，全面支持代码编辑、测试执行等核心开发流程。

目前，Claude 3.7 Sonnet 已适用于所有 Claude 订阅计划，包括免费版、专业版、团队版和企业版，同时也可通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问。除免费版外，所有平台均支持扩展思考模式。

价格方面，定价与前代模型保持一致，输入 100 万 token/3 美元，输出 100 万 token/15 美元（包括思考过程中使用的 token）。

此外，Claude Code 的预览研究版本也已上架官方网站。