Opus 4.7是Anthropic目前面向编程、企业工作流和长程Agent任务推出的最强模型。比 Opus 4.6更好地处理歧义,在找Bug和代码审查上能力显著提升,跨会话携带上下文更可靠,对模糊任务推理所需指令更少。
但 Token 使用行为有变化,需要调整使用方式才能发挥最佳效果。
核心变化:把Claude当委托的工程师
在交互式设置里,Opus 4.7在每次用户交互后会进行更多推理——这提升了长会话中的连贯性、指令遵循和编程质量,但 Token 消耗也更大。
最佳实践:把Claude当委托的工程师,而不是手把手指导的 pair programmer。
具体做法:
- 第一轮就给完整任务描述。把意图、约束、验收标准和相关文件位置都说清楚,Opus 4.7需要这些上下文来交付更强输出。在多轮对话中逐步传达模糊指令会降低 Token 效率,有时也影响整体质量
- 减少必需的交互次数。每次用户交互都会增加推理开销,把问题批量抛给模型让它持续推进
- 适时使用 Auto 模式。对于信任模型能安全执行不需要频繁检查的任务,Auto 模式减少周期时间,适合长程任务且已提供完整上下文的场景(Claude Code Max 用户可用 Shift+Tab 切换)
- 设置任务完成通知。让Claude完成任务后播放声音,它可以通过hook创建自己的通知
推理档位推荐
Opus 4.7在 Claude Code 的默认推理档位现在是 xhigh——这是 high 和 max 之间新增的档位,在难题上对推理和延迟的权衡提供更精细控制。
| 档位 | 适用场景 |
|---|---|
medium / low | 成本敏感、延迟敏感、范围明确的任务。同档位下比 Opus 4.6强,有时用更少 Token |
high | 平衡智能和成本。并发会话或想省钱时选这个 |
xhigh(默认) | 大多数编程和Agent工作的最佳选择。强自主性和智能,无 max 那种长程Agent运行的 Token 失控风险 |
max | 压榨极难题目的额外性能,但边际收益递减,更容易overthinking。仅用于测试模型上限,或极度智能敏感且不计成本的场景 |
从旧版 Opus 升级时,推荐重新实验推理档位,而不是直接沿用旧设置。在同一任务中也可以切换档位来更有效地管理 Token 消耗。
自适应思考:固定预算取消,按需分配
Opus 4.7不支持固定思考预算的扩展思考,取而代之的是自适应思考——模型可以在每一步选择是否启用思考,对简单查询快速响应,在不需要思考的步骤跳过思考,把思考 Token 用在最可能有价值的地方。这一版本的自适应思考有明显改进,Opus 4.7更不容易overthinking了。
如果想手动控制思考量:
- 想要更多思考:"Think carefully and step-by-step before responding; this problem is harder than it looks."
- 想要更少思考:"Prioritize responding quickly rather than thinking deeply. When in doubt, respond directly."(会省 Token,但难题上可能损失一些准确性)
与 Opus 4.6的行为差异
几个默认行为变化值得注意:
响应长度按任务复杂度校准。 Opus 4.7不像 Opus 4.6那样默认啰嗦。简单查询回答更短,开放式分析回答更长。如果用例依赖特定长度或风格,需要在 Prompt 里明确说明,用正面示例比"不要这样做"的负面指令更有效。
模型调用工具频率降低,推理更多。 这在很多场景下产生更好效果。如果想要更多工具调用(比如更积极搜索或在Agent工作中读取更多文件),需要明确描述何时以及为什么应该使用工具。
默认减少 Subagent 派生。 Opus 4.7对何时将工作委托给 Subagent 更谨慎。如果用例受益于并行 Subagent(比如跨文件展开或读取多个独立文件),建议明确说明:
不要为可以单次响应直接完成的工作派生 Subagent(比如重构一个你已经能看到的函数)。当跨多个项目展开或读取多个文件时,在同一步派生多个 Subagent。
适用场景
Opus 4.7在长程任务上比之前模型表现更好,适合这些场景:
- 复杂多文件变更
- 模糊Bug调试
- 跨服务的代码Review
- 多步骤Agent工作
建议把推理档位设为 xhigh,看第一轮能推进多远。
把Claude当"委托的工程师"而不是"pair programmer"——这句话道出了Opus 4.7时代的正确用法。