Lance Martin 在 Opus 4.8 发布后整理了一套实战技巧,聚焦在这个新版本在真实使用场景里的具体变化。
1. 中途更新系统 Prompt 不打断缓存
之前想在对话中途修改系统 Prompt,需要在用户消息里加 <system-reminder> 标签。现在可以直接更新系统 Prompt 而不破坏已有的 prompt cache,这对于需要根据任务阶段调整系统指示的场景非常有用。
2. 配合 Effort 级别使用
Opus 4.8 新增了 effort 滑块,从低到高分为多个级别。高 effort 意味着更智能的回答和更多的 token 消耗,但也意味着更好的判断力。在需要精确输出、复杂推理或多步规划的任务里,把 effort 调到高档位才能真正发挥 4.8 的能力。
3. 利用更新后的诚实度
4.8 的一个核心改进是减少"未对齐行为"(misaligned behavior)——比如声称"完成了 50 个文件的修改"实际上只改了 15 个这种情况。在 Opus 4.8 上,这类问题的发生率几乎是 4.7 的一半,模型对自己进度的描述更接近真实情况。
4. 批处理而非实时监控
结合编排税的概念,Opus 4.8 更适合批量处理模式:给模型一批文件让它处理,而不是开了 5 个并行的 subagent 每个都实时盯着。把 effort 级别设好,给足时间,让模型在一次调用里完成复杂任务。
5. 充分利用更长的独立运行能力
4.8 改进的判断力和诚实度让它更适合长时间独立运行。配合 /model opus-4-8 切换到 Opus,可以执行需要数小时的中等复杂度任务,而不用担心模型中途放弃或给出虚假进度报告。
Opus 4.8 与 4.7 定价相同,API 速率限制在 Claude Code 内上调,以适应更高的 effort 级别带来的 token 消耗。