Anthropic 今天发布了 Opus 4.8,Nate Herk 在测试后写了这篇实战指南,专注于"发布后怎么真正用好它"。
定价和可用性
Opus 4.8 与 4.7 定价相同。API 速率限制在 Claude Code 内上调,以适应更高 effort 级别带来的更高 token 消耗。1M 上下文窗口保持不变,Opus 和 Sonnet 4.8 今天在所有支持渠道同步可用,用 /model 切换。
Mythos:比 Opus 更聪明的模型正在路上
Anthropic 首次公开提及一个新模型系列:Mythos。定位是比 Opus 更高智能,目前已有少量组织在网络安全场景使用,但在广泛发布前还需要更强的安全护栏。这条信息值得存档——模型能力的上限在继续上移。
最大变化:Effort 级别
这次更新最重要的功能是 effort 滑块。在 Claude Code 里输入 /effort,会看到六个级别:
低(Low)、中(Medium)、高(High,Opus 4.8 默认)、xhigh(Extra High)、Max 和 Ultracode(Extra High 加上 Workflows)。
effort 越高,模型给出的答案越深入、越智能,但 token 消耗也越大。对应不同任务选择合适的 effort 级别,是用好 4.8 的关键。
诚实度提升:针对 4.7 社区反馈的改进
Anthropic 这次的发布博客花了大量篇幅讲诚实度。这是 4.7 被社区抱怨最多的三个问题:太懒(任务没完成就放弃)、过度保守(安全过度)、Token 消耗过高(attitude 问题,固执、会在你的想法上抬杠而不是帮忙)。
4.8 在"未对齐行为评估"上的分数是 4.7 的一半——意味着假进度报告、假完成状态这类问题发生率显著下降。
不过作者也指出,并非所有 4.7 的问题都是模型的问题,有些是用户使用方式的问题。在把一个模型判死刑之前,先弄清楚是哪类问题比较公平。
Opus 4.8 已全面可用,具体 API 速率限制以官方文档为准。