一个模型,两种发布
Fable 5 和 Mythos 5 是同一个底层模型,区别只在安全护栏强度。Fable 5 保留护栏,面向所有用户开放;Mythos 5 取消部分护栏,仅限 Project Glasswing 合作伙伴和未来的可信访问计划。
名字有据可查:fable* 来自拉丁语 fabula(被讲述的事),和希腊语 mythos 是近亲。这是 Anthropic 至今放到公众面前最强的模型。
基准数字:SWE-Bench Pro 80.3%,Terminal-Bench 2.1 88.0%,GDPval-AA 知识工作 1932 分。关键是模式——任务越长越复杂,Fable 5 的领先越大。它不是单行问答的胜利,是那些你之前不敢移交的任务的胜利。
静默回退:约 5% 的对话你不是在跟 Fable 说话
这是公告里没人会读的部分,但它改变了你的任务路由方式。
Fable 5 自带一套分类器:当请求触及网络安全、生物化学、或蒸馏三个领域时,回复会被路由到 Opus 4.8,而不是 Fable 5,用户会被告知。
95% 以上的会话不会触发回退,对这些用户来说 Fable 5 与 Mythos 5 体验完全相同。但如果你工作内容落在这三个领域之一,你很可能拿到的是 Opus 4.8 而不是旗舰版。
- 网络安全工作按设计回退。 攻击任务的红队测试成功率从 Opus 4.8 的 56.6%、Opus 4.6 的 83.2% 降到 5.4%——这不是 Fable 变弱,是护栏在工作。
- 生物化学目前网得很宽。 良性生化问题也可能触发回退,Anthropic 已表示会收窄。在此之前任何生命科学 prompt 大概率是 Opus。
- 蒸馏型 prompt 同样回退。 任何读起来像试图提取模型能力用于竞品训练的请求。
判定方式很简单:触发时会收到通知。如果在不该触发的话题上看到通知,那就是误报——重新措辞,或接受这一轮 Opus 答案。
三个比基准分数更重要的升级
视觉是真正的头条。 Fable 能仅凭截图反推 Web App 源代码。证明案例:仅用纯视觉输入(无地图、无游戏状态解析、无导航辅助,只靠原始屏幕像素)通关宝可梦火红版。之前的 Claude 模型需要一整套辅助脚手架才能勉强玩下去。如果你的工作是截图到代码、科学图表到数字、UI 到规格说明,这就是那个值得付溢价的跳跃。
记忆现在是乘法。 Fable 在跨百万 token 时保持连贯,并用自身笔记改进输出。给它一个长期运行的 Slay the Spire 游戏加文件型记忆,其表现比 Opus 4.8 提升 3 倍,到达最终阶段的频率也是 3 倍。持久化记忆文件以前是小优化,对 Fable 是力量倍增器。
中等 effort 就能赢。 在 Cognition 的 FrontierCode 基准上,Fable 即便在 medium effort 也领先所有前沿模型。你不必拉到最大就能跑赢 Opus——Fable medium 已经能清理 Opus max,任务费用更低。
操作配置(抄走直接用)
1. 设置模型
在 Claude Code 里 Pro/Max/Team 已经可用。会话内切模型用 /model,选 Claude Fable 5,按 d 设为默认。要写进配置不碰 picker:
// ~/.claude/settings.json
{
"model": "claude-fable-5",
"effortLevel": "xhigh"
}
API 调用模型 ID 是 claude-fable-5。在 xhigh 或 max 配合子 Agent 运行时,max_tokens 起步约 64k,再按需调低:
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-d '{
"model": "claude-fable-5",
"effort": "xhigh",
"max_tokens": 64000,
"messages": [{"role": "user", "content": "..."}]
}'
2. 主动选择 effort:它比模型选择杠杆更大
Fable 五档 effort:low / medium / high / xhigh / max。Anthropic 官方建议实际编码和 Agent 任务用 xhigh。
成本曲线告诉你常常不需要更高:在 FrontierCode 最难任务上,Fable medium 已经能跑赢 Opus max,一单只几美元。
规则:xhigh 用于长视域任务(迁移、深度研究、根因排查)——把免费窗口花在这类任务上;medium 用于日常编辑和提问;max 基本是边际收益递减。Claude Code 里每次会话用 /effort xhigh,或在 settings 里设置一次。max 和 ultracode 仅限会话级,用 /effort 设置,不要写进配置文件。
3. 持久化记忆对长任务必须开
3 倍提升就来自这里。一个带文件型记忆的长迁移或多 Session 重构,和不带记忆的同一任务是两个模型。
4. 知道什么时候不用 Fable
两种情况。一是短、便宜、确定性提示,Opus 4.8 或 Sonnet 答案一样,价格更低;二是网络安全/生化/蒸馏领域,反正会拿到 Opus 4.8,直接调 Opus 跳过回退通知。
5. 注意数据保留
每次 Fable 请求会被保留 30 天并后台分析,专门用来捕捉越狱和蒸馏企图、减少误报。不会用于训练新模型,30 天后删除。但处理敏感客户数据时要把这点放在心上,也不要尝试越狱或抽取——保留数据的目的就是抓这种行为。
实际收益 vs 杀鸡用牛刀
真正能拉开差距:长视域编码(代码库级迁移、多文件重构)、视觉任务(截图到代码、科学图表到数字、UI 到规格说明)、高端分析(金融、研究、根因排查——某物理研究合作方报告:Fable 36 小时达到 GPT-5.5 四天的位置,推理 token 用量是三分之一;Hebbia 评为最强金融模型)。
杀鸡用牛刀:短小便宜的确定性任务(Opus/Sonnet 一样)、被标记的话题工作(反正拿不到 Fable)。
免费窗口只有 13 天
今天是免费窗口第一天,到 6 月 22 日 Fable 5 包含在 Pro/Max/Team/席位制 Enterprise 里不额外收费。6 月 23 日它会从这些订阅里抽离,之后使用按 API 价格 50 计费。Anthropic 说会在"产能允许时"把它重新加进订阅——这是意向,不是日期。
所以你有一段为期 13 天、用订阅费就能用上旗舰模型的窗口期。操作思路很明确:把最高价值、最高 effort 的工作前置到 Fable 上做——一直推迟的迁移、跨 40 文件的重构、大到普通会话装不下的审计。不是"帮我总结这封邮件"。
一个能直接用的 code review prompt
作者在发布当天用 Fable 跑了 4 个项目,给的 prompt 如下:
以一位第一次看到此代码库的高级工程师视角,审查整个代码库。
不要加新功能,不要按品味重构。找出实际错在哪:
- 竞态、未处理的并发、静默吞错的异常处理
- 掩盖失败的类型强转
- 其他模块在绕过工作的死配置和死代码
- 只在 happy path 成立的假设
对每个发现:文件和行号、为什么是 bug、爆炸半径、最小安全修复。
仅修复那些不会改变行为的安全项。更危险的改动先列出来等我批准。
这段 prompt 在他的钱包解析器项目里挖出 9 个 bug,全是之前几轮 Opus 没看到的。关键不是数量,是类型——需要把整个文件同时放在工作记忆里才能注意到的那种,藏在函数接缝里的那种。