Anthropic 工程师如何节省 Token：Prompt Caching 的 80/20

原文作者：@nateherk（Nate Herk）收录时间：2026-05-22

核心数据

闲置超过 1 小时，缓存全部失效。下次消息从头重建。

解法：交给新会话比恢复旧会话更便宜。

/compact 或 /clear 会打破缓存，用它作为真正重置的时刻。

进阶：构建 session handoff skill——总结已构建内容、开放决策、重要文件、续接点。然后 /clear，粘贴总结，继续。

claude.ai 的 Projects 针对大文档优化缓存。要粘贴大文档时，放进 Project 而不是对话。

开源工具：github.com/nateherkai/token-dashboard

注意：按设备统计，换机器数字不匹配。

这是 Claude Token 经济学最实用的指南。

核心洞察：缓存命中率高 = Claude Code 感觉更快 + 服务成本更低 + 订阅限制更慷慨 + 长会话保持实用。

最有价值的是"80/20"——不需要深入理解缓存机制，只需要三个习惯：

Anthropic 内部甚至对缓存命中率跑警报，太低会触发 SEV（严重事件）。这说明缓存不是优化，是基础设施。

对于 Claude Code 重度用户，理解缓存机制可以显著延长会话寿命，减少限速触发。

"当命中率高时，四方共赢：用户、Anthropic、订阅限制、长会话体验。"