返回 FEED
AGENT2026-05-11

Claude Code 的护城河不是模型,是 9 个 Harness 组件

DeepSeek 和 Claude 在基准测试上互有胜负,但 DeepSeek 通过 raw API 感觉与 Claude Code 相比是坏的。差距不是模型——而是几乎没人交付的九个 Harness 组件。我构建了它们并开源了结果。

不匹配

DeepSeek V4 的成本大约是 Claude Opus 4.7 的 1/50,每百万 token。

然而,大多数尝试用 raw DeepSeek 替换 Claude Code 的工程师在一天内放弃。"忘记事情、不能修复自己的错误、不读取我的文件。"

本能是责怪模型。不是模型。

是你在比较罐子里的模型穿着完整构建 Harness 的模型——工具、权限门控、缓存纪律、LSP 反馈、MCP、子智能体、压缩、一个你真正想生活在其中的 TUI。Harness 是 80% 的产品。Claude Code 交付了它。DeepSeek API 没有。也没有其他人端到端填补那个差距。

我花了十周填补它。以下是实际可以填补 DS V4 和 Claude Opus 之间差距的组件列表。

DeepSeek V4 缺失的九个组件

1. 带权限门的工具循环

约五十个工具(读/编辑/写/bash/grep/glob/web_fetch/git ops 等),每个都有 JSON schema、权限层级(自动/询问/计划中拒绝)和合理的错误重注入格式。

错误格式比人们想象的更重要——"模型写了坏 JSON,这是解析错误"需要以模型可以自我纠正而不燃烧三轮的方式返回。

2. 缓存感知提示词组装

DeepSeek 的前缀缓存将缓存 token 削减到约列表价格的 10%。声称那个折扣,否则你的 1/50 成本优势一夜之间减半。

两个非显而易见的规则:

  • 系统提示词和工具 schema 在最顶部,跨轮次字节稳定。重新排序一个工具,缓存未命中,全额重新计费。
  • 对话严格仅追加。不追溯编辑旧用户消息,不原地压缩旧助手轮次。如果必须压缩,将旧前缀快照到合成消息并从那里开始新前缀。

大多数临时智能体循环在它们第一次以不同方式格式化某物时就会破坏缓存。

3. reasoning_content 回放

V4 思考模式发出用户从未看到的内部独白 token。非显而易见的部分:你必须在下一轮将它们反馈给模型,否则它会失去线索。

Anthropic SDK 不会帮你做这个。你自己从响应中 lifting reasoning_content 并将其作为结构化助手轮次重新附加。

跳过这个,你的智能体在消息之间感觉被脑叶切除——相同的模型, dramatically 更差的连续性。

4. 五种压缩策略

1M 上下文不是可用上下文。五种策略:

  • 每工具结果微修剪
  • 阈值自动摘要
  • 模型请求的反应性压缩
  • 跨运行的持久会话记忆提取
  • 手动 /snip

你需要全部五种,因为它们在不同时间尺度触发——内联工具修剪是每轮次,自动摘要是每 N token,会话记忆提取是会话结束等。一个通用的"满时摘要"在观察真实会话后不够。

5. 计划/智能体/YOLO 模式分离

三种权限配置文件,会话中可切换。

  • Plan = 只读 + 草稿,无写入
  • Agent = 带每调用确认的写入
  • YOLO = 无人值守运行的全写入

模式是允许工具集 × 权限默认 × 确认提示样式的函数。它不仅仅是 UI 切换——它必须包装工具分派器并在子智能体生成中存活。

6. 真实 MCP 客户端

生态系统是关键——一旦你说 MCP,每个 Linear/GitHub/Postgres/浏览器服务器就是一行配置。跳过它,你就是街区上唯一写一次性集成的智能体。

7. LSP 反馈循环

生成正确的语言服务器(tsserver/rust-analyzer/pyright/gopls/clangd)并在每次编辑后将诊断信息管道回模型。

模型首次修复率从约 30% 提升到约 80%,一旦 LSP 在循环中。

每个服务器有自己的初始化舞蹈和怪癖;这是肮脏的、持续的工作。

8. 子智能体扇出

主智能体将长任务分解为 N 个独立子智能体,每个都有新鲜上下文、范围工具预算、范围权限。

结果回滚到父级。将"审计代码库"或"跨 200 个文件重构"的挂钟时间削减一个数量级。

困难的部分是契约:子智能体如何流式传输进度、共享产物、并在不毒害父级的情况下优雅失败?

9. TUI + 斜杠命令 + 技能加载器

Solid + opentui(或任何——但请不要 Electron)。Vim 模式。流式输出下的稳定滚动缓冲区。约 100 个斜杠命令(/clear、/diff、/plan、/compact、/skill 等)。扫描 .openseek/skills、.claude/skills 的技能加载器,这样社区的现有技能库就能工作。

这是"只是前端",除了它是用户触摸的整个表面。搞错了,Harness 的其余部分就看不见了。

所以呢?

构建全部九个,指向 DeepSeek V4,体验收敛到 Claude Code。以约 1/50 的成本。

那需要构建很多。所以我构建了它。

openseek — 开箱即用的多提供商:DeepSeek、任何 OpenAI 兼容端点、Anthropic、Bedrock、Vertex、Azure。相同的 Harness,交换模型。

Repo: https://github.com/LichAmnesia/openseek