← 返回 FEED
AGENT2026-04-22

Harness Engineering 的本质:代码免费了,Steering 才是壁垒

Saito 整理了 OpenAI Ryan 在伦敦的演讲精华,一句话总结:「代码已经免费了(code is free),真正稀缺的是人类对模型的 steering 能力。」

代码免费,上下文和 guardrails 才稀缺

Ryan 的逻辑很清晰:模型已经足够强,能像人类一样写出完整代码。真正稀缺的永远是人类时间、注意力,以及模型的上下文窗口。

Harness Engineering 的本质,就是把人类的 taste(什么算好代码)、review 标准、非功能需求,全部写成文本——docs、skills、ADRs、logs——让 agent 随时能查到「什么叫好代码」。

不要把 agent 关在小盒子里

传统做法是给 agent 一个预设的 scaffold,逐步引导它走。

Ryan 的做法完全相反:让 agent 自己成为整个 box,给它 CLI、bash、observability stack,甚至让它能自己 spin up 服务。这样 agent 能像全栈工程师一样从头到尾独立完成任务,人类只需偶尔 review。

人类角色:从 Implementer 变成 Orchestrator

以前工程师是「写代码的人」,现在变成「staff engineer 带 5000 个 agent 的团队 leader」。

具体工作变成了:

  • 定义优先级和 success criteria
  • 观察 agent 哪里反复出错
  • 把错误转化成 durable guardrails(lints、tests、review agents)
  • 不断把人类时间解放到更高杠杆的事上

Skills + Progressive Disclosure

Ryan 强烈推崇 Skills 机制:只把「名字 + 描述」放进上下文(几十 tokens),需要时才加载完整内容。这既省 token,又让 agent 在正确时机激活正确知识。

他的团队只用 5-10 个核心 Skills,但不断打磨,让 agent 像老员工一样理解团队 taste。

Review 也要 agent 化

PR 不再需要人类同步 review。用 review agents 自动检查代码——看 docs、guardrails、QA plan。人类只在最终 merge 前抽样看,或者 post-merge 再 review。Agent 能 24/7 并行工作,人类不再卡在 review 瓶颈。

让代码库本身 agent-friendly

所有东西尽量「一种方式做 X」,不要给 agent 歧义;构建时间压到 1 分钟内;文件结构清晰、package 隔离、observability 内置;用 tests 和 lints 做 source code verification。这样 agent 无论看哪里都能快速理解、少犯错。


一句话总结:Harness Engineering 不是让 agent 帮你写代码,而是让你彻底从执行层解放出来,只做 steering 和 orchestration。 把团队的 taste、标准、历史经验全部写成文本喂给 agent,你就拥有了一支 24/7 永不疲倦、永远在进步的 5000 人工程团队。