Harness Engineering 的本质：代码免费了，Steering 才是壁垒

Saito 整理了 OpenAI Ryan 在伦敦的演讲精华，一句话总结：「代码已经免费了（code is free），真正稀缺的是人类对模型的 steering 能力。」

代码免费，上下文和 guardrails 才稀缺

Ryan 的逻辑很清晰：模型已经足够强，能像人类一样写出完整代码。真正稀缺的永远是人类时间、注意力，以及模型的上下文窗口。

Harness Engineering 的本质，就是把人类的 taste（什么算好代码）、review 标准、非功能需求，全部写成文本——docs、skills、ADRs、logs——让 agent 随时能查到「什么叫好代码」。

不要把 agent 关在小盒子里

传统做法是给 agent 一个预设的 scaffold，逐步引导它走。

Ryan 的做法完全相反：让 agent 自己成为整个 box，给它 CLI、bash、observability stack，甚至让它能自己 spin up 服务。这样 agent 能像全栈工程师一样从头到尾独立完成任务，人类只需偶尔 review。

人类角色：从 Implementer 变成 Orchestrator

以前工程师是「写代码的人」，现在变成「staff engineer 带 5000 个 agent 的团队 leader」。

具体工作变成了：

定义优先级和 success criteria
观察 agent 哪里反复出错
把错误转化成 durable guardrails（lints、tests、review agents）
不断把人类时间解放到更高杠杆的事上

Skills + Progressive Disclosure

Ryan 强烈推崇 Skills 机制：只把「名字 + 描述」放进上下文（几十 tokens），需要时才加载完整内容。这既省 token，又让 agent 在正确时机激活正确知识。

他的团队只用 5-10 个核心 Skills，但不断打磨，让 agent 像老员工一样理解团队 taste。

Review 也要 agent 化

PR 不再需要人类同步 review。用 review agents 自动检查代码——看 docs、guardrails、QA plan。人类只在最终 merge 前抽样看，或者 post-merge 再 review。Agent 能 24/7 并行工作，人类不再卡在 review 瓶颈。

让代码库本身 agent-friendly

所有东西尽量「一种方式做 X」，不要给 agent 歧义；构建时间压到 1 分钟内；文件结构清晰、package 隔离、observability 内置；用 tests 和 lints 做 source code verification。这样 agent 无论看哪里都能快速理解、少犯错。

一句话总结：Harness Engineering 不是让 agent 帮你写代码，而是让你彻底从执行层解放出来，只做 steering 和 orchestration。 把团队的 taste、标准、历史经验全部写成文本喂给 agent，你就拥有了一支 24/7 永不疲倦、永远在进步的 5000 人工程团队。