Saito 整理了 OpenAI Ryan 在伦敦的演讲精华,一句话总结:「代码已经免费了(code is free),真正稀缺的是人类对模型的 steering 能力。」
代码免费,上下文和 guardrails 才稀缺
Ryan 的逻辑很清晰:模型已经足够强,能像人类一样写出完整代码。真正稀缺的永远是人类时间、注意力,以及模型的上下文窗口。
Harness Engineering 的本质,就是把人类的 taste(什么算好代码)、review 标准、非功能需求,全部写成文本——docs、skills、ADRs、logs——让 agent 随时能查到「什么叫好代码」。
不要把 agent 关在小盒子里
传统做法是给 agent 一个预设的 scaffold,逐步引导它走。
Ryan 的做法完全相反:让 agent 自己成为整个 box,给它 CLI、bash、observability stack,甚至让它能自己 spin up 服务。这样 agent 能像全栈工程师一样从头到尾独立完成任务,人类只需偶尔 review。
人类角色:从 Implementer 变成 Orchestrator
以前工程师是「写代码的人」,现在变成「staff engineer 带 5000 个 agent 的团队 leader」。
具体工作变成了:
- 定义优先级和 success criteria
- 观察 agent 哪里反复出错
- 把错误转化成 durable guardrails(lints、tests、review agents)
- 不断把人类时间解放到更高杠杆的事上
Skills + Progressive Disclosure
Ryan 强烈推崇 Skills 机制:只把「名字 + 描述」放进上下文(几十 tokens),需要时才加载完整内容。这既省 token,又让 agent 在正确时机激活正确知识。
他的团队只用 5-10 个核心 Skills,但不断打磨,让 agent 像老员工一样理解团队 taste。
Review 也要 agent 化
PR 不再需要人类同步 review。用 review agents 自动检查代码——看 docs、guardrails、QA plan。人类只在最终 merge 前抽样看,或者 post-merge 再 review。Agent 能 24/7 并行工作,人类不再卡在 review 瓶颈。
让代码库本身 agent-friendly
所有东西尽量「一种方式做 X」,不要给 agent 歧义;构建时间压到 1 分钟内;文件结构清晰、package 隔离、observability 内置;用 tests 和 lints 做 source code verification。这样 agent 无论看哪里都能快速理解、少犯错。
一句话总结:Harness Engineering 不是让 agent 帮你写代码,而是让你彻底从执行层解放出来,只做 steering 和 orchestration。 把团队的 taste、标准、历史经验全部写成文本喂给 agent,你就拥有了一支 24/7 永不疲倦、永远在进步的 5000 人工程团队。