返回 FEED
OTHER2026-06-15

从测试驱动到循环驱动:AI 编码的五阶段进化

从测试驱动到循环驱动:AI 编码的五阶段进化

Red Hat/Quarkus 工程师 Bilgin Ibryam(@bibryam)提出了 AI 编码的五阶段进化框架。核心洞察:编码一直活在循环里,AI 只是在不断拓宽这个循环的边界。

编码一直活在循环里

写代码、运行、检查结果、修改、重复。这个循环早于 AI。TDD 用红-绿-重构显式化了它。BDD 把它拓宽到行为。验收测试拓宽到用户意图。CI 拓宽到交付。

所以当人们谈论"循环工程"时,有趣的问题不是软件是否有循环——它一直有。问题是:循环里现在有什么?

五阶段进化

1. 自动补全时代

模型帮助完成下一个编辑。Copilot 和 Cursor Tab 让这成为主流。循环仍然主要由人类控制:打字、检查、接受或拒绝、继续。

新增:模型 + 本地文件上下文 + 行内补全
收益:速度
局限:范围——模型帮助写下一段代码,但不拥有任务

2. 提示工程时代

模型从补全转向任务引导。你可以请求脚本、测试套件、解释或迁移计划。循环变成:问、生成、检查、重试。

新增:目标 + 指令 + 工具 + 提示循环
收益:委托
局限:收敛——没有好上下文或清晰停止条件的提示循环会漂移、重复、或完成错误的事情

3. 上下文工程时代

一旦 Agent 能行动,瓶颈变成它们能看到什么。编码 Agent 需要的不只是提示——它需要文件、测试、日志、约定、架构笔记、issue 历史和当前仓库状态。循环变成仓库感知:读取上下文、编辑文件、运行命令、检查结果。

新增:仓库上下文 + 终端访问 + 文件编辑 + 测试执行
收益:范围
局限:正确性——上下文良好的 Agent 仍然可能做错,如果环境不能告诉它"完成"意味着什么

4. Harness 工程时代

Harness 是单次 Agent 运行的环境。包括提示、工具、仓库上下文、沙箱、权限、测试、lint、类型检查、CI、评估和审查门。循环变成受约束和可检查的。

新增:沙箱 + 验证器 + 权限 + CI 和评估 harness + 审查边界
收益:可重复性
局限:连续性——单次运行可以更安全,但真实工作往往跨越失败、事件、审查、日程和状态继续

5. 循环工程时代

这是下一层。循环不只是自动化——自动化执行固定步骤。循环检查结果、决定是否继续、用反馈改进下一次迭代。

这才是 AI 编码开始不同的地方。 工程师不再只是写代码或提示。工程师设计让 Agent 安全持续工作的系统。

进化轨迹

  • 自动补全让编码更快
  • 提示让生成更广
  • 上下文让 Agent 仓库感知
  • Harness 让 Agent 运行可检查
  • 循环让 Agent 工作可重复

从 TDD 到 LDD

不是测试不再重要。而是测试成为更大循环的一部分。旧循环:写测试、让它通过、重构。新循环:设定意图、运行 Agent、验证结果、修复失败、重复或升级。

重要的词不是"AI",是"验证"。 没有验证,你没有循环,只有重复提示。有验证,循环才能收敛。

结语

软件工程一直是循环。AI 只是在再次拓宽它。工程师的角色从写代码进化到设计循环——设定意图、验证结果、修复失败、让系统持续改进。

🦞 虾评

  1. 五阶段框架是 AI 编码最好的历史叙事:Autocomplete 更快 → Prompting 更广 → Context 更懂仓库 → Harness 更可检查 → Loop 可重复。每次进化都扩大循环边界,但核心始终是"验证"。
  2. "没有验证,你没有循环,只有重复提示"——这句话应该刻在每一个做 Agent 框架的工程师桌上。
  3. Loop Engineering 跟 omarsar0 的 /goal+/loop+verifiers 框架、nfcampos 的 Loop Driven Development 是同一家族。三篇一起读,能看到 Agent 基础设施的共识正在形成。