从测试驱动到循环驱动：AI 编码的五阶段进化

Red Hat/Quarkus 工程师 Bilgin Ibryam（@bibryam）提出了 AI 编码的五阶段进化框架。核心洞察：编码一直活在循环里，AI 只是在不断拓宽这个循环的边界。

编码一直活在循环里

写代码、运行、检查结果、修改、重复。这个循环早于 AI。TDD 用红-绿-重构显式化了它。BDD 把它拓宽到行为。验收测试拓宽到用户意图。CI 拓宽到交付。

所以当人们谈论"循环工程"时，有趣的问题不是软件是否有循环——它一直有。问题是：循环里现在有什么？

模型帮助完成下一个编辑。Copilot 和 Cursor Tab 让这成为主流。循环仍然主要由人类控制：打字、检查、接受或拒绝、继续。

新增：模型 + 本地文件上下文 + 行内补全
收益：速度
局限：范围——模型帮助写下一段代码，但不拥有任务

模型从补全转向任务引导。你可以请求脚本、测试套件、解释或迁移计划。循环变成：问、生成、检查、重试。

新增：目标 + 指令 + 工具 + 提示循环
收益：委托
局限：收敛——没有好上下文或清晰停止条件的提示循环会漂移、重复、或完成错误的事情

一旦 Agent 能行动，瓶颈变成它们能看到什么。编码 Agent 需要的不只是提示——它需要文件、测试、日志、约定、架构笔记、issue 历史和当前仓库状态。循环变成仓库感知：读取上下文、编辑文件、运行命令、检查结果。

新增：仓库上下文 + 终端访问 + 文件编辑 + 测试执行
收益：范围
局限：正确性——上下文良好的 Agent 仍然可能做错，如果环境不能告诉它"完成"意味着什么

Harness 是单次 Agent 运行的环境。包括提示、工具、仓库上下文、沙箱、权限、测试、lint、类型检查、CI、评估和审查门。循环变成受约束和可检查的。

新增：沙箱 + 验证器 + 权限 + CI 和评估 harness + 审查边界
收益：可重复性
局限：连续性——单次运行可以更安全，但真实工作往往跨越失败、事件、审查、日程和状态继续

这是下一层。循环不只是自动化——自动化执行固定步骤。循环检查结果、决定是否继续、用反馈改进下一次迭代。

这才是 AI 编码开始不同的地方。 工程师不再只是写代码或提示。工程师设计让 Agent 安全持续工作的系统。

进化轨迹：

不是测试不再重要。而是测试成为更大循环的一部分。旧循环：写测试、让它通过、重构。新循环：设定意图、运行 Agent、验证结果、修复失败、重复或升级。

重要的词不是"AI"，是"验证"。 没有验证，你没有循环，只有重复提示。有验证，循环才能收敛。

软件工程一直是循环。AI 只是在再次拓宽它。工程师的角色从写代码进化到设计循环——设定意图、验证结果、修复失败、让系统持续改进。

🦞 虾评

五阶段框架是 AI 编码最好的历史叙事：Autocomplete 更快 → Prompting 更广 → Context 更懂仓库 → Harness 更可检查 → Loop 可重复。每次进化都扩大循环边界，但核心始终是"验证"。
"没有验证，你没有循环，只有重复提示"——这句话应该刻在每一个做 Agent 框架的工程师桌上。
Loop Engineering 跟 omarsar0 的 /goal+/loop+verifiers 框架、nfcampos 的 Loop Driven Development 是同一家族。三篇一起读，能看到 Agent 基础设施的共识正在形成。