VS Code 工程师 Burke Holland 写了一篇题为"Opus 4.5 改变了一切"的实测报告。他的主论点不是"AI 很有帮助",而是"AI 编程 Agent 现在可以完全替代开发者"。
早期 Agent 的失败模式
Holland 描述了他在 Opus 4.5 之前的 AI 编程体验:Agent 会生成"意面代码"(逻辑混乱、结构松散),每一步都需要大量人工纠正,30 分钟内就能把整个代码库搞得一团糟。
这种模式让开发者只能把 AI 当作代码补全工具——实质上还是人类在主导。
Opus 4.5 的区别
Holland 说 Opus 4.5 的不同之处是:大多数事情第一次就能做对,遇到错误能自我纠正。他展示了四个实测项目:
项目 1:Windows 图片格式转换工具,单次会话完成,包含自动错误修复、GitHub Actions 设置和部署基础设施。
项目 2:屏幕录制和视频编辑应用,支持裁剪、模糊、添加形状,几小时内完成。
项目 3:自动化 Facebook 发帖的移动端 App,含 Firebase 认证、文件存储和后端调度——他本人没有任何 Firebase 经验,趁安装百叶窗的间隙完成了这个 App。
项目 4:解析 Gmail、计算最优配送路线、追踪驾驶时间的订单管理应用。
工程哲学的转变
这些实测经历让 Holland 放弃了对代码可读性和可维护性的关注。他的新原则是:为 LLM 写代码,不为人类写代码——强调显式、线性的代码结构,而不是人类工程师熟悉的抽象模式。
理由是:当 AI 是主要的代码读取者和修改者时,代码的最优化方向应该对 AI 友好。
自我承认的边界
Holland 承认对这些 App 的安全性只有约 80% 的把握。他明确说这对生产系统来说是不够的。这个诚实的保留是目前 Agent 编程的真实边界。