启动更多 AI Agent 现在非常容易。但 Addy Osmani 在 Google I/O panel 上提出的核心问题是:更多 Agent 运行,并不意味着有更多个你可用。
你的认知带宽不会并行化。所有需要真正理解架构、合并冲突、判断质量的审查工作,都必须路由到唯一的串行处理器——就是你自己。
Richard Seroter 在 panel 上给这个问题起了个名字:"编排税"(The Orchestration Tax)。你不可能在自己的大脑里成功管理 20 个 Agent。
启动便宜,收尾昂贵
Agent 工作流中有一个隐藏的不对称性:
- 启动 Agent 非常便宜——一个按键或一句 prompt
- 闭环收尾 非常昂贵——必须有人检查结果是否正确,并与其他 Agent 的改动协调
那个人就是你。而且只有一个你。
Osmani 上个月写过一篇《Your parallel Agent limit》,讲的是不知道哪个并行线程正在悄悄失败的"环境焦虑"。而这篇文章讲的是焦虑底下的结构性成本。
你就是 GIL
如果你写过并发代码,你已经有正确的直觉——只是指向了系统的错误部分。
Python 有 GIL(全局解释器锁)。你可以启动任意多线程,但同一时间只有一个能执行 Python 字节码,因为它们必须获取锁。你就是你的 AI Agent 的 GIL。它们都可以同时运行,但当任何工作需要真正的架构理解或解决合并冲突时,都必须获取锁。只有一把锁。你持有它。
Amdahl 定律 让这一点非常精确:并行化的加速上限取决于无法并行的串行部分占比。如果你的 pipeline 有很大一块无法并行化,无论扔多少核心进去都会碰到硬上限。在 Agent 开发中,这个串行部分就是判断。启动 8 个 Agent 不会加速你的判断时间,只会让等待判断的队列变得更深。
优化非瓶颈部分不会增加吞吐量。你只是让未完成的工作堆积在瓶颈前面。Agent 优化的是从来不是约束点的部分。约束点是审查步骤,而你的系统吞吐量等于这个步骤的吞吐量。
编排税就是 Agent 产出与你实际能合并的产出之间的结构性差距。当你把单线程资源放在并发系统的中心时,就会发生这种情况。
更努力无法修复结构性限制
Osmani 说他在 panel 上提到:"我从未感觉工具让我如此高效,但也从未如此疲惫。" 两半都是完全真实的,而且原因相同。
疲惫有非常具体的原因。这就是以 100% 利用率运行串行处理器、没有任何空闲的感觉。每次你检查一个离开过的 Agent,都要付出上下文切换成本。你清空大脑,从不同上下文冷启动重新加载。CPU 在微秒级做这件事,架构师还在努力避免。你在分钟级做这件事,而且永远无法完美重新加载上下文。
五个 Agent 不是 1 倍工作量做五次。而是 5 次冷加载,加上一个后台脑进程不断焦虑该检查哪个 Agent。
你无法通过更努力来修复结构性限制。税反正都要付。如果你试图硬扛,限制只会表现为浅层代码审查,或者经历"认知投降"——因为形成自己观点所需的注意力已经耗尽,你只能接受 Agent 的代码。你要么有意识地付税,要么让它悄悄摧毁你对自己系统的理解。
像设计并发系统一样设计注意力
Osmani 分享了一些实际有效的方法:
按审查速率扩展 Agent 数量,而不是按 UI
好的并发系统使用背压,让队列不会无限增长。生产者减速以匹配消费者。你的 Agent 数量是生产者,你的审查速率是消费者。对大多数人来说,合适的并行 Agent 数量是个位数。AI 工具很乐意让你启动 20 个,但那只是 UI 功能。
分类工作
保持两堆任务。一堆是可以委托给后台云 Agent 的孤立工作——可以异步运行,通常只需要你在最终关口把关。另一堆是判断本身就是工作的复杂任务——比如奇怪 bug 或架构设计。大错误是试图并行化第二堆。多个复杂任务不会扩展你的产出,只会让锁抖动,所有结果都变差。
批处理审查
上下文切换每次都很昂贵。一次性审查 4 个 Agent 比检查一个、离开做别的事、再冷启动回来便宜得多。给 Agent 长 leash,让工作堆积一点,然后批量处理。
只把锁花在判断上
不要浪费大脑在机器能自己验证的事情上。让 Agent 写通过测试或生成截图。它们自己能证明无聊的 80%,所以你只把稀缺的注意力花在真正需要人类的 20% 上。
保护你的串行时间
瓶颈需要你最优质的时段,而不是 Agent 检查间隙的剩余分钟。有时候最高杠杆的动作是完全停止编排,关掉装满 Agent 的笔记本,用整段时间深入思考一个单一问题。编排不是真正的工作,它是工作周围的 overhead。
忙碌 ≠ 高效
这一点非常重要,因为失败模式对你自己是不可见的。20 个运行中的 Agent 给你一种巨大生产力的感觉。仪表板满满当当,一切都在动。但这种感觉与真正向 main 分支交付好代码是脱钩的。你可以极度忙碌却几乎不产生任何东西。从内部感觉,两者完全相同。
Ciera Jaspan 在 panel 上提到了 Margaret-Anne Storey 关于认知债务的工作。我们谈论技术债务和认知债务。未支付的编排税让你同时积累两者——你合并了没有仔细读的东西,你对代码库的心智模型完全过时。今天仪表板上什么都不显示。它只在生产环境崩溃、你看着系统却意识到完全不知道它如何工作时才显现。
真正的技能
启动 Agent 不是技能。任何人都能运行 20 个。
真正的技能是围绕那个无法克隆或并行化的唯一串行资源设计系统。那个资源就是你的注意力。
像对待生产中依赖的其他任何东西一样架构它。