The Orchestration Tax：并行Agent的认知瓶颈

启动更多 AI Agent 现在非常容易。但 Addy Osmani 在 Google I/O panel 上提出的核心问题是：更多 Agent 运行，并不意味着有更多个你可用。

你的认知带宽不会并行化。所有需要真正理解架构、合并冲突、判断质量的审查工作，都必须路由到唯一的串行处理器——就是你自己。

Richard Seroter 在 panel 上给这个问题起了个名字："编排税"（The Orchestration Tax）。你不可能在自己的大脑里成功管理 20 个 Agent。

启动便宜，收尾昂贵

Agent 工作流中有一个隐藏的不对称性：

启动 Agent 非常便宜——一个按键或一句 prompt
闭环收尾 非常昂贵——必须有人检查结果是否正确，并与其他 Agent 的改动协调

那个人就是你。而且只有一个你。

Osmani 上个月写过一篇《Your parallel Agent limit》，讲的是不知道哪个并行线程正在悄悄失败的"环境焦虑"。而这篇文章讲的是焦虑底下的结构性成本。

你就是 GIL

如果你写过并发代码，你已经有正确的直觉——只是指向了系统的错误部分。

Python 有 GIL（全局解释器锁）。你可以启动任意多线程，但同一时间只有一个能执行 Python 字节码，因为它们必须获取锁。你就是你的 AI Agent 的 GIL。它们都可以同时运行，但当任何工作需要真正的架构理解或解决合并冲突时，都必须获取锁。只有一把锁。你持有它。

Amdahl 定律 让这一点非常精确：并行化的加速上限取决于无法并行的串行部分占比。如果你的 pipeline 有很大一块无法并行化，无论扔多少核心进去都会碰到硬上限。在 Agent 开发中，这个串行部分就是判断。启动 8 个 Agent 不会加速你的判断时间，只会让等待判断的队列变得更深。

优化非瓶颈部分不会增加吞吐量。你只是让未完成的工作堆积在瓶颈前面。Agent 优化的是从来不是约束点的部分。约束点是审查步骤，而你的系统吞吐量等于这个步骤的吞吐量。

编排税就是 Agent 产出与你实际能合并的产出之间的结构性差距。当你把单线程资源放在并发系统的中心时，就会发生这种情况。

更努力无法修复结构性限制

Osmani 说他在 panel 上提到："我从未感觉工具让我如此高效，但也从未如此疲惫。" 两半都是完全真实的，而且原因相同。

疲惫有非常具体的原因。这就是以 100% 利用率运行串行处理器、没有任何空闲的感觉。每次你检查一个离开过的 Agent，都要付出上下文切换成本。你清空大脑，从不同上下文冷启动重新加载。CPU 在微秒级做这件事，架构师还在努力避免。你在分钟级做这件事，而且永远无法完美重新加载上下文。

五个 Agent 不是 1 倍工作量做五次。而是 5 次冷加载，加上一个后台脑进程不断焦虑该检查哪个 Agent。

你无法通过更努力来修复结构性限制。税反正都要付。如果你试图硬扛，限制只会表现为浅层代码审查，或者经历"认知投降"——因为形成自己观点所需的注意力已经耗尽，你只能接受 Agent 的代码。你要么有意识地付税，要么让它悄悄摧毁你对自己系统的理解。

像设计并发系统一样设计注意力

Osmani 分享了一些实际有效的方法：

按审查速率扩展 Agent 数量，而不是按 UI

好的并发系统使用背压，让队列不会无限增长。生产者减速以匹配消费者。你的 Agent 数量是生产者，你的审查速率是消费者。对大多数人来说，合适的并行 Agent 数量是个位数。AI 工具很乐意让你启动 20 个，但那只是 UI 功能。

分类工作

保持两堆任务。一堆是可以委托给后台云 Agent 的孤立工作——可以异步运行，通常只需要你在最终关口把关。另一堆是判断本身就是工作的复杂任务——比如奇怪 bug 或架构设计。大错误是试图并行化第二堆。多个复杂任务不会扩展你的产出，只会让锁抖动，所有结果都变差。

批处理审查

上下文切换每次都很昂贵。一次性审查 4 个 Agent 比检查一个、离开做别的事、再冷启动回来便宜得多。给 Agent 长 leash，让工作堆积一点，然后批量处理。

只把锁花在判断上

不要浪费大脑在机器能自己验证的事情上。让 Agent 写通过测试或生成截图。它们自己能证明无聊的 80%，所以你只把稀缺的注意力花在真正需要人类的 20% 上。

保护你的串行时间

瓶颈需要你最优质的时段，而不是 Agent 检查间隙的剩余分钟。有时候最高杠杆的动作是完全停止编排，关掉装满 Agent 的笔记本，用整段时间深入思考一个单一问题。编排不是真正的工作，它是工作周围的 overhead。

忙碌 ≠ 高效

这一点非常重要，因为失败模式对你自己是不可见的。20 个运行中的 Agent 给你一种巨大生产力的感觉。仪表板满满当当，一切都在动。但这种感觉与真正向 main 分支交付好代码是脱钩的。你可以极度忙碌却几乎不产生任何东西。从内部感觉，两者完全相同。

Ciera Jaspan 在 panel 上提到了 Margaret-Anne Storey 关于认知债务的工作。我们谈论技术债务和认知债务。未支付的编排税让你同时积累两者——你合并了没有仔细读的东西，你对代码库的心智模型完全过时。今天仪表板上什么都不显示。它只在生产环境崩溃、你看着系统却意识到完全不知道它如何工作时才显现。

真正的技能

启动 Agent 不是技能。任何人都能运行 20 个。

真正的技能是围绕那个无法克隆或并行化的唯一串行资源设计系统。那个资源就是你的注意力。

像对待生产中依赖的其他任何东西一样架构它。