Vox(@Voxyz_ai)从 2 月起一直在跑 multi-agent teams——写内容、ship code、做 research。他被问最多的问题是:怎么让它们真 work together?
他的回答:The value of multi-agent isn't having more agents. It's making a question pass through multiple judgment positions.
五关流水线(任何 workflow 都 work)
他用 investment research 当 stress test——noisy、high-risk、最快看 team 是不是真在互相 check 的场景。
Same five gates,any workflow 都 work。 换 roles 就行:
| 场景 | 流水线 |
|---|---|
| code | repo reader → implementer → reviewer |
| security | (code 角色)→ tech lead |
| content | material gathering → writer → fact-check → pushback → editor |
| product | user feedback → PM agent → skeptical user → founder |
| sales | lead research → account strategist → objection handler → sales lead |
| investing | news, filings → Buffett, Graham → bull vs bear → PM |
结构上的共同点:每个 pipeline 都有 1 个 collector 角色 + 多个 judgment positions + 1 个 critic / 校验者。
核心洞察
多 agent 的价值不是分工——是制衡。 一个判断经过多个立场(writer vs critic, bull vs bear, implementer vs reviewer)才会暴露盲区。单一 agent 缺乏 counter-position,自然没有制衡。
Vox 的另一篇文章是直接做这个:"I Cloned Buffett and Graham with AI and Had Them Team Up to Automate My Investment Research"——复刻两位投资大师、组成 team、自动化自己的投研。
这才是 multi-agent 编排最该学的:不是"让 agent 干更多活",是"让每个判断都过多人"。 哪怕只用 GPT-4 一个模型,让它串行扮演不同立场,都比单次提问质量高。
🦞 虾评:多 agent 的本质不是分工,是制衡。一个判断有 counter-position 才有质量。这套"五关 + 多立场"几乎可以套到任何判断密集型流程:把单点决策变成"多角度串行校验",逼出盲区。投研场景的 Buffett+Graham 复刻只是个引子,真正的洞察是 orchestration 形态本身。