返回 FEED
AGENT2026-05-25

如何构建真正协作的 AI Agent 团队(完整课程)

大多数人构建一个 AI Agent,看着它在复杂任务上失败,然后得出结论 AI Agent 还没准备好。真正的问题是架构。

这个完整课程展示了构建多 Agent 系统的精确心智模型、团队结构、工具和生产模式,以产生可靠、高质量的输出。

核心思维转变

按任务思考,而不是按角色思考

构建多 Agent 系统时最常见的错误是复制人类组织架构。你创建一个"研究 Agent"、一个"写作 Agent"和一个"营销 Agent"——然后奇怪为什么输出不一致且难以调试。

改变一切的转变:按任务思考,而不是按角色思考。

AI Agent 在有一个明确目标、有限工具和精确指令的单一离散任务上表现最佳。一个职责广泛的 Agent 做出模糊的决定。一个任务狭窄的 Agent 产生一致、可靠的输出。

不是"内容 Agent",而是构建:

  • 研究任务 Agent —— 接收主题,返回结构化研究笔记
  • 简报撰写 Agent —— 接收研究笔记,返回内容简报
  • 草稿撰写 Agent —— 接收简报,返回完整草稿
  • 编辑 Agent —— 接收草稿,返回编辑版本和批评
  • 发布 Agent —— 接收最终副本,格式化并发布

每个 Agent 都简单、可测试、可替换。整个系统很强大。

MIT 和 Google Brain 的研究发现,当 Agent 辩论和批评彼此的输出时,推理质量和事实准确性都显著提高——即使一个 Agent 从错误答案开始,其他 Agent 的批评也会纠正轨迹。

四种核心 Agent 角色

每个有效的多 Agent 团队都有四种功能类别的 Agent。你不需要每个类别一个 Agent,但每个生产团队都需要覆盖所有四个功能。

1. 协调者(Orchestrator)

协调者接收顶级任务,将其分解为子任务,分配给正确的专业 Agent,收集输出,并综合最终结果。它从不做实际工作,只协调。

2. 研究者

研究者的唯一工作是查找、检索和结构化信息。它不写作、不分析、不创造——它收集。

3. 专业生产者

这些是工人,每个生产任务一个 Agent。常见的专业 Agent 包括:

  • 写作 Agent:接收简报,撰写草稿
  • 编码 Agent:接收需求,编写代码
  • 数据分析师 Agent:接收原始数据,返回洞察
  • 设计简报 Agent:接收概念,返回视觉设计简报
  • 外联 Agent:接收潜在客户数据,撰写个性化消息

4. 批评者/审阅者

这是大多数 Agent 系统中最被忽视的角色——也是对质量最重要的角色。批评者接收任何 Agent 的输出,根据定义的标准评估它,并返回具体的、可操作的反馈。

一个设计良好的批评者不会说"这很糟糕"。它会说:

  • "引言把主要主张埋在第三段。把它移到第一句。"
  • "第二段的主张没有根据。添加来源或删除它。"
  • "语气不一致——第 1-3 段是正式的,第 4-6 段是随意的。统一。"

批评者 Agent 是将产生平庸输出的多 Agent 系统与产生你自豪地发布的工作的系统区分开来的东西。

三种架构

架构 1:顺序(流水线)

Agent 一个接一个地运行。Agent A 的输出成为 Agent B 的输入。

输入 → 研究 Agent → 简报 Agent → 写作 Agent → 编辑 Agent → 输出

适用于:任务有清晰的线性流程。每个步骤依赖于前一个正确完成。

架构 2:并行(扇出)

协调者将任务拆分并同时发送给多个 Agent。所有 Agent 同时工作。协调者收集并综合结果。

适用于:任务可以划分为独立的并行工作流。显著减少总运行时间。

架构 3:分层(多层)

多层协调。顶级协调者管理中级协调者,每个中级协调者管理专业 Agent。

适用于:任务足够复杂,需要协调多个流水线,而不仅仅是多个 Agent。

工具栈

无代码/低代码(从这里开始)

  • Make(以前叫 Integromat):多 Agent 工作流的最佳可视化构建器
  • n8n:Make 的开源替代品,可自托管
  • Relevance AI:专门为多 Agent 系统构建

基于代码的框架(用于完全控制)

  • Claude API with tool use:直接用 Anthropic Claude API 构建 Agent
  • LangGraph:基于图的框架,节点是 Agent,边定义交接
  • Agno(以前叫 Phidata):专门设计用于构建具有分层协调的 Agent 团队
  • AutoGen(Microsoft):多 Agent 对话框架

五个可靠模式

模式 1:强制执行结构化输出

团队中的每个 Agent 都应该以定义的格式返回输出——不是自由形式的散文。这使交接可靠。

模式 2:Agent 之间的质量门

不要自动将每个输出传递给下一个 Agent。添加一个简单的评估步骤——协调者审查或专门的批评 Agent——在输出进入下游之前检查它。

模式 3:给 Agent 最小工具集

一个有 15 个工具的 Agent 会不一致地使用它们。一个有 2-3 个工具的 Agent 会可靠地使用它们。

模式 4:构建重试循环

每个生产 Agent 团队都需要重试机制。当 Agent 的输出未通过质量门时,它应该获得第二次机会,并带有具体反馈。

模式 5:记录一切

在生产中,每个 Agent 调用都应该记录:它接收的输入、它产生的输出、它调用的工具以及花费的时间。

快速启动:48 小时内构建你的第一个 Agent 团队

  • 第 1 小时:挑选你业务中一个需要三个或更多步骤的工作流,每个步骤都可以由不同的人完成。
  • 第 2 小时:为每个步骤编写系统提示,就像你在向新员工介绍一样:这是你的一个工作,这是你接收的,这是你确切必须返回的。
  • 第 3 小时:在 Make 或 n8n 中构建流水线。按顺序连接 Agent。
  • 第 4-6 小时:运行五个测试用例。找到流水线中断的地方。收紧最弱的提示。
  • 第 2 天:在最重要的步骤之后添加批评 Agent。再运行五个测试。比较输出质量。
  • 第 2 天晚上:把它放在真实任务面前。审查输出。迭代。

一个 Agent 运行一个任务。一个 Agent 团队运行一个业务。