CyrilXBT 发布了一份从零搭建 Claude 多 Agent 内容生产系统的完整指南。核心前提很简单:专家团队协作永远胜过单打独斗的通才——对 AI Agent 和人类组织都一样。
为什么需要四个 Agent
四个 Agent 覆盖了知识工作的完整周期:信息摄入与研究、内容生产、质量控制、输出分发。
一个 Agent 在同一会话里切换这四个阶段,上下文不断漂移,质量标准互相冲突,模型同时优化太多目标。四个专业 Agent 分工后,每个 Agent 只做一件事,输出一致、可并行、故障可隔离。
数学上也成立:一个 Agent 串行跑四个阶段,耗时是四个 Agent 并行的四倍。对于每周产 20 篇内容的内容运营,并行度本身就足以 justify 这个架构。
四 Agent 团队结构
Agent 1 — Research Agent(研究) 输入:主题、问题或简报 输出:结构化研究简报 绝不碰:写作、编辑、发布
Agent 2 — Production Agent(生产) 输入:Research Agent 的简报 输出:完整初稿 绝不碰:研究、编辑、发布
Agent 3 — Quality Agent(质检) 输入:Production Agent 的初稿 输出:通过审批的稿件,或具体的修改简报 绝不碰:研究、从零写作、发布
Agent 4 — Distribution Agent(分发) 输入:Quality Agent 通过的稿件 输出:按平台正确格式部署的内容 绝不碰:研究、写作、质量评估
Orchestrator(编排器) 不是第五个 Agent,是连接四个 Agent 的路由逻辑。接收任务、路由到正确 Agent、监控完成、处理失败、确保工作流到达最终输出。Orchestrator 知道所有 Agent 在做什么,每个 Agent 只知道自己的任务。
前置准备
项目目录结构:
inbox/ — 任务入口
research-briefs/ — Research Agent 输出
drafts/ — Production Agent 输出
approved-content/ — Quality Agent 审批通过
distribution/ — 部署记录
logs/ — 操作日志
根目录放 CLAUDE.md 作为系统总纲,每个 Agent 有独立的 skill 文件放在 05-system/agents/ 下。
Research Agent:最重要的 Agent
一切下游质量取决于它。弱的研究简报产出弱的初稿,Production Agent 无法添加 Research Agent 没找到的真知灼见。
研究流程七步:确定核心问题 → 多角度找信息 → 至少 3 个独立来源交叉验证 → 找到大多数人错过的洞察 → 找到反直觉角度 → 定位 3 个具体案例/数据/故事 → 排出 3 个内容角度优先级。
质量标准:如果核心洞察是大多数人已经知道的,就失败。洞察必须 genuinely non-obvious。每条声明必须有具体来源支撑。
Production Agent:声音是核心
Generic AI 内容失败的原因是听起来 generic。精确配置的声音档案(voice profile)能让输出听起来像你最佳状态下的手笔。
配置前,收集你表现最好的 10 篇内容,让 Claude 分析模式:平均句长、策略性大写、结构模式、词汇水平、你从不做的事(模糊限定词、填充短语)、过渡方式、CTA 风格。
生产流程:从简报选最强角度 → 用声音档案写开头 hook → 用证据发展主体 → 把反直觉角度作为核心张力 → 用关键数据作 proof points → 以适合内容类型的 CTA 收尾。
Quality Agent:质量地板
大多数多 Agent 系统跳过这个 Agent,然后困惑为什么输出不一致。
没有 Quality Agent,Production Agent 的每篇内容都直接进入分发,无论质量好坏。好天出好内容,坏天出坏内容,没有 floor。
有了 Quality Agent,低于定义阈值的内容无法发布。floor 一致,因为 gate 一致。
评分标准(1-10 分,全部 ≥8 才通过):
| 维度 | 问题 |
|---|---|
| VOICE MATCH | 是否完全匹配配置的声音? |
| HOOK STRENGTH | 第一句能否 stop the scroll? |
| INFORMATION DENSITY | 每句话是否都值得存在? |
| CTA CLARITY | 行动号召是否具体且有说服力? |
| FORMAT COMPLIANCE | 是否遵循所有格式要求? |
任何维度低于 8 分:指出哪个维度失败、具体哪里需要改、返回 Production Agent 并附带修改简报。绝不给模糊反馈。
Distribution Agent:平台适配
不同平台需要真正不同的内容格式:
Twitter/X — 每条 280 字上限,长内容用 thread,短句,策略性换行,每条必须 standalone。
LinkedIn — 专业适配,可接受更长句子,叙事结构有效,首行必须作为独立 hook。
Newsletter — 完整格式含标题,HTML 兼容,一致的分节结构,清晰主题行。
Distribution Agent 根据审批内容头部指定的平台自动应用对应格式。
Orchestrator:轻量路由
工作流:任务接收 → Research → Production → Quality → Distribution → 完成
职责:拆解任务 → 监控各 Agent 输出文件夹 → 按序传递正确输出 → 修订时路由回正确 Agent → 失败时记录并标记人工审核 → 确认分发后完成工作流
硬性规则:绝不跳过 Quality Agent。绝不自我审批。绝不做创意决策——只路由和管理。
运行第一个任务
- 在 inbox/ 创建任务文件
- 触发 Orchestrator:「Read CLAUDE.md. You are the Orchestrator. A new task has arrived. Begin the workflow. Route to Research Agent first.」
- 观察输出文件夹按序填充
首次端到端运行:15-30 分钟。10 次后感觉自然。50 次后感觉不可或缺。
复利效应
四 Agent 系统不仅比单 Agent 产出更好。它的输出每月都在提升,因为每个 Agent 都在积累关于「什么有效」的上下文。
Research Agent 学习哪些来源受受众欢迎。 Production Agent 学习哪些角度驱动最多互动。 Quality Agent 学习对你特定声音而言,好与伟大的阈值到底在哪里。