Anthropic 推出 Claude Managed Agents——一个预构建、可配置的 Agent 工具链,直接运行在托管基础设施上。你只需要定义 Agent 模板(工具、Skills、文件/仓库),系统自动处理工具调用路由、上下文管理和长期任务的基础设施保障。

为什么需要 Managed Agents

当前基于 Messages API 构建 Agent 的方式有一个根本问题:工具链(harness)本质上是对模型能力的假设集合。随着 Claude 能力快速迭代,这些假设会迅速过时。每次模型更新,工具链都需要重新适配。

同时,Claude 的单次运行时间已经在 METR 基准测试中超过了 10 人时。这对基础设施提出了硬要求:任务要能跨小时、天、月稳定运行,中途断电要能恢复,多 Agent 协作要能水平扩展。

Claude Managed Agents 的思路是:不再让工具链追赶模型能力,而是把基础设施本身做成可独立演进的接口。

三个核心概念

Agent 是版本化的配置单元:模型选择、系统提示词、可用工具列表、Skills、MCP 服务器——全部打包在一起,一次创建,多次引用。

Environment 是沙箱模板:定义运行时类型(Node.js / Python 等)、网络隔离策略、依赖包配置。每次启动 Session 时,从这个模板出发创建隔离的执行环境。

Session 是有状态的执行实例:基于某个 Agent 配置和某个 Environment 模板创建,系统分配一个 fresh 的沙箱,挂载本次运行需要的文件或 GitHub 仓库,MCP 凭证存在安全 vault 里。一个 Agent 可以有多个并发 Session。

三个概念的解耦意味着:替换底层沙箱技术不需要重写 Agent 配置,更换模型不需要重构基础设施,Session 日志独立于工具链本身——每次改动都可以独立验证。

典型用法

事件触发:监控系统发现 bug,自动触发 Managed Agent 写 patch 并提交 PR,全程无人参与。

定时任务:每天定时跑一次简报——抓取 X 动态、汇总团队 GitHub 活动、整理成文档发回。

人触发后执行:通过 Slack 或 Teams 向 Agent 派发任务,说清楚要什么,Agent 在后台完成,直接交付成品(表格、幻灯片、应用)。

长时任务:这是最有战略价值的场景。Anthropic 认为未来 Claude 会连续运行在天、周、月的尺度上处理人类最复杂的挑战,Managed Agents 为此设计了一整套基础设施。

架构设计思路

传统的 Agent 系统把"大脑"(模型 + 工具链)、"手"(执行工具和沙箱)、"会话记录"紧耦合在一起。任何一个模块的升级都可能牵扯到其他模块。

Claude Managed Agents 的做法是让这三者都成为独立接口,每个接口对其他两者只有最少假设——任何一个模块都可以独立失效或被替换,而不影响整体稳定性。

起步方法

在 Claude Code 里直接跑:

(claude-api managed-agents-onboarding)

也可以用 SDK(Python / TypeScript / Java / Go / Ruby / PHP)或 CLI 管理所有资源(Agent、Environment、Session、Vault、Skills、文件)。