← 返回 FEED
AGENT2026-04-20

Sandbox 是基础设施,但 Trajectory 才是数据:Agent 时代的架构之争

当你在一个 AI coding agent 里写了"resume from where I left off",这个"记忆"到底存在哪里?最近社区对这个问题有了更清晰的认识,相关讨论集中在两点:sandbox 的所有权,和 trajectory data 的归属。

拆解 Agent 的两层架构

Anthropic 早在设计 Claude Code 时就把这个问题想清楚了:brain(大脑)和 hands(手)是解耦的

  • Brain = Harness:指令系统、context 架构、决策逻辑
  • Hands = Sandbox:文件操作、命令执行、代码运行的真实环境
  • Session Log:存在于两者之外,记录完整的 reasoning 历史

这种三角架构是 long-running agent 的基础设计单元。

Trajectory:被忽视的核心资产

如果 trajectory 数据(推理历史)是让 agent 工作可重现、可审计、可改进的核心资产,那么围绕它产生的竞争就不仅仅是"卖算力"那么简单了。

今天很多 sandbox 提供商同时保存用户的 trajectory 状态。这产生了一个有趣的 market version:

版本 A:Labs 运行端到端托管 harness,用户的 trajectory 存在 Labs 的 session log 里,Labs 控制状态

版本 B:企业不允许这种连接,sandbox 必须跑在客户自己的云里,用 Daytona、E2B 或 Stripe Minions 这类方案。状态留在客户基础设施内

两条路线的分歧,本质上是trajectory 数据主权的分歧。

Long-Running Agent Swarm 的基础设施

当单个 agent 进化成 swarm——协调团队跨多个 sandbox 工作,每个有独立的 trajectory 和状态——基础设施层面临的问题更深:

  • 单个 agent 失败重启,sandbox 销毁重建,swarm 持续运行
  • 控制层(routing、进度追踪、失败重启、状态映射)本身也是一个 harness——harness 管理 harness
  • 控制层放在客户基础设施内,还是放在 Labs 内部?这决定了未来的权力格局

控制权的问题贯穿整个市场:谁控制 swarm 管理层,谁控制 trajectory 状态数据,谁就定义了 Agent 市场的规则。

The future of the sandbox market is swarms of long-running harnesses. The ones who own the swarm management layer and the trajectory data will define this market.