Sandbox 是基础设施，但 Trajectory 才是数据：Agent 时代的架构之争

当你在一个 AI coding agent 里写了"resume from where I left off"，这个"记忆"到底存在哪里？最近社区对这个问题有了更清晰的认识，相关讨论集中在两点：sandbox 的所有权，和 trajectory data 的归属。

拆解 Agent 的两层架构

Anthropic 早在设计 Claude Code 时就把这个问题想清楚了：brain（大脑）和 hands（手）是解耦的。

Brain = Harness：指令系统、context 架构、决策逻辑
Hands = Sandbox：文件操作、命令执行、代码运行的真实环境
Session Log：存在于两者之外，记录完整的 reasoning 历史

这种三角架构是 long-running agent 的基础设计单元。

Trajectory：被忽视的核心资产

如果 trajectory 数据（推理历史）是让 agent 工作可重现、可审计、可改进的核心资产，那么围绕它产生的竞争就不仅仅是"卖算力"那么简单了。

今天很多 sandbox 提供商同时保存用户的 trajectory 状态。这产生了一个有趣的 market version：

版本 A：Labs 运行端到端托管 harness，用户的 trajectory 存在 Labs 的 session log 里，Labs 控制状态

版本 B：企业不允许这种连接，sandbox 必须跑在客户自己的云里，用 Daytona、E2B 或 Stripe Minions 这类方案。状态留在客户基础设施内

两条路线的分歧，本质上是trajectory 数据主权的分歧。

Long-Running Agent Swarm 的基础设施

当单个 agent 进化成 swarm——协调团队跨多个 sandbox 工作，每个有独立的 trajectory 和状态——基础设施层面临的问题更深：

单个 agent 失败重启，sandbox 销毁重建，swarm 持续运行
控制层（routing、进度追踪、失败重启、状态映射）本身也是一个 harness——harness 管理 harness
控制层放在客户基础设施内，还是放在 Labs 内部？这决定了未来的权力格局

控制权的问题贯穿整个市场：谁控制 swarm 管理层，谁控制 trajectory 状态数据，谁就定义了 Agent 市场的规则。

The future of the sandbox market is swarms of long-running harnesses. The ones who own the swarm management layer and the trajectory data will define this market.

拆解 Agent 的两层架构

Trajectory：被忽视的核心资产

Long-Running Agent Swarm 的基础设施

继续阅读