OpenAI 发布了 Agents SDK 重大更新,核心是解决从原型到生产环境的关键 gap:标准化、易用、并且对 OpenAI 模型来说是原生的 infrastructure。


更强大的 Harness

更新后的 harness 为处理文档、文件和系统的 agent 做了强化:

内置支持的原语:

  • MCP(Model Context Protocol):工具调用
  • skills(渐进式Disclosure)
  • AGENTS.md:自定义指令
  • shell 工具:代码执行
  • apply patch 工具:文件编辑

Harness 不只是粘合剂——它对齐模型的自然运作模式,让 agent 在复杂长任务上更可靠。


原生沙箱执行

Agent 需要一个工作空间:读文件、写文件、安装依赖、运行代码。SDK 现在内置了这个执行层,而不是让开发者自己拼凑。

内置支持 7 家提供商: Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel

Manifest 抽象层让环境在提供商之间可移植:挂载本地文件、定义输出目录、接入 S3/GCS/Azure Blob/R2 数据源。

从本地原型到生产部署,环境描述方式一致,模型得到的是一个可预期的工作空间。


Harness 与计算分离

这是最重要的架构决策。

安全: 凭证不进模型生成代码执行的环境,防止 prompt injection 和数据泄露。

持久化执行: 内置快照和再水化机制。沙箱容器丢了不丢 run——在新容器里恢复状态,从上一个 checkpoint 继续。

水平扩展: Agent run 可以用一个或多个沙箱,按需调用,把 sub-agent 路由到隔离环境,并行跑多个容器加速执行。


定价

通过 API 开放,使用标准 API 定价(token + 工具调用计费)。


路线图

  • Python 首发,TypeScript 支持后续推出
  • Code mode 和 subagent 能力开发中
  • 更多沙箱提供商和集成

首批测试用户: Oscar Health、LexisNexis、FurtherAI、Thomson Reuters、Zoom、Tomoro AI