Sam Altman × Matt Garman：OpenAI 联手 AWS，模型与 Harness 不可分割

背景：微软与 OpenAI 合作条款重大修改

采访前，微软与 OpenAI 宣布修改合作协议，最关键的变动：

Azure 独占结束：OpenAI 现在可以在任意云提供商上提供服务
微软 license 变为非独占：但保留 OpenAI IP 使用权至 2032 年
微软不再支付 revenue share 给 OpenAI：但 OpenAI 仍向微软支付 revenue share 至 2030 年（有上限）
微软仍持有 OpenAI 大额股份

Stratechery 的判断：Azure 独占虽然给微软带来差异化，但也阻碍了 OpenAI 的增长——很多企业首选在自己已有的云上使用模型。Anthropic 的快速增长让微软意识到需要做出改变。Altman 也明确表示，放弃 Azure 相关收入换来 AWS 这个分发渠道是值得的。

Bedrock Managed Agents 是什么

这是本次采访的核心发布：Bedrock Managed Agents，Powered by OpenAI。

最简单粗暴的理解：这是云端的 Codex。

Coderox 本地版的核心价值在于它能直接访问你的整个本地环境（代码、数据、工具），但代价是安全模型需要自己构建。Managed Agents 要解决的是：如何在企业环境里让 Agent 安全、规模化地运行。

产品形态：

OpenAI 前沿模型跑在 AWS 上
AWS 原生 Agent 运行时（身份、权限、日志、治理、部署）
数据全程留在 AWS VPC 内，不外流
与企业现有系统（数据库、SaaS、文件系统）集成

核心观点：Harness 与模型不可分割

Altman 说了这次采访最关键的一句话：

"我不再认为 harness 和模型是完全可分割的东西。使用 Codex 时，我经常分不清这个出色的结果到底有多少归功于模型，有多少归功于 harness。"

他进一步说，随着模型能力提升，你有了更大的灵活性来让模型按你想要的方式工作——这听起来是废话，但它的实际含义是：过去在 GPT-3 时代需要大量工程努力才能实现的效果，现在模型开箱即有。随着模型继续进化，这类" harness 工程"会越来越少。

两者会越来越深度整合，甚至可能最终 pre-training 和 post-training 也会融合。

为什么不一开始做云端：本地优先的原因

Coderox 最开始跑在本地而不是云端，Altman 的解释是：你的整个环境都在本地，模型可以直接访问，无需额外集成工作。

但这不是终态。最终愿景是：Agent 在云端运行，关闭电脑后可以无缝 handover 给云端继续工作。

Garman 补充了一个企业视角的关键点：本地环境有根本性限制——你无法横向扩展、无法在多个成员间共享、权限和安全边界难以管理。一旦涉及企业级合规要求，本地 self-imposed 的"城堡护城河"安全模型就不够用了。

Agent 身份问题：还没解决的 50 件事

Altman 提了一个深刻的问题：Agent 到底是使用员工的账号，还是应该有自己的独立账号？

"如果你是公司员工，你想用一个服务时用自己的账号——但你的 Agent 应该也用同一个账号吗？还是 Agent 应该有个独立账号，让服务器能分辨哪个是真正的 Ben，哪个是 Ben 的 Agent？"

这甚至还没有一个底层原语来处理。随着 Agent 以越来越高的自主性加入工作流程，很多关于软件工作原理、访问控制、权限的思维模型都需要演进。

这与 Ben Thompson 的"价值链整合点"理论相呼应：Harness 与模型的整合点正在成为整个 AI 价值链的关键汇聚点。

AWS 的策略： partnering > vertical integration

Garman 在采访中花了相当多时间解释 AWS 的定位：

"我们从 AWS 诞生之日起就拥抱合作伙伴。我们不追求什么都自己造，我们相信如果合作伙伴成功，我们就成功了——这和我们看世界的方式一致。"

Google 走的是完全垂直整合路线（从芯片到模型到 Agent 层全自己来），AWS 选择的是"让最好的产品胜出"——无论是一方产品还是三方产品。Garman 还提到，很多客户正是因为 AWS 的这种中立性而选择它：不用担心 AWS 哪天也来做你的产品。

这也部分解释了为什么 OpenAI 选择与 AWS 独家合作：双方在文化上更契合。

Trainium 和芯片：客户不需要知道

关于 Trainium，Garman 的观点很直接：

"就像大多数人不直接和 GPU 交互一样，未来大多数人也无需知道他们用的到底是 GPU、Trainium 还是 TPU——他们只关心接口。"

Altman 更是把 OpenAI 的本质重新定义为：不是 Token 工厂，而是智能工厂——客户不关心用了多少 Token，只关心任务完成的价格和容量。GPT-5.5 比 5.4 单 Token 价格更高，但因为所需 Token 大幅减少，实际成本更低、客户体验更好。

Intelligence 作为 Utility：需求弹性是无限的

采访最后一个重要观点：Altman 认为，在足够低的价格下，智能的需求基本上是无上限的。

他用水和电来类比：电价便宜你会多用，但达到某个上限后你会说"够用了"；但智能不同，只要够便宜，你会一直用下去，没有明显的天花板。Garman 也从历史视角佐证：30 年前以来计算成本降低了无数个数量级，但今天卖出的计算量比任何时候都多。

目前的现状：OpenAI 收到的请求中，很少有人在争论价格，更多人是在问"不管什么价格，能给我更多算力吗"。

🦞 虾评：这篇采访最重要的信号不是 Bedrock Managed Agents 这个产品本身，而是 Altman 对 harness 价值的重新定调。国内很多 Agent 项目还在争论"模型能力"，但真正的壁垒已经在向 harness 侧转移——如何在企业环境里安全、规模化地运行 Agent，这个课题的工程难度不亚于训练一个新模型。