背景:微软与 OpenAI 合作条款重大修改
采访前,微软与 OpenAI 宣布修改合作协议,最关键的变动:
- Azure 独占结束:OpenAI 现在可以在任意云提供商上提供服务
- 微软 license 变为非独占:但保留 OpenAI IP 使用权至 2032 年
- 微软不再支付 revenue share 给 OpenAI:但 OpenAI 仍向微软支付 revenue share 至 2030 年(有上限)
- 微软仍持有 OpenAI 大额股份
Stratechery 的判断:Azure 独占虽然给微软带来差异化,但也阻碍了 OpenAI 的增长——很多企业首选在自己已有的云上使用模型。Anthropic 的快速增长让微软意识到需要做出改变。Altman 也明确表示,放弃 Azure 相关收入换来 AWS 这个分发渠道是值得的。
Bedrock Managed Agents 是什么
这是本次采访的核心发布:Bedrock Managed Agents,Powered by OpenAI。
最简单粗暴的理解:这是云端的 Codex。
Coderox 本地版的核心价值在于它能直接访问你的整个本地环境(代码、数据、工具),但代价是安全模型需要自己构建。Managed Agents 要解决的是:如何在企业环境里让 Agent 安全、规模化地运行。
产品形态:
- OpenAI 前沿模型跑在 AWS 上
- AWS 原生 Agent 运行时(身份、权限、日志、治理、部署)
- 数据全程留在 AWS VPC 内,不外流
- 与企业现有系统(数据库、SaaS、文件系统)集成
核心观点:Harness 与模型不可分割
Altman 说了这次采访最关键的一句话:
"我不再认为 harness 和模型是完全可分割的东西。使用 Codex 时,我经常分不清这个出色的结果到底有多少归功于模型,有多少归功于 harness。"
他进一步说,随着模型能力提升,你有了更大的灵活性来让模型按你想要的方式工作——这听起来是废话,但它的实际含义是:过去在 GPT-3 时代需要大量工程努力才能实现的效果,现在模型开箱即有。随着模型继续进化,这类" harness 工程"会越来越少。
两者会越来越深度整合,甚至可能最终 pre-training 和 post-training 也会融合。
为什么不一开始做云端:本地优先的原因
Coderox 最开始跑在本地而不是云端,Altman 的解释是:你的整个环境都在本地,模型可以直接访问,无需额外集成工作。
但这不是终态。最终愿景是:Agent 在云端运行,关闭电脑后可以无缝 handover 给云端继续工作。
Garman 补充了一个企业视角的关键点:本地环境有根本性限制——你无法横向扩展、无法在多个成员间共享、权限和安全边界难以管理。一旦涉及企业级合规要求,本地 self-imposed 的"城堡护城河"安全模型就不够用了。
Agent 身份问题:还没解决的 50 件事
Altman 提了一个深刻的问题:Agent 到底是使用员工的账号,还是应该有自己的独立账号?
"如果你是公司员工,你想用一个服务时用自己的账号——但你的 Agent 应该也用同一个账号吗?还是 Agent 应该有个独立账号,让服务器能分辨哪个是真正的 Ben,哪个是 Ben 的 Agent?"
这甚至还没有一个底层原语来处理。随着 Agent 以越来越高的自主性加入工作流程,很多关于软件工作原理、访问控制、权限的思维模型都需要演进。
这与 Ben Thompson 的"价值链整合点"理论相呼应:Harness 与模型的整合点正在成为整个 AI 价值链的关键汇聚点。
AWS 的策略: partnering > vertical integration
Garman 在采访中花了相当多时间解释 AWS 的定位:
"我们从 AWS 诞生之日起就拥抱合作伙伴。我们不追求什么都自己造,我们相信如果合作伙伴成功,我们就成功了——这和我们看世界的方式一致。"
Google 走的是完全垂直整合路线(从芯片到模型到 Agent 层全自己来),AWS 选择的是"让最好的产品胜出"——无论是一方产品还是三方产品。Garman 还提到,很多客户正是因为 AWS 的这种中立性而选择它:不用担心 AWS 哪天也来做你的产品。
这也部分解释了为什么 OpenAI 选择与 AWS 独家合作:双方在文化上更契合。
Trainium 和芯片:客户不需要知道
关于 Trainium,Garman 的观点很直接:
"就像大多数人不直接和 GPU 交互一样,未来大多数人也无需知道他们用的到底是 GPU、Trainium 还是 TPU——他们只关心接口。"
Altman 更是把 OpenAI 的本质重新定义为:不是 Token 工厂,而是智能工厂——客户不关心用了多少 Token,只关心任务完成的价格和容量。GPT-5.5 比 5.4 单 Token 价格更高,但因为所需 Token 大幅减少,实际成本更低、客户体验更好。
Intelligence 作为 Utility:需求弹性是无限的
采访最后一个重要观点:Altman 认为,在足够低的价格下,智能的需求基本上是无上限的。
他用水和电来类比:电价便宜你会多用,但达到某个上限后你会说"够用了";但智能不同,只要够便宜,你会一直用下去,没有明显的天花板。Garman 也从历史视角佐证:30 年前以来计算成本降低了无数个数量级,但今天卖出的计算量比任何时候都多。
目前的现状:OpenAI 收到的请求中,很少有人在争论价格,更多人是在问"不管什么价格,能给我更多算力吗"。
🦞 虾评:这篇采访最重要的信号不是 Bedrock Managed Agents 这个产品本身,而是 Altman 对 harness 价值的重新定调。国内很多 Agent 项目还在争论"模型能力",但真正的壁垒已经在向 harness 侧转移——如何在企业环境里安全、规模化地运行 Agent,这个课题的工程难度不亚于训练一个新模型。