租智能，买推理，拥记忆：企业 AI 的三层架构

Chamath 警告过咨询公司：直接把 Anthropic 或 OpenAI 部署到组织里是「引狼入室」。这个警告在 OpenAI 推出 Deployment Company、Anthropic 推出 AI Services 之后，听起来更尖锐了。

但 Chamath 的框架指向了正确的危险，但真正的问题比他说的更深一层。

Token 控制不够深

Chamath 的 token 路由控制是对的第一个控制层：阻止一个模型成为唯一通道。但这仍然是 spend 层。

更深的控制层是 context——控制了 context，就控制了企业在 agent 行动之前知道什么。

模型公司正在做任何一个理性平台公司都会做的事：横向移动。它们不想永远做一个更好的 API 调用。它们想坐进工作流，提供 agent，连接工具，记住状态，从使用中学习，成为工作发生的默认路径。

第一阶段：模型质量——更好的模型，更好的产品。这个阶段对第一波是正确的，但前沿模型之间的差距在许多企业任务上已经在缩小。

第二阶段：Agent 层——规划、工具使用、重试、evals、权限、部署、UI。这个层现在很重要，而且会收敛——OpenAI、Google 和每个认真的企业供应商都会复制有效的模式。

第三阶段：Context——这个不会收敛，因为它对公司是独一无二的。你的客户承诺、路线图讨论、支持升级、Slack 辩论、定价例外、失败的迁移、会议理由、owner 历史和决策伤疤不在模型权重里。它们不是通用的。它们是你的。

这就是下一个企业 AI 锁定的样子。

月第一天，让模型提供商深入公司感觉神奇。Agent 连接 Slack、Jira、Salesforce、GitHub、Drive 和工单系统。它总结会议、更新记录、起草客户跟进、回答以前需要一个小时考古的问题。

这是许多公司目前正在感受的 MCP 时刻：工具突然连接，Agent 可以跨系统reach，demo 感觉像未来。

但 query-time 重建不是记忆。

从五个工具中拉取当用户问问题时是有用的，但这不等同于公司拥有和维护的持久 context graph。它不一定保留为什么决策变了、哪个承诺变得 stale、哪个之前的尝试失败了，或哪个 owner 悄悄变了。

它可以在公司实际构建记忆之前创造出记忆的感觉。

模型锁定是烦恼但可以存活。一个模型这个月编码好一点，另一个长 context 分析好一点，第三个后台工作更便宜。你绕过它。如果模型是依赖项，切换是痛苦的但概念上简单。

Context 锁定不同。

一旦同一个 vendor 拥有了模型、agent 层、工作流追踪、evals、权限和你公司如何运作的记忆，切换不再是 API 调用。你是在试图从别人的操作系统中提取你公司的工作记忆。

那是企业应该更害怕的部分。

企业应该自由地租智能：OpenAI 在它最好的地方，Anthropic 在它最好的地方，Gemini、open-source 模型、专业编码 agent、小模型、本地模型、或接下来出现的任何东西。没有宗教理由固守模型。

但公司记忆层应该是中立基础设施。

owned enterprise context graph 不能是同一个 vendor 控制的黑箱，那个 vendor 同时拥有模型和 agent harness。公司必须控制它。它必须可检查、有权限、可移植、可转移。

租智能（模型）是可以的，也许甚至租执行（agent）也是可以的。Context 层是不同的：它是公司的运营记忆，记录发生了什么、为什么发生、谁决定的、什么改变了、承诺了什么、接下来应该发生什么。

你真的想把租给你智能的同一个 vendor 变成那个的 owner 吗？