机器劳动市场：从卖token到卖完成的工作

生产力浪潮总是来自为人类生产工具来优化完成工作。电子表格帮助会计和分析师，传送带增加吞吐量，锤子放大杠杆。但实际劳动总是来自人类。

AI 现在正在端到端地生产工作——直接执行劳动。它在 ship 代码、关闭支持工单、审查法律文档。栈的末端正在发生压缩。旧栈支持劳动，新栈生产劳动。

从 Token 到劳动

如果你听过最近关于 AI 金融化的 rhetoric，你可能听到 Jensen 和其他人说 LLM token 和/或 GPU 小时是新的商品。这个直觉有道理，因为 token 是可测量、可计费、容易 chart 的，GPU 小时有数十亿资金流动。

但 token 仍然只是电表。GPU 小时只是输入。没有人为了它们本身想要它们。他们想要工作完成。AI 把栈变成劳动本身的来源。

机器劳动：由软件执行的经济上有用的工作，并 sold into production。

市场已经在朝这个方向移动。@benchmark 的 @sarahtavel 的观点是通过外包劳动市场而非软件类别来映射机会。如果一个专注的离岸团队或专业服务公司已经存在来做一项可重复的任务，那这项任务通常是 AI 交付工作的良好候选。@a16z 的 @arampell 称之为软件吞噬劳动：软件的下一幕是自己做工作。@sequoia 的 @JulienBek 把同样的转变框定为服务变成软件，copilots 卖工具但 autopilots 卖工作。

缺失的市场：结果定价背后

座位定价为访问收费，token 定价为使用收费。结果定价为工作完成时收费。结果定价让你走了一部分路，但它仍然不告诉你谁设定价格。

如果你能直接购买机器劳动，价格应该从能满足相同任务或工作完成的供应商竞争中产生，而这需要跨劳动行业和行业内任务的标准化。

当前的方式是用 LLM token，但原始 token 是最低层。一桶石油只是计量单位。交易的是特定等级的石油，有已知的质量、交付条款和市场价格。一桶 Brent 不是一桶重质高硫原油。LLM token 也一样。一个 token 只是计量单位。重要的是背后的智能：模型质量、基准底线、延迟、上下文窗口、可靠性和交付保证。一百万 token 来自前沿编码模型，与一百万 token 来自廉价通用模型，不是同一种商品。

市场需要标准化推理等级，就像能源市场需要标准化石油等级。

@anjali_shriva 直接指出：token 不是固定成本单位。经济学随上下文长度、任务结构、输入/输出比例、重试、工具调用和 Agent 工作流而变化。短 prompt 中的一个 token 和长 Agent 循环中的 token，不是同一个经济对象。

四阶段演进

Phase 1：原始 Token

Claude 4.7、GPT 5.5、Kimi 2.6、DeepSeek V4、GLM 5 等。今天买家从推理供应商购买原始模型输出。他们发送自己的 prompt，接收推理，按使用付费。这容易验证，但仍然是原始的。买家不真正想要 token，他们想要有用的智能，以最好的可用价格。

Phase 2：商品化 LLM 能力市场

买家不再选择特定模型，而是选择他们需要的智能等级。买家仍然拥有工作流、prompt、数据和应用逻辑。市场只是将每个请求路由到满足合同 spec 的最低价格合格模型。

这是 token 之上的第一个真正抽象，也是 TheGrid.ai 今天所在的位置。

Phase 3：商品化劳动市场

随着模型变得更专业化，能力市场可以变成行业特定的。类似于人类在不同劳动市场中专业化。这里销售的推理适合该特定劳动垂直的工作流。随着利基行业模型变得更普遍，这将 proliferate。例子：Cursor 的 Composer、Harvey 的法律工作、EvidenceOpen 的医疗健康。

Phase 4：可编程 RFQ 和 Agent 结果市场

The Grid 从推理市场进入机器劳动市场。这层需要 RFQ、托管、延迟结算、买家确认、供应商声誉、 clawbacks、争议解决等。可能从 RFQ 开始而非订单簿——买家定义工作、约束、验收标准和结算条款，Agent 竞标完成。The Grid 帮助路由、定价、验证和结算工作。

这是最有价值的层，但最难验证，因为结果是延迟的、主观的、可博弈的。支持工单可以重新打开，PR 可以通过测试但仍然创建糟糕的架构。

机器劳动 vs 人类劳动

@anjali_shriva 的机制设计草案认为，AI 故事太常被框定为替代，而实际上只是协调：当人类和机器都为生产做出贡献时，工作、归因、激励和价值如何重组。

今天，企业内部的大量 AI 使用被困住，因为员工私下使用 AI，工作流仍锁定在个人身上，企业无法定价或扩展生产力提升。

大多数可自动化的工作可能会转移到机器。一些工作变成人类审查、问责、培训和上下文管理。在某些情况下，最后 1% 的人类判断变得更有价值，因为它解锁了 99% 的自动化规模。

@rachelsupark 的《AI 市场的美丽新世界》认为 AI TAM 不应该被建模为现有人工劳动支出的简单替代，因为它同时改变了价格和数量。每单位价格可能随着工作变得更便宜而下降，但数量可以扩张，因为现有工作被更频繁地消费，全新的工作变得经济可行。

如果 AI 让客户支持交互更便宜，公司可以提供 24/7 容量。市场不会变成旧支持劳动市场的更便宜版本。它可以变成客户交互的更大市场。

AI 是一个扩张市场，因为当工作成本变得更便宜时，需求不会保持不变。

劳动层

机器劳动市场应该从工作可以被清晰 spec 的地方开始。GPU 小时有太多输入，只告诉你什么驱动了工作。定价完整结果太混乱、上下文太重。随着验证、声誉和风险/保险定价被机器接管，市场向纯结果演进。

机器劳动可以作为可交易品，因为买家会越来越不关心哪个模型或 GPU 产生了工作，而更多关心工作本身是否清除了合同中预期的最低标准和等级，以合适的价格。Agent 甚至会更不关心。

电力、计算、模型和 token 仍然重要。但它们都坐在上游。下游是工作完成的地方，市场正朝着更简单的东西移动：机器劳动。