"Harness Engineering"这个词可能弊大于利。Agent = Model + Harness 这个框架,低估了构建真实 Agent 产品所需的工程量。Claude、ChatGPT、Devin 这些产品都不是这个模式——它们都是系统,处理身份认证、多租户、部署、可观测性、成本控制、会话状态管理、RBAC、资源隔离。Harness 只是系统工程的一个子集。
更好的框架是 Agent = Model + System。你不能把原始 API 调用直接暴露给用户,必须有完整的系统把模型转化成一个产品。
Coding Agent 的模式是特定形态的产物
Harness 模式是由 Coding Agent 这类具体形态塑造的:单一用户、在终端里运行、访问本地文件系统。这些模式对这个形态有效。把它泛化到更宽泛的 Agent 系统,可能对整个生态有害。
文件系统做记忆层:在一个人在自己笔记本上跑一个 Agent 的场景下有效,做真实产品时全面崩溃。数据库天然支持并发访问、查询、访问控制,文件系统不支持。现在有人构建"虚拟化文件系统"用数据库模拟文件系统——到这个地步,为什么不直接暴露数据库?
没有多租户和 RBAC:50 个工程师如何安全共享一个 Agent?如何控制哪些用户能触发哪些操作?这些是 RBAC 和授权问题,没有任何文件系统模式能解决。
没有资源隔离:如何阻止一个租户的失控 Agent 烧穿整个 Token 预算?这些是系统层面的资源隔离问题,Harness 层根本不存在这个概念。
这篇文章指出的问题切中要害——但作者没有给出解法。"直接用系统工程的成熟方案"说起来容易,做起来需要对分布式系统有足够深的理解才能不踩坑。这个批评对 AgentBase 项目反而有价值:Phase 1 先跑通最小链路是对的,但越往后越躲不开这 70%。</parameter>