Karpathy 最近分享了他对 AI 开发范式转变的看法,其中一段话非常直接:
agents are powerful agents are random agents are still weirdly wrong and you still own taste, judgment, specs, supervision that's why an AI team needs a loop around it.
这三句话几乎涵盖了 AI agent 当前状态的所有真相:能力强大但行为不可预测,仍会在某些地方出现莫名其妙的错误。所以人的角色不是被替代,而是从"执行者"变成"架构师和审核者"。
这篇文章介绍的是一套基于 OpenClaw 和 Hermes 构建的最小化 AI 团队循环。它要解决的问题不是"如何让 AI 替代人",而是"如何在 AI 和人之间建立一个高效的协作架构"。
最小循环的架构
整个系统的最小运行单元是一个四步循环:
1. Schedule(定时触发) Agent 不是被动的响应工具,而是有自己运行节奏的"员工"。你在早晨给它一个日程安排,或者直接给它一段状态描述,Agent 会在设定的时间自己醒来,按优先级处理任务。
这不是简单的 cron job——它意味着 Agent 能理解"今天需要做什么",而不是等你去逐条指令。
2. Context(上下文注入) 每次 Agent 醒来,它不是从零开始。它会主动读取一小块状态文件——比如项目进展、待处理事项、最近的决策日志——然后基于这些信息决定下一步行动。
上下文不需要你手动更新。它是 Agent 每次运行后自动写入的系统状态,你只需要确保格式清晰。
3. Review Packet(审核包) Agent 完成工作后,会写一份"审核包"——一份结构化的简短报告,格式大概是这样的:
- 决策需求:我做了什么决定,需要你确认
- 推荐默认:如果你没时间细看,我推荐你选哪个
- 变化摘要:和上次相比,哪里变了
- 证据:我为什么这么判断
- 风险:可能的问题点
- 审批边界:哪些事情我可以直接做,哪些需要你拍板
- 下一步:基于这个决定,接下来是什么
这份报告的目的是让你在 30 秒内了解 Agent 的工作状态,判断是否需要介入。
4. Human Decision(人类决策) 你扫完 7 行审核包,决定:批准、修改、或者要求 Agent 重新分析。这个决策是你唯一需要做的事情。
然后你可以选择"再睡 10 分钟"——意思是告诉 Agent 你暂时没空,稍后再看。Agent 会保持当前状态,等待下一轮触发。
三周后发生了什么
文章里描述了一个三周后发生的变化:原本需要手动分配任务的你,现在有了一个持续运转的小型 Agent 团队。
每个 Agent 每天早上自己启动,读取自己的状态文件,处理自己的任务,写审核包,等你审批。以前你每天早上要花 15-20 分钟给不同的 Agent 和工具发指令,现在这 15 分钟变成了扫几份审核包的时间。
这不是因为 Agent 变强了——而是因为建立了一个清晰的协作架构:AI 做执行,人做判断,边界清晰,节奏自驱。
为什么 Karpathy 的三句话很重要
Karpathy 的总结值得反复读:
Agents are powerful:在代码生成、信息整理、策略分析这些任务上,AI 的速度和深度已经超过大多数人的预期。
Agents are random:在同一个 prompt 下,AI 的输出会有差异。这个随机性不是 bug——它是模型探索解空间的方式。但它意味着你不能完全信任 AI 的单次输出。
Agents are still weirdly wrong:某些情况下 AI 会犯很低级的错误——不是因为能力不够,而是因为它对世界的理解有盲区。这个"weirdly wrong"最难处理,因为它看起来很专业,但结论是错的。
这三点的实际含义是:你不能没有人类监督就完全交给 AI,但你也不需要全程参与每个执行环节。
关键不是"AI 能做什么",而是"人在哪里需要在场"
大多数人在搭建 AI 工作流时犯的错误是:要么完全不用 AI(因为担心 AI 犯错),要么完全交给 AI(因为懒得管)。两种极端都不对。
正确的做法是:在低风险、高重复的环节让 AI 全力跑,在高风险、需要判断力的环节让人拍板。
这套 OpenClaw + Hermes 的循环,做的就是这件事:把审核包作为人机交互的接口,让人的精力只需要消耗在真正需要判断的地方。
如果你想搭建这套系统
核心需要的东西:
- OpenClaw:作为 Agent 调度和协作平台
- Hermes:作为 Agent 的记忆层和状态管理
- Review Packet 模板:告诉 Agent 审核包需要包含哪些字段
- 状态文件规范:约定每次上下文注入包含哪些信息
不需要写复杂的代码。你需要的是把流程想清楚,然后把这个流程用 Skill 文件的方式固定下来。