How I Run My AI Team's Simplest Loop with OpenClaw and Hermes

Karpathy 最近分享了他对 AI 开发范式转变的看法，其中一段话非常直接：

agents are powerful agents are random agents are still weirdly wrong and you still own taste, judgment, specs, supervision that's why an AI team needs a loop around it.

这三句话几乎涵盖了 AI agent 当前状态的所有真相：能力强大但行为不可预测，仍会在某些地方出现莫名其妙的错误。所以人的角色不是被替代，而是从"执行者"变成"架构师和审核者"。

这篇文章介绍的是一套基于 OpenClaw 和 Hermes 构建的最小化 AI 团队循环。它要解决的问题不是"如何让 AI 替代人"，而是"如何在 AI 和人之间建立一个高效的协作架构"。

最小循环的架构

整个系统的最小运行单元是一个四步循环：

1. Schedule（定时触发） Agent 不是被动的响应工具，而是有自己运行节奏的"员工"。你在早晨给它一个日程安排，或者直接给它一段状态描述，Agent 会在设定的时间自己醒来，按优先级处理任务。

这不是简单的 cron job——它意味着 Agent 能理解"今天需要做什么"，而不是等你去逐条指令。

2. Context（上下文注入） 每次 Agent 醒来，它不是从零开始。它会主动读取一小块状态文件——比如项目进展、待处理事项、最近的决策日志——然后基于这些信息决定下一步行动。

上下文不需要你手动更新。它是 Agent 每次运行后自动写入的系统状态，你只需要确保格式清晰。

3. Review Packet（审核包） Agent 完成工作后，会写一份"审核包"——一份结构化的简短报告，格式大概是这样的：

决策需求：我做了什么决定，需要你确认
推荐默认：如果你没时间细看，我推荐你选哪个
变化摘要：和上次相比，哪里变了
证据：我为什么这么判断
风险：可能的问题点
审批边界：哪些事情我可以直接做，哪些需要你拍板
下一步：基于这个决定，接下来是什么

这份报告的目的是让你在 30 秒内了解 Agent 的工作状态，判断是否需要介入。

4. Human Decision（人类决策） 你扫完 7 行审核包，决定：批准、修改、或者要求 Agent 重新分析。这个决策是你唯一需要做的事情。

然后你可以选择"再睡 10 分钟"——意思是告诉 Agent 你暂时没空，稍后再看。Agent 会保持当前状态，等待下一轮触发。

三周后发生了什么

文章里描述了一个三周后发生的变化：原本需要手动分配任务的你，现在有了一个持续运转的小型 Agent 团队。

每个 Agent 每天早上自己启动，读取自己的状态文件，处理自己的任务，写审核包，等你审批。以前你每天早上要花 15-20 分钟给不同的 Agent 和工具发指令，现在这 15 分钟变成了扫几份审核包的时间。

这不是因为 Agent 变强了——而是因为建立了一个清晰的协作架构：AI 做执行，人做判断，边界清晰，节奏自驱。

为什么 Karpathy 的三句话很重要

Karpathy 的总结值得反复读：

Agents are powerful：在代码生成、信息整理、策略分析这些任务上，AI 的速度和深度已经超过大多数人的预期。

Agents are random：在同一个 prompt 下，AI 的输出会有差异。这个随机性不是 bug——它是模型探索解空间的方式。但它意味着你不能完全信任 AI 的单次输出。

Agents are still weirdly wrong：某些情况下 AI 会犯很低级的错误——不是因为能力不够，而是因为它对世界的理解有盲区。这个"weirdly wrong"最难处理，因为它看起来很专业，但结论是错的。

这三点的实际含义是：你不能没有人类监督就完全交给 AI，但你也不需要全程参与每个执行环节。

关键不是"AI 能做什么"，而是"人在哪里需要在场"

大多数人在搭建 AI 工作流时犯的错误是：要么完全不用 AI（因为担心 AI 犯错），要么完全交给 AI（因为懒得管）。两种极端都不对。

正确的做法是：在低风险、高重复的环节让 AI 全力跑，在高风险、需要判断力的环节让人拍板。

这套 OpenClaw + Hermes 的循环，做的就是这件事：把审核包作为人机交互的接口，让人的精力只需要消耗在真正需要判断的地方。

如果你想搭建这套系统

核心需要的东西：

OpenClaw：作为 Agent 调度和协作平台
Hermes：作为 Agent 的记忆层和状态管理
Review Packet 模板：告诉 Agent 审核包需要包含哪些字段
状态文件规范：约定每次上下文注入包含哪些信息

不需要写复杂的代码。你需要的是把流程想清楚，然后把这个流程用 Skill 文件的方式固定下来。