Hermes Kanban 实战:4 个 agent 跑成一个软件团队
Akshay Pachaar (Daily Dose of DS, BITS Pilani, 前 LightningAI) 在 2026 年 6 月初放了一份 Hermes Kanban 的完整实战拆解——一篇推文长文,覆盖了从 6 列看板模型、4 个 profile 拼装、到 Telegram gateway + Dashboard 全套。配套的一个真实产物是:他用这套 agent 团队从 0 搭了一个 Google Docs clone(带 AI 功能,生产级 backend)。
一个 agent 不够的真实原因
假设要加一个"密码重置"功能,工作自然切成三个域:
- 后端:写 REST API(注册 / 登录 / refresh / 注销 / 重置)
- 前端:读那个 API,建 UI
- 测试:端到端跑一遍
可以让一个 agent 把这三件事都干了——但context window 会撑爆,它自己三步前干了什么都会忘,你花在管它身上的时间比省下来的多。
把工作切给"每个 agent 各管一域"会出新问题:前端怎么知道后端刚才干了什么、API 长什么样? 共享上下文(shared context)才是 Hermes Kanban 真正解决的问题。
心智模型:看板,但列后面坐的是 agent
传统看板:人有标题、描述、负责人、状态。人接活、过列、关闭。板是唯一的真相源。
Hermes Kanban 保留这套模型,把列后面的人换成 agent。关键设计:每个 task 是一行"扛得住 crash 和 reboot"的记录。agent 结束时写一份 summary(改了哪些文件、建了什么、下一个 agent 需要知道什么),下一个 agent 启动前先读这份 summary。
"The summary is the whole insight. It's what turns a group of agents into a team instead of strangers."
6 列词汇表
- Triage:粗糙的"我有这个想法"——"我想给 auth 加限流",还没具体 spec
- Todo:任务建好了但有依赖,等父任务结束
- Ready:依赖已解,等一个 agent 接
- In Progress:agent 正在跑
- Blocked:agent 撞墙了,挂起等人解。没人 unblock 之前什么都不动
- Done:跑完。完整 run history + summary + metadata 全保留
Blocked 那一列的存在感非常强:它把"agent 撞到一个真问题"和"agent 写了一个看似 OK 的东西"区分开了——前者进 Blocked,等人来裁决;后者直接进 Done,但这个 Done 是个定时炸弹。
Orchestrator:一个只管协调的 agent
PM agent 干 4 件事:读高层目标、查有哪些 agent profile 在、把目标切成有依赖链的 task、然后退一步。它永远不写代码、不跑测试。
一条铁律:建 task 之前先查 profile 列表。系统会静默跳过任何"分配给不存在的 profile"的 task——所以 step zero 永远是 kanban_list。
PM 把"做密码重置"拆成 backend → frontend → tester 的依赖链,等三个都跑完,PM 重新被唤醒,读三份 summary,判断"活儿算不算干完"。如果 tester 返回 verdict: FAIL,PM 自动建 fix task 重新进入循环。
实际体感上你不需要管这些——你在 Telegram 发一句话,orchestrator 自己接下去。
三个会反复用到的 pattern
1. Pipeline:每个 task 依赖前一个。只有第一个落在 ready,后面都等。当 backend agent 调 kanban_complete(),frontend task 自动从 todo 升到 ready,并把 backend 的 work 一起带过去。
2. Human in the loop:不是所有 block 都是 fail。有时候 agent 撞到一个真问题——比如发现 password strength 检查缺失、reset token 30 分钟内能重放——它就该停下来问人。Agent 调 kanban_block(reason="..."),dashboard 上能看到,你验证、修一下、调 hermes kanban unblock $IMPL 解开。系统下次循环重启 agent,第二次 run 一上来就调 kanban_show() 看到第一次为什么 block——不是从零开始。
3. Triage specifier:你只有一句话 "auth needs rate limiting" 的时候,把它丢上 Triage,系统在 dispatcher 派活之前先调 kanban specify 把三字标题扩成完整 task(含目标、方案、验收标准)。接活的 agent 拿到的是一份真正的 brief,不是一句话。
20 分钟搭出来:4 个 profile 拼装
Step 1:建 profile。hermes profile create backend-developer --clone——--clone 把 default profile 的 config 复制出来当起点,不用从 0 配。
Step 2:给每个 profile 写一份 SOUL.md。这是最被低估的一步——SOUL.md 是 agent 的固定身份(who it is / how it thinks),不是 prompt。例:
project-manager/SOUL.md:"你是 PM。把用户想法拆成清晰 task、分给对的人、在 Kanban 上跟进度。你不写代码"backend-developer/SOUL.md:"你是后端。整个 backend 用 InsForge——DB、auth、storage、edge functions、部署"frontend-developer/SOUL.md:"你是前端。组件、页面、用户流,接 backend 给的 API/SDK"tester/SOUL.md:"你是测试。端到端跑、验验收标准、清 bug 反馈回看板"
Step 3:装 skill。Skill 是"具体工作怎么做"的步骤化指南。Backend developer 装 InsForge/insforge-skills/insforge(加上 insforge-cli、insforge-debug、insforge-integrations);前端装 frontend-design;测试装 webapp-testing。Hermes Skills Hub 里有 687 个 skill(87 内置 + 79 可选 + 16 来自 Anthropic + 505 来自 LobeHub)。
Step 4:初始化看板 + 启 gateway。
hermes kanban init # 建 ~/.hermes/kanban.db (SQLite)
hermes -p project-manager gateway setup
hermes -p project-manager gateway start
gateway 24/7 跑,让 PM 在 Telegram 上保持可达。
Step 5:发第一个项目。在 Telegram 给 PM 发"做个密码重置流程"。PM 拆 task、建依赖链、剩下的事情自己跑起来。
Dashboard:127.0.0.1:9119
hermes dashboard 起来后是个本地 Web UI,一列一个状态,WebSocket 实时更新不需要刷。两个值得知道的小开关:
- Lanes by profile:在 Running 列里按 assignee 再分组,一眼看出哪个 agent 在干什么
- Nudge dispatcher:立刻跑一轮派活(不等 60 秒 cycle),刚 unblock 完一个 task 之后特别有用
点任意卡片打开抽屉,看完整的 run history、每一次 attempt 的 outcome、metadata、title / assignee / priority / dependencies 的可编辑字段。
三个生产化前必知的事
1. 数据库打爆。 2-4 个 agent 并行永远遇不到。10+ 个 agent 高频写时 SQLite 会慢。用 hermes kanban dispatch --max 4 限并发。
2. Scratch workspace 被清。 任务标 done 那一刻,scratch 里的文件按设计就被 wipe。写代码的 task 用 worktree,或者把项目路径写进 task description 里告诉 agent 文件放哪。
3. 本地模型过载。 接 Ollama / 本地 GPU 的话,并行几个 agent 一起来 GPU 就塞了,速度掉到触发 auto-stop。本地 setup 用 --max 2;接 Claude/GPT-4o 这种 API 后端基本不会遇到。
完整拼图:四块各干一件事
- SOUL.md = agent 的固定身份(who + how)
- Skills = 具体工作的步骤化指令
- Memory = agent 跨 session 对你环境的认知
- Kanban = 协调层:共享状态 + 上下文传递 + 任何时点都能插人
四份 SOUL.md、hermes kanban init、hermes gateway start,给 PM 在 Telegram 上发一句你想建什么,看板就开始填。一个 20 分钟就能跑起来的、能用 Telegram 在手机上管的、多 agent 软件团队。