いち(@ichiaimarketer)发布了一份万字级 Hermes Agent 完全攻略,基于 Akshay Pachaar(LightningAI 出身、BITS Pilani 毕业、3 项专利)的「Hermes Agent Masterclass」长文。原帖 257 万 impressions,日本 AI 圈大 buzz。
核心断言:OpenClaw 时代已经结束?
文章开头很 provocative:
"'只追 OpenClaw 就够了'的时代已经完全结束了。Hermes Agent 的出现改变了 AI Agent 的前提。海外已经到处是'只追 OpenClaw 是机会损失,时代是 Hermes Agent'的帖子。"
但文章实际立场更 nuanced:Hermes 和 OpenClaw 不是替代关系,是方向相反的架构选择。
Hermes vs OpenClaw:方向相反的架构
Kilo 博客的总结很精准:
"Hermes 是在'学习 Agent'周围卷了一层网关。OpenClaw 是在'消息网关'周围插入了 Agent。"
| Hermes | OpenClaw | |
|---|---|---|
| 核心 | 内部学习循环 | 消息连接体验 |
| Agent 位置 | 主角 | 插件 |
| 连接方式 | Telegram 等是入口 | 消息是核心体验 |
| 相同点 | 都追求"持久 + 消息优先" |
两者都是开源 AI Agent 基础设施,但出发点完全相反。
Hermes 是什么:一句话定义
"越用越聪明的 Agent"。
公开 2 个月 GitHub star 破 90,000。开发者们正在悄悄建造"记住自己工作流、记住上下文、24 小时持续运行的个人 AI Agent"。
普通 AI Agent 的核心问题:会话结束瞬间,全部遗忘。编码偏好、项目规范、反复修正过的问题、昨天花 10 分钟找到的解法——全部消失。下次会话从零开始。
Hermes 把三个通常独立存在的能力塞进一个框架:
- 运行时技能学习(自己改写技能)
- 多层持久记忆
- 可选的权重学习管道(GEPA)
Akshay 断言:"同时搭载这三者的开源 Agent 别无他家。连 OpenClaw 都没凑齐。"
架构全貌
核心是一个 AIAgent 类,内部包含:
- SOUL.md:身份层(系统提示 slot #1)
- 3 层记忆系统:不同速度、不同用途
- 技能系统:自生成 + Curator 维护 + GEPA 优化
- 运行时循环:体验积累 → 技能生成 → 记忆更新
记忆系统:3 层 3 速度
| 层级 | 用途 | 速度 |
|---|---|---|
| SOUL.md | 身份、人格、核心指令 | 最慢(手动更新) |
| MEMORY.md | Agent 记录的事实、经验 | 中等(会话中自动写入) |
| USER.md | 用户模型(偏好、习惯) | 中等(会话中自动写入) |
| 会话历史 | 近期对话上下文 | 最快(实时) |
自我进化的技能系统
技能是 Hermes 的核心创新。每个技能是一个带 frontmatter 的 Markdown 文件:
---
name: debug-k8s-pod
version: 1.2.0
author: agent
platforms: [linux, macos]
---
## Procedure
1. Get pod status → check events → pull logs
2. Look for OOMed, ImagePullBackOff, config errors
## Pitfalls
- Forgetting --previous flag on restarted containers
## Verification
- Pod stays Running with 0 restarts for 5+ minutes
渐进式披露(Progressive Disclosure)控制 token 消耗:
- Level 0:先看名字和描述(约 3,000 token)
- Level 1:需要时加载技能正文
- Level 2:可深入技能内的特定参考文件
技能创建触发条件:
- 完成需要 5 次以上工具调用的复杂任务
- 遇到错误或死胡同后找到可行路径
- 用户修正了方法
- 发现非显而易见的工作流
skill_manage 工具的 6 个动作:create / patch(推荐,token 效率高)/ edit / delete / write_file / remove_file
Curator:自动整理技能库
什么都不做的话,Agent 生成的技能会无限堆积。Curator 是后台维护功能,非 cron、非活跃检查启动:
- 最后执行后 7 天过去 + Agent 闲置 2 小时以上 → 后台 fork 启动(带自己的 prompt cache,不碰活跃对话)
两阶段运作:
- 自动迁移(确定性,无需 LLM):30 天未用 → stale,90 天未用 → archive
- LLM 审查(最多 8 轮迭代):fork 的 Agent 审视自己生成的技能,判断 keep / patch / consolidate / archive
安全约束:
- 绝不碰捆绑技能或 Hub 安装的技能
- 绝不自动删除,最坏情况退避到 ~/.hermes/skills/.archive/
- 每次运行前打 tar.gz 快照,rollback 一个命令
hermes curator pin <skill>可钉住保护
GEPA:离线技能优化
GEPA(Genetic-Pareto Prompt Evolution)是 Hermes 的"深度优化层"。不在 Hermes 运行时内,而是独立仓库(NousResearch/hermes-agent-self-evolution)的离线管道。
核心洞察:不要问 Agent"成功了吗?"——直接读执行日志,理解"为什么失败",用进化搜索生成针对性改良方案。
管道流程:
- 从 Hermes 仓库读取当前技能
- 构建评估数据集(Claude Opus 合成测试用例 / SQLite 真实会话历史 / 手工 golden set)
- GEPA 优化器运行:读执行日志 → 理解失败点 → 生成候选变体
- LLM-as-judge 评分(非 binary,用 rubric 评估)
- 约束门:100% 通过测试套件 / 技能 ≤15KB / 保持缓存兼容 / 不偏离原始目的
- 最佳变体作为"PR"提交到 Hermes 仓库(绝不直接 commit)
成本:每次优化约 $2-10,纯 API 调用无需 GPU。
Akshay 的评价:"在全量微调或 RL 之前,先试试这个。Berkeley 团队用 35 倍更少的 rollout、无 GPU 学习,就把 GRPO 超了 10 个点。"
完整循环
SOUL.md 定义身份
↓
运行时循环积累体验
↓
Curator 保持技能库整洁
↓
GEPA 担保"库里的内容真的有效"
快速启动
一键安装:
curl -fsSL https://hermesagent.ai/install | bash
source ~/.bashrc # zsh 用 ~/.zshrc
设置向导:
hermes setup # 依次询问 provider、API key、模型、工具
开始对话:
hermes # 终端对话
Telegram 连接:
- @BotFather 发送 /newbot 获取 token
- @userinfobot 获取 Telegram User ID
- 填入配置
~/.hermes/ 目录结构
~/.hermes/
├── config.yaml # 主设置(LLM 后端、工具、MCP)
├── .env # API key、bot token、密码
├── auth.json # OAuth 认证
├── SOUL.md # Agent 人格(系统提示 slot #1)
├── memories/
│ ├── MEMORY.md # Agent 记录的事实
│ └── USER.md # 用户模型
├── skills/ # 全部技能(内置 / Hub / Agent 生成)
│ ├── mlops/axolotl/...
│ ├── devops/
│ └── .hub/ # Skills Hub 状态
├── sessions/ # 平台별会话元数据
├── state.db # FTS5 索引的 SQLite 会话存储
├── cron/ # 定时任务
├── plugins/ # 自定义插件
├── hooks/ # 生命周期钩子
└── skins/ # CLI 主题
Skills Hub
官方 Skills Hub 已有 18 类别 687 个技能:
- 内置技能:87 个
- 可选技能(按需开关):79 个
- Anthropic 制:16 个(frontend-design、pdf、pptx、docx、mcp-builder 等)
- LobeHub 社区贡献:505 个
任意 GitHub 仓库可作为 "tap" 添加:
hermes skills tap add yourname/your-skills-repo
hermes skills install yourname/your-skills-repo/<skill-name>
多 Agent 并行:Profile 系统
Profile = 完全独立的 Hermes 实例,各自拥有 config、记忆、技能、会话、SOUL.md。默认互不共享。
创建团队:
hermes profile create designer --clone
hermes profile create programmer --clone
hermes profile create researcher --clone
每个 profile 需要独立的 Telegram Bot(Telegram 限制 1 token = 1 连接)。
SOUL.md 赋予不同人格:
设计师:
# Soul
You are an expert at creating hand-drawn illustrations that explain
AI, machine learning, and software engineering concepts...
程序员:
# Soul
You are my staff engineer. Terse, direct, pragmatic...
核心 takeaway
Hermes 不是 OpenClaw 的替代品,是不同方向的架构探索。它的真正创新在于:
- 技能自生成:Agent 自己写操作手册,下次遇到相似问题零成本复用
- Curator 自动维护:解决"技能无限膨胀"的后台整理问题
- GEPA 离线优化:用执行日志而非自我评估来进化技能,避免"自我感觉良好"的偏差
- Profile 多 Agent:同一框架下运行多个专业人格,各自独立进化
对于已经深度使用 OpenClaw 的用户,Hermes 的 GEPA 和 Curator 机制值得借鉴——这是当前 OpenClaw 生态在"离线技能优化"上的空白。