Hermes Agent 完全攻略：自我进化 Agent 的新范式

いち（@ichiaimarketer）发布了一份万字级 Hermes Agent 完全攻略，基于 Akshay Pachaar（LightningAI 出身、BITS Pilani 毕业、3 项专利）的「Hermes Agent Masterclass」长文。原帖 257 万 impressions，日本 AI 圈大 buzz。

核心断言：OpenClaw 时代已经结束？

文章开头很 provocative：

"'只追 OpenClaw 就够了'的时代已经完全结束了。Hermes Agent 的出现改变了 AI Agent 的前提。海外已经到处是'只追 OpenClaw 是机会损失，时代是 Hermes Agent'的帖子。"

但文章实际立场更 nuanced：Hermes 和 OpenClaw 不是替代关系，是方向相反的架构选择。

Hermes vs OpenClaw：方向相反的架构

Kilo 博客的总结很精准：

"Hermes 是在'学习 Agent'周围卷了一层网关。OpenClaw 是在'消息网关'周围插入了 Agent。"

	Hermes	OpenClaw
核心	内部学习循环	消息连接体验
Agent 位置	主角	插件
连接方式	Telegram 等是入口	消息是核心体验
相同点	都追求"持久 + 消息优先"

两者都是开源 AI Agent 基础设施，但出发点完全相反。

Hermes 是什么：一句话定义

"越用越聪明的 Agent"。

公开 2 个月 GitHub star 破 90,000。开发者们正在悄悄建造"记住自己工作流、记住上下文、24 小时持续运行的个人 AI Agent"。

普通 AI Agent 的核心问题：会话结束瞬间，全部遗忘。编码偏好、项目规范、反复修正过的问题、昨天花 10 分钟找到的解法——全部消失。下次会话从零开始。

Hermes 把三个通常独立存在的能力塞进一个框架：

运行时技能学习（自己改写技能）
多层持久记忆
可选的权重学习管道（GEPA）

Akshay 断言："同时搭载这三者的开源 Agent 别无他家。连 OpenClaw 都没凑齐。"

架构全貌

核心是一个 AIAgent 类，内部包含：

SOUL.md：身份层（系统提示 slot #1）
3 层记忆系统：不同速度、不同用途
技能系统：自生成 + Curator 维护 + GEPA 优化
运行时循环：体验积累 → 技能生成 → 记忆更新

记忆系统：3 层 3 速度

层级	用途	速度
SOUL.md	身份、人格、核心指令	最慢（手动更新）
MEMORY.md	Agent 记录的事实、经验	中等（会话中自动写入）
USER.md	用户模型（偏好、习惯）	中等（会话中自动写入）
会话历史	近期对话上下文	最快（实时）

自我进化的技能系统

技能是 Hermes 的核心创新。每个技能是一个带 frontmatter 的 Markdown 文件：

---
name: debug-k8s-pod
version: 1.2.0
author: agent
platforms: [linux, macos]
---

## Procedure
1. Get pod status → check events → pull logs
2. Look for OOMed, ImagePullBackOff, config errors

## Pitfalls
- Forgetting --previous flag on restarted containers

## Verification
- Pod stays Running with 0 restarts for 5+ minutes

渐进式披露（Progressive Disclosure）控制 token 消耗：

Level 0：先看名字和描述（约 3,000 token）
Level 1：需要时加载技能正文
Level 2：可深入技能内的特定参考文件

技能创建触发条件：

完成需要 5 次以上工具调用的复杂任务
遇到错误或死胡同后找到可行路径
用户修正了方法
发现非显而易见的工作流

skill_manage 工具的 6 个动作：create / patch（推荐，token 效率高）/ edit / delete / write_file / remove_file

Curator：自动整理技能库

什么都不做的话，Agent 生成的技能会无限堆积。Curator 是后台维护功能，非 cron、非活跃检查启动：

最后执行后 7 天过去 + Agent 闲置 2 小时以上 → 后台 fork 启动（带自己的 prompt cache，不碰活跃对话）

两阶段运作：

自动迁移（确定性，无需 LLM）：30 天未用 → stale，90 天未用 → archive
LLM 审查（最多 8 轮迭代）：fork 的 Agent 审视自己生成的技能，判断 keep / patch / consolidate / archive

安全约束：

绝不碰捆绑技能或 Hub 安装的技能
绝不自动删除，最坏情况退避到 ~/.hermes/skills/.archive/
每次运行前打 tar.gz 快照，rollback 一个命令
hermes curator pin <skill> 可钉住保护

GEPA：离线技能优化

GEPA（Genetic-Pareto Prompt Evolution）是 Hermes 的"深度优化层"。不在 Hermes 运行时内，而是独立仓库（NousResearch/hermes-agent-self-evolution）的离线管道。

核心洞察：不要问 Agent"成功了吗？"——直接读执行日志，理解"为什么失败"，用进化搜索生成针对性改良方案。

管道流程：

从 Hermes 仓库读取当前技能
构建评估数据集（Claude Opus 合成测试用例 / SQLite 真实会话历史 / 手工 golden set）
GEPA 优化器运行：读执行日志 → 理解失败点 → 生成候选变体
LLM-as-judge 评分（非 binary，用 rubric 评估）
约束门：100% 通过测试套件 / 技能 ≤15KB / 保持缓存兼容 / 不偏离原始目的
最佳变体作为"PR"提交到 Hermes 仓库（绝不直接 commit）

成本：每次优化约 $2-10，纯 API 调用无需 GPU。

Akshay 的评价："在全量微调或 RL 之前，先试试这个。Berkeley 团队用 35 倍更少的 rollout、无 GPU 学习，就把 GRPO 超了 10 个点。"

完整循环

SOUL.md 定义身份
    ↓
运行时循环积累体验
    ↓
Curator 保持技能库整洁
    ↓
GEPA 担保"库里的内容真的有效"

快速启动

一键安装：

curl -fsSL https://hermesagent.ai/install | bash
source ~/.bashrc  # zsh 用 ~/.zshrc

设置向导：

hermes setup  # 依次询问 provider、API key、模型、工具

开始对话：

hermes  # 终端对话

Telegram 连接：

@BotFather 发送 /newbot 获取 token
@userinfobot 获取 Telegram User ID
填入配置

~/.hermes/ 目录结构

~/.hermes/
├── config.yaml          # 主设置（LLM 后端、工具、MCP）
├── .env                 # API key、bot token、密码
├── auth.json            # OAuth 认证
├── SOUL.md              # Agent 人格（系统提示 slot #1）
├── memories/
│   ├── MEMORY.md        # Agent 记录的事实
│   └── USER.md          # 用户模型
├── skills/              # 全部技能（内置 / Hub / Agent 生成）
│   ├── mlops/axolotl/...
│   ├── devops/
│   └── .hub/            # Skills Hub 状态
├── sessions/            # 平台별会话元数据
├── state.db             # FTS5 索引的 SQLite 会话存储
├── cron/                # 定时任务
├── plugins/             # 自定义插件
├── hooks/               # 生命周期钩子
└── skins/               # CLI 主题

Skills Hub

官方 Skills Hub 已有 18 类别 687 个技能：

内置技能：87 个
可选技能（按需开关）：79 个
Anthropic 制：16 个（frontend-design、pdf、pptx、docx、mcp-builder 等）
LobeHub 社区贡献：505 个

任意 GitHub 仓库可作为 "tap" 添加：

hermes skills tap add yourname/your-skills-repo
hermes skills install yourname/your-skills-repo/<skill-name>

多 Agent 并行：Profile 系统

Profile = 完全独立的 Hermes 实例，各自拥有 config、记忆、技能、会话、SOUL.md。默认互不共享。

创建团队：

hermes profile create designer --clone
hermes profile create programmer --clone
hermes profile create researcher --clone

每个 profile 需要独立的 Telegram Bot（Telegram 限制 1 token = 1 连接）。

SOUL.md 赋予不同人格：

设计师：

# Soul
You are an expert at creating hand-drawn illustrations that explain
AI, machine learning, and software engineering concepts...

程序员：

# Soul
You are my staff engineer. Terse, direct, pragmatic...

核心 takeaway

Hermes 不是 OpenClaw 的替代品，是不同方向的架构探索。它的真正创新在于：

技能自生成：Agent 自己写操作手册，下次遇到相似问题零成本复用
Curator 自动维护：解决"技能无限膨胀"的后台整理问题
GEPA 离线优化：用执行日志而非自我评估来进化技能，避免"自我感觉良好"的偏差
Profile 多 Agent：同一框架下运行多个专业人格，各自独立进化

对于已经深度使用 OpenClaw 的用户，Hermes 的 GEPA 和 Curator 机制值得借鉴——这是当前 OpenClaw 生态在"离线技能优化"上的空白。