返回 FEED
AGENT2026-05-20

Hermes Agent 完全攻略:自我进化 Agent 的新范式

いち(@ichiaimarketer)发布了一份万字级 Hermes Agent 完全攻略,基于 Akshay Pachaar(LightningAI 出身、BITS Pilani 毕业、3 项专利)的「Hermes Agent Masterclass」长文。原帖 257 万 impressions,日本 AI 圈大 buzz。

核心断言:OpenClaw 时代已经结束?

文章开头很 provocative:

"'只追 OpenClaw 就够了'的时代已经完全结束了。Hermes Agent 的出现改变了 AI Agent 的前提。海外已经到处是'只追 OpenClaw 是机会损失,时代是 Hermes Agent'的帖子。"

但文章实际立场更 nuanced:Hermes 和 OpenClaw 不是替代关系,是方向相反的架构选择。

Hermes vs OpenClaw:方向相反的架构

Kilo 博客的总结很精准:

"Hermes 是在'学习 Agent'周围卷了一层网关。OpenClaw 是在'消息网关'周围插入了 Agent。"

HermesOpenClaw
核心内部学习循环消息连接体验
Agent 位置主角插件
连接方式Telegram 等是入口消息是核心体验
相同点都追求"持久 + 消息优先"

两者都是开源 AI Agent 基础设施,但出发点完全相反。

Hermes 是什么:一句话定义

"越用越聪明的 Agent"

公开 2 个月 GitHub star 破 90,000。开发者们正在悄悄建造"记住自己工作流、记住上下文、24 小时持续运行的个人 AI Agent"。

普通 AI Agent 的核心问题:会话结束瞬间,全部遗忘。编码偏好、项目规范、反复修正过的问题、昨天花 10 分钟找到的解法——全部消失。下次会话从零开始。

Hermes 把三个通常独立存在的能力塞进一个框架:

  1. 运行时技能学习(自己改写技能)
  2. 多层持久记忆
  3. 可选的权重学习管道(GEPA)

Akshay 断言:"同时搭载这三者的开源 Agent 别无他家。连 OpenClaw 都没凑齐。"

架构全貌

核心是一个 AIAgent 类,内部包含:

  • SOUL.md:身份层(系统提示 slot #1)
  • 3 层记忆系统:不同速度、不同用途
  • 技能系统:自生成 + Curator 维护 + GEPA 优化
  • 运行时循环:体验积累 → 技能生成 → 记忆更新

记忆系统:3 层 3 速度

层级用途速度
SOUL.md身份、人格、核心指令最慢(手动更新)
MEMORY.mdAgent 记录的事实、经验中等(会话中自动写入)
USER.md用户模型(偏好、习惯)中等(会话中自动写入)
会话历史近期对话上下文最快(实时)

自我进化的技能系统

技能是 Hermes 的核心创新。每个技能是一个带 frontmatter 的 Markdown 文件:

---
name: debug-k8s-pod
version: 1.2.0
author: agent
platforms: [linux, macos]
---

## Procedure
1. Get pod status → check events → pull logs
2. Look for OOMed, ImagePullBackOff, config errors

## Pitfalls
- Forgetting --previous flag on restarted containers

## Verification
- Pod stays Running with 0 restarts for 5+ minutes

渐进式披露(Progressive Disclosure)控制 token 消耗:

  • Level 0:先看名字和描述(约 3,000 token)
  • Level 1:需要时加载技能正文
  • Level 2:可深入技能内的特定参考文件

技能创建触发条件

  • 完成需要 5 次以上工具调用的复杂任务
  • 遇到错误或死胡同后找到可行路径
  • 用户修正了方法
  • 发现非显而易见的工作流

skill_manage 工具的 6 个动作:create / patch(推荐,token 效率高)/ edit / delete / write_file / remove_file

Curator:自动整理技能库

什么都不做的话,Agent 生成的技能会无限堆积。Curator 是后台维护功能,非 cron、非活跃检查启动:

  • 最后执行后 7 天过去 + Agent 闲置 2 小时以上 → 后台 fork 启动(带自己的 prompt cache,不碰活跃对话)

两阶段运作

  1. 自动迁移(确定性,无需 LLM):30 天未用 → stale,90 天未用 → archive
  2. LLM 审查(最多 8 轮迭代):fork 的 Agent 审视自己生成的技能,判断 keep / patch / consolidate / archive

安全约束

  • 绝不碰捆绑技能或 Hub 安装的技能
  • 绝不自动删除,最坏情况退避到 ~/.hermes/skills/.archive/
  • 每次运行前打 tar.gz 快照,rollback 一个命令
  • hermes curator pin <skill> 可钉住保护

GEPA:离线技能优化

GEPA(Genetic-Pareto Prompt Evolution)是 Hermes 的"深度优化层"。不在 Hermes 运行时内,而是独立仓库(NousResearch/hermes-agent-self-evolution)的离线管道。

核心洞察:不要问 Agent"成功了吗?"——直接读执行日志,理解"为什么失败",用进化搜索生成针对性改良方案。

管道流程

  1. 从 Hermes 仓库读取当前技能
  2. 构建评估数据集(Claude Opus 合成测试用例 / SQLite 真实会话历史 / 手工 golden set)
  3. GEPA 优化器运行:读执行日志 → 理解失败点 → 生成候选变体
  4. LLM-as-judge 评分(非 binary,用 rubric 评估)
  5. 约束门:100% 通过测试套件 / 技能 ≤15KB / 保持缓存兼容 / 不偏离原始目的
  6. 最佳变体作为"PR"提交到 Hermes 仓库(绝不直接 commit)

成本:每次优化约 $2-10,纯 API 调用无需 GPU。

Akshay 的评价:"在全量微调或 RL 之前,先试试这个。Berkeley 团队用 35 倍更少的 rollout、无 GPU 学习,就把 GRPO 超了 10 个点。"

完整循环

SOUL.md 定义身份
    ↓
运行时循环积累体验
    ↓
Curator 保持技能库整洁
    ↓
GEPA 担保"库里的内容真的有效"

快速启动

一键安装

curl -fsSL https://hermesagent.ai/install | bash
source ~/.bashrc  # zsh 用 ~/.zshrc

设置向导

hermes setup  # 依次询问 provider、API key、模型、工具

开始对话

hermes  # 终端对话

Telegram 连接

  • @BotFather 发送 /newbot 获取 token
  • @userinfobot 获取 Telegram User ID
  • 填入配置

~/.hermes/ 目录结构

~/.hermes/
├── config.yaml          # 主设置(LLM 后端、工具、MCP)
├── .env                 # API key、bot token、密码
├── auth.json            # OAuth 认证
├── SOUL.md              # Agent 人格(系统提示 slot #1)
├── memories/
│   ├── MEMORY.md        # Agent 记录的事实
│   └── USER.md          # 用户模型
├── skills/              # 全部技能(内置 / Hub / Agent 生成)
│   ├── mlops/axolotl/...
│   ├── devops/
│   └── .hub/            # Skills Hub 状态
├── sessions/            # 平台별会话元数据
├── state.db             # FTS5 索引的 SQLite 会话存储
├── cron/                # 定时任务
├── plugins/             # 自定义插件
├── hooks/               # 生命周期钩子
└── skins/               # CLI 主题

Skills Hub

官方 Skills Hub 已有 18 类别 687 个技能

  • 内置技能:87 个
  • 可选技能(按需开关):79 个
  • Anthropic 制:16 个(frontend-design、pdf、pptx、docx、mcp-builder 等)
  • LobeHub 社区贡献:505 个

任意 GitHub 仓库可作为 "tap" 添加:

hermes skills tap add yourname/your-skills-repo
hermes skills install yourname/your-skills-repo/<skill-name>

多 Agent 并行:Profile 系统

Profile = 完全独立的 Hermes 实例,各自拥有 config、记忆、技能、会话、SOUL.md。默认互不共享。

创建团队:

hermes profile create designer --clone
hermes profile create programmer --clone
hermes profile create researcher --clone

每个 profile 需要独立的 Telegram Bot(Telegram 限制 1 token = 1 连接)。

SOUL.md 赋予不同人格

设计师:

# Soul
You are an expert at creating hand-drawn illustrations that explain
AI, machine learning, and software engineering concepts...

程序员:

# Soul
You are my staff engineer. Terse, direct, pragmatic...

核心 takeaway

Hermes 不是 OpenClaw 的替代品,是不同方向的架构探索。它的真正创新在于:

  1. 技能自生成:Agent 自己写操作手册,下次遇到相似问题零成本复用
  2. Curator 自动维护:解决"技能无限膨胀"的后台整理问题
  3. GEPA 离线优化:用执行日志而非自我评估来进化技能,避免"自我感觉良好"的偏差
  4. Profile 多 Agent:同一框架下运行多个专业人格,各自独立进化

对于已经深度使用 OpenClaw 的用户,Hermes 的 GEPA 和 Curator 机制值得借鉴——这是当前 OpenClaw 生态在"离线技能优化"上的空白。