返回 FEED
AGENT2026-05-11

从零到终极 Hermes Agent 军团

Hermes Agent。开源,MIT 许可,140K GitHub stars 且快速增长。由 Nous Research 构建。

这是完整拆解。心智模型、设置、API 密钥处理、第一个值得运行的定时任务、仪表板、扩展规则,以及如果我坐下来和你一起构建时会给你的每条实用建议。

TL;DR

→ Hermes 是一个随你成长的开源智能体。VPS、Mac Mini、笔记本电脑、Docker,甚至通过 Termux 的 Android。

→ 五大支柱:记忆、技能、灵魂、定时任务、自我改进循环。

→ 连接到 Telegram、Discord、Slack、WhatsApp、iMessage。

→ 我不用它替代 Claude Code。Hermes 是随身、语音优先、定时自动化层,生活在你的口袋里。

Hermes 到底是什么

它是你口袋里的智能体。

Claude Code 是我知识工作和桌面编码的日常驱动。

Hermes 是我在遛狗、飞行或远离笔记本电脑时从 Telegram 与之交谈的。

相同的大脑,不同的界面。

开箱即用,91 个技能随它附带。社区中心有 520+ 更多。其中 16 个是官方 Anthropic 技能。我从未需要安装 Excalidraw 或转录技能。两者都已经在那里。

我的主要 Hermes 运行:

  • 每日 AI 新闻简报发布到我的 Skool 社区
  • YouTube 评论监控与讽刺但不粗鲁的回复
  • Skool 社区互动
  • 早晨业务摘要
  • 服务器健康检查
  • 研究报告
  • 跟进提醒

全部定时。全部来自自然语言。

我曾经要求它使用 HyperFrames 制作一个关于自己的视频。它做了研究。自己安装了 HyperFrames。使用视觉给自己的输出评分。迭代。发布了一个不算差的视频。

心态转变:Hermes 理解 Hermes 比你更好。直接问它。

Hermes vs Claude Code vs OpenClaw

这些不是相同的工具。不要选一个。

Claude Code 是 Anthropic 的编码助手。生活在你的终端旁边,你的代码。你坐着驾驶它。桌面工作的日常驱动。

OpenClaw 由 Peter Steinberger 创建(现在在 OpenAI)。350K+ stars。NVIDIA 在其上构建了 Nemo Claw。强大的随身智能体。

Hermes 更轻、更快,更专注于自我改进循环。为想要 tinkering 开源模型如 Qwen 和 LLaMA 的人构建。

我从 OpenClaw 切换到 Hermes,因为 OpenClaw 在快速更新后经常崩溃。Hermes 对我来说更稳定。

解锁:所有这些可以在同一个 GitHub 仓库上并排运行。你的业务上下文、技能和记忆生活在版本控制中。然后任何智能体(Claude Code、Hermes、OpenClaw、Codex)都可以插入它。

术语变化(Claude.md vs Agents.md vs Hermes 文件),但每个智能体理解自己的约定。告诉它"让这个仓库为你工作",它就会适应。

五大支柱

这是让 Hermes 点击的心智模型。跳过这个,其他什么都不合理。

1️⃣ 记忆

→ user.md 是你、你的风格、你的偏好、你不喜欢的东西 → memory.md 是你的项目、你的环境、你的业务上下文 → 两者在会话开始时加载,所以智能体不会每次醒来都无状态 → 想想《记忆碎片》。智能体醒来时没有记忆,除非你为它们构建了上下文 → Hermes 自动提取事实并在你工作时更新这些文件 → 不要被动。告诉它:"把它扔进记忆"或"更新 user.md 这样我再也不用重复那个" → 保存持久的偏好和事实。使用会话搜索查找旧对话(存储在 SQLite 中) → 永远不要把秘密或临时任务状态放入记忆

2️⃣ 技能

→ 程序记忆。可复用的剧本 → 食谱类比:从记忆中要求巧克力碎片煎饼,它们不一致。拿出食谱,它们每次都一样。 → 存储为带有 YAML front matter 的 skill.md 文件 → Front matter 告诉智能体何时调用技能(渐进披露) → 主体仅在技能被调用时加载,所以你不会膨胀上下文 → Hermes 分析你的对话并提供将重复模式转化为技能 → 给予反馈,技能随时间更新

3️⃣ 灵魂

→ soul.md 塑造智能体的个性 → 启动六个 Hermes 智能体,每个都可以有自己的氛围 → 简洁、讽刺、直率、正式,任何适合角色的 → 我的 YouTube 评论 Hermes 是讽刺但不粗鲁的。都在灵魂中 → 随时间演变,因为你给予反馈

4️⃣ 定时任务

→ 这是 Hermes 让 Claude Code 望尘莫及的地方 → 告诉它"每天早上 6 点做 X",它就会做 → 每个定时任务在新鲜的隔离会话中运行,并将结果发送回聊天 → 有用标志:CONTEXTFROM 将一个作业的输出传递到下一个。WORKDIR 从项目文件夹运行工具。NOAGENT 在没有智能体 harness 循环的情况下运行脚本(只是执行工作流,没有智能体推理) → 定时任务会话不能递归创建更多定时任务,所以提示词必须是自包含的 → 你还可以设置有时间限制的定时任务。"接下来的 12 小时,每 10 分钟运行一次,然后杀死它"与 Claude Code 中的 /loop 斜杠命令工作方式相同

5️⃣ 自我改进循环

→ 做工作,获得反馈,保存到记忆 → 将可重复步骤转化为技能 → 当旧上下文重要时搜索过去会话 → 你使用它越多,它变得越好 → 诚实的警告:自动并不意味着魔法。当你当场纠正它、要求它保存东西、并让它在复杂工作后创建新技能时,循环工作最好

还有第六个荣誉提名:agents.md(Codex 的版本,类似于 Claude.md)。项目级上下文。当你在终端中使用 Hermes 进行编码时有用。

拯救你的 Claude Code 技巧

这是大多数人跳过的动作。不要。

构建一个 Claude Code 项目来管理你的 Hermes 智能体。

我有一个叫 vps-agents 的。在里面,每个智能体有自己的文件夹。我的有 bull(我的交易机器人)、我的主要 Hermes、uppit-os 和 claus(我的个人助理)。

每个文件夹存储: → IP 地址 → 管理员用户名和密码 → 哪些 API 密钥住在哪里的笔记 → 容器设置细节 → Docker 信息 → 安全和集成笔记

为什么重要:当晚上 11 点某物坏了,我不会在 Hostinger 中挖掘密码。我打开 Claude Code,指向项目,它为我修复智能体。

你在为助手构建助手。

设置你的 VPS

VPS 是你租用的云端计算机。获取 IP,获取密码,SSH 进入,安装东西。完成。

路径: → 选择一个计划。KVM2 足够开始。KVM1 如果你想要便宜。如果需要更多 CPU/RAM,以后扩展 → 年度计划节省真金白银。使用代码 NATEHURK 享受 10% 折扣 → 选择 Ubuntu 24.04 LTS 作为操作系统 → Hostinger 市场有一键安装 Hermes Agent 如果你想跳过手动路线 → 设置 root 密码(如果忘记,以后可以重新生成) → 打开免费恶意软件扫描器

现在重要的选择:在 VPS 的根目录安装还是使用 Docker?

根安装: Hermes 直接生活在 VPS 的根级别 → Docker 容器(一键): 每个智能体在自己的隔离容器中,有自己的密钥、记忆和工具

我选择了 Docker。每个智能体保持干净分离。以后很容易启动营销 Hermes、财务 Hermes 或内容 Hermes,每个在自己的容器中,每个有自己的 .env。

专业提示:更改主机名,这样你的 VPS 列表保持有序。我的看起来像 youtube-hermes.vps。Hostinger 的 UI 即时更新。

接入 Hermes

容器部署后,点击打开。输入管理员用户名和密码。接入触发。

推理提供商调用。Hermes 支持大量提供商。对大多数人来说最便宜的:

→ 通过 OAuth 的 OpenAI Codex。插入你现有的 ChatGPT 订阅(2020、100 或 $200/月)到 Hermes,而不是燃烧 API token。

对于开源纯粹主义模式,你可以在本地运行 Qwen 或 LLaMA。我还没到那一步。计划实验。

选择你的模型(我的情况是 GPT-5.5)。设置消息。从列表中用空格键选择 Telegram。

Telegram 设置,90 秒: 1️⃣ 打开 Telegram,给 BotFather 发消息,输入 /newbot 2️⃣ 命名你的机器人。用户名必须以 "Bot" 结尾 3️⃣ 复制 token。粘贴回 Hermes 终端 4️⃣ 从 USERINFO 机器人获取你的 Telegram 用户 ID 5️⃣ 将用户 ID 粘贴到 Hermes 以锁定机器人给你

附带的工具已启用:视觉、浏览器自动化、图像生成、文本转语音、终端命令、任务规划、技能。

保存 Hermes 在接入期间打印的一切(设置路径、API 密钥路径、配置路径)到你的 Claude Code 项目。未来的你会感谢现在的你。

这是突出的。我开始之前不需要知道这些。我只是问 Hermes 和 Claude Code 在我进行时解释它。

API 密钥,正确的方式

不要在聊天中粘贴 API 密钥。即使模型是私人的,密钥现在在对话历史中。

如果你使用托管模型,不小心掉了一个,就轮换它。不是世界末日。但最佳实践是永远不要粘贴它们。

正确的方式: 1️⃣ SSH 进入你的容器 2️⃣ 运行 hermes config set GITHUB_TOKEN [your_token] 3️⃣ 密钥保存到容器的 /opt/data/.env。模型永远看不到。不在日志中。

每个密钥相同模式。按智能体命名。范围限制到智能体实际需要的最小权限。

如果你需要擦除或轮换密钥,要求 Hermes 提供 Nano 命令打开正确的 .env。我第一次尝试时,命令指向根 VPS .env,不是容器的。我告诉它智能体在 Docker 内运行后,Hermes 纠正了自己。教训:你不需要理解路径树,你只需要清楚沟通你看到了什么。

第一个值得构建的定时任务

将 Hermes 连接到私有 GitHub 仓库。然后安排夜间同步。

如果 VPS 损坏,你的技能和记忆就没了。有了 GitHub 备份,你启动新的 Hermes,指向仓库,你就回来了。

我告诉我的智能体:"每天晚上午夜 Central,把除秘密外的一切推送到我的私有 GitHub 仓库。"

它构建了技能。设置了定时任务。写了 .gitignore,这样秘密永远不会被提交。完成。

烦人的部分:容器默认在 UTC 运行。Hermes 在整点自检 Central 时间以处理夏令时。它自己弄清楚了。

Token 最佳实践:经典 GitHub token,范围仅限 repo + contents(读写)。不要授予智能体超过需要的权限。

这就是循环。自然语言输入。工作自动化输出。

CLI vs Telegram

相同的智能体,相同的大脑,相同的技能,相同的记忆,相同的窗口。不同的界面。

CLI(终端) 是驾驶舱。最适合深度工作、编码、硬核构建。你可以看到上下文使用、管理压缩、点击斜杠命令,并像操作系统一样生活在里面。

Telegram 是遥控器。最适合定时任务、快速任务、语音消息、随身知识工作、从你的手机与之交谈。

Telegram 对上下文的可见性较低。会话感觉模糊,因为自动压缩在后台运行,你真的看不到何时。所以不要从 Telegram 进行 vibe coding 应用。上下文腐烂的风险太高。

但对于"嘿检查 ClickUp"、"为我研究这个"、"安排这个定时任务"、"发布到 Skool"——Telegram 比 CLI 更快。

基于 token 的上下文,不是基于消息的。模型总是看到系统提示词 + user.md + soul.md + memory.md。那都必须适合。当你接近限制时,自动压缩触发。

你的第一个技能的两种路径

添加技能有两种方式。

描述一个结果。 "每天晚上午夜 Central,同步这个仓库。" Hermes 构建技能,命名它,设置定时任务,发布它。

从 URL 安装一个。 从社区中心或你自己的 Claude Code 项目获取技能。告诉 Hermes 链接。它安装并注册它。

我通过要求 Hermes 安装官方 HyperFrames 技能并基于自己的 soul.md 生成一个 5 秒的介绍自己的视频来测试。它做了安装,运行了技能,并产生了可用的剪辑,无需额外手把手。

观察智能体工作时。如果你想让它调用技能而它没有,那是你的信号告诉它:"更新 YAML front matter,这样这个技能在我这样说时触发。"

技能就是这样变锐利的。

像对待新员工一样对待 Hermes

这是不可协商的。

→ 每个 Hermes 智能体有自己的账户(Gmail 或智能体邮件),不是你的 → 每个智能体有自己的 API 密钥,范围紧 → 使用按智能体命名的 API 密钥(OpenRouter、Perplexity 等),这样你可以看到哪个智能体在花费什么 → 最小权限规则:只有工作需要的凭证和工具 → 营销智能体不需要 QuickBooks 的读取访问。财务智能体需要

你不会把信用卡交给全新实习生。也不要交给你的智能体。

也锁定 VPS。在 Hostinger 上设置防火墙,限制到你的 IP,阻止未使用的端口。构建一个运行夜间安全审计的技能。Hermes 可以攻击自己的设置并报告它发现了什么。

我之前对防火墙一无所知。Hermes 和 Claude Code 带我走过。智能体教你系统。

维护规则

这些是我遵循的规则,以保持智能体锐利:

→ 同一件事错了两次?当场纠正它,并告诉它更新相关技能或记忆 → 相同指令两次?要求 Hermes 为它写一个技能 → 冗长或语调不对?编辑灵魂 → 新定时任务?构建技能,然后要求 Hermes 安排它 → 某物坏了?首先检查 memory.md。陈旧的记忆是奇怪智能体行为的第一大原因

随时审计。"读你的记忆文件。读你的灵魂文件。"看看里面有什么。剪掉错误的。

这不是你完成设置的工具。这是你不断训练的队友。

压缩会击中。不要恐慌

最终你会击中自动压缩阈值。我的在约 170K token 触发(阈值约 136K)。

当它失败时,Hermes 插入回退上下文标记,暂停需要暂停的定时任务,并在继续前更新记忆。

如果你不理解刚刚发生了什么,把消息粘贴回给它:"向我解释这个。那个回退标记是什么意思?"它会解释。那是循环的一部分。

何时启动第二个 Hermes

简单决策树:

→ 需要自己的凭证、秘密或工具?→ 新智能体 → 需要自己的长期记忆?→ 新智能体 → 持续的、重复的工作,基本上是单独的角色?→ 新智能体 → 否则 → 保留在你的主要个人智能体中

建议:首先从你的主要个人 Hermes 中获取最大使用。一旦你在那里构建了五到十个技能,分裂就变得明显。

迁移很容易。技能、定时任务、灵魂、记忆都是 markdown 文件。移动它们,指向新智能体,你就运行了。

坏模式:一个拥有每个 API 密钥、每个技能、每个定时任务的巨型智能体。高混乱。某物坏时高爆炸半径。

好模式:一个主要个人 Hermes 加上为营销、财务、内容或任何适合的垂直领域分离的智能体。每个在自己的 Docker 容器中。每个有范围的密钥。每个有自己的 .env,永远不会提交到 GitHub。

你的主要 Hermes 可以帮助你规划组织结构。像对待你的 COO 一样对待它。问它:"基于我们构建的,我应该首先分裂什么?"它会有意见。

仪表板和看板

Hermes 附带自己的仪表板。最近会话、连接平台、密钥、配置、技能、插件、定时任务,以及用于在多个智能体之间分配任务的看板。

第一次打开时,你必须隧道进入容器,打开网关,并运行几个命令。第一次尝试很笨拙。

修复:告诉你的 Hermes "我想打开仪表板。带我走过。"一旦有效,要求它将步骤保存为技能,这样未来的打开是三个命令。

我很少使用仪表板,因为我的大部分 Hermes 工作在随身进行。但如果你运行多个智能体并想视觉分配任务,看板是可靠的。

总结

Hermes 不是 Claude Code 的替代品。

它是随身、语音优先、定时自动化层,生活在你的口袋里并随你成长。

启动一个。连接 Telegram。设置 GitHub 备份。构建几个技能。复利在那之后开始。