从零到终极 Hermes Agent 军团

Hermes Agent。开源，MIT 许可，140K GitHub stars 且快速增长。由 Nous Research 构建。

这是完整拆解。心智模型、设置、API 密钥处理、第一个值得运行的定时任务、仪表板、扩展规则，以及如果我坐下来和你一起构建时会给你的每条实用建议。

TL;DR

→ Hermes 是一个随你成长的开源智能体。VPS、Mac Mini、笔记本电脑、Docker，甚至通过 Termux 的 Android。

→ 五大支柱：记忆、技能、灵魂、定时任务、自我改进循环。

→ 连接到 Telegram、Discord、Slack、WhatsApp、iMessage。

→ 我不用它替代 Claude Code。Hermes 是随身、语音优先、定时自动化层，生活在你的口袋里。

Hermes 到底是什么

它是你口袋里的智能体。

Claude Code 是我知识工作和桌面编码的日常驱动。

Hermes 是我在遛狗、飞行或远离笔记本电脑时从 Telegram 与之交谈的。

相同的大脑，不同的界面。

开箱即用，91 个技能随它附带。社区中心有 520+ 更多。其中 16 个是官方 Anthropic 技能。我从未需要安装 Excalidraw 或转录技能。两者都已经在那里。

我的主要 Hermes 运行：

每日 AI 新闻简报发布到我的 Skool 社区
YouTube 评论监控与讽刺但不粗鲁的回复
Skool 社区互动
早晨业务摘要
服务器健康检查
研究报告
跟进提醒

全部定时。全部来自自然语言。

我曾经要求它使用 HyperFrames 制作一个关于自己的视频。它做了研究。自己安装了 HyperFrames。使用视觉给自己的输出评分。迭代。发布了一个不算差的视频。

心态转变：Hermes 理解 Hermes 比你更好。直接问它。

Hermes vs Claude Code vs OpenClaw

这些不是相同的工具。不要选一个。

→ Claude Code 是 Anthropic 的编码助手。生活在你的终端旁边，你的代码。你坐着驾驶它。桌面工作的日常驱动。

→ OpenClaw 由 Peter Steinberger 创建（现在在 OpenAI）。350K+ stars。NVIDIA 在其上构建了 Nemo Claw。强大的随身智能体。

→ Hermes 更轻、更快，更专注于自我改进循环。为想要 tinkering 开源模型如 Qwen 和 LLaMA 的人构建。

我从 OpenClaw 切换到 Hermes，因为 OpenClaw 在快速更新后经常崩溃。Hermes 对我来说更稳定。

解锁：所有这些可以在同一个 GitHub 仓库上并排运行。你的业务上下文、技能和记忆生活在版本控制中。然后任何智能体（Claude Code、Hermes、OpenClaw、Codex）都可以插入它。

术语变化（Claude.md vs Agents.md vs Hermes 文件），但每个智能体理解自己的约定。告诉它"让这个仓库为你工作"，它就会适应。

五大支柱

这是让 Hermes 点击的心智模型。跳过这个，其他什么都不合理。

1️⃣ 记忆

→ user.md 是你、你的风格、你的偏好、你不喜欢的东西 → memory.md 是你的项目、你的环境、你的业务上下文 → 两者在会话开始时加载，所以智能体不会每次醒来都无状态 → 想想《记忆碎片》。智能体醒来时没有记忆，除非你为它们构建了上下文 → Hermes 自动提取事实并在你工作时更新这些文件 → 不要被动。告诉它："把它扔进记忆"或"更新 user.md 这样我再也不用重复那个" → 保存持久的偏好和事实。使用会话搜索查找旧对话（存储在 SQLite 中） → 永远不要把秘密或临时任务状态放入记忆

2️⃣ 技能

→ 程序记忆。可复用的剧本 → 食谱类比：从记忆中要求巧克力碎片煎饼，它们不一致。拿出食谱，它们每次都一样。 → 存储为带有 YAML front matter 的 skill.md 文件 → Front matter 告诉智能体何时调用技能（渐进披露） → 主体仅在技能被调用时加载，所以你不会膨胀上下文 → Hermes 分析你的对话并提供将重复模式转化为技能 → 给予反馈，技能随时间更新

3️⃣ 灵魂

→ soul.md 塑造智能体的个性 → 启动六个 Hermes 智能体，每个都可以有自己的氛围 → 简洁、讽刺、直率、正式，任何适合角色的 → 我的 YouTube 评论 Hermes 是讽刺但不粗鲁的。都在灵魂中 → 随时间演变，因为你给予反馈

4️⃣ 定时任务

→ 这是 Hermes 让 Claude Code 望尘莫及的地方 → 告诉它"每天早上 6 点做 X"，它就会做 → 每个定时任务在新鲜的隔离会话中运行，并将结果发送回聊天 → 有用标志：CONTEXTFROM 将一个作业的输出传递到下一个。WORKDIR 从项目文件夹运行工具。NOAGENT 在没有智能体 harness 循环的情况下运行脚本（只是执行工作流，没有智能体推理） → 定时任务会话不能递归创建更多定时任务，所以提示词必须是自包含的 → 你还可以设置有时间限制的定时任务。"接下来的 12 小时，每 10 分钟运行一次，然后杀死它"与 Claude Code 中的 /loop 斜杠命令工作方式相同

5️⃣ 自我改进循环

→ 做工作，获得反馈，保存到记忆 → 将可重复步骤转化为技能 → 当旧上下文重要时搜索过去会话 → 你使用它越多，它变得越好 → 诚实的警告：自动并不意味着魔法。当你当场纠正它、要求它保存东西、并让它在复杂工作后创建新技能时，循环工作最好

还有第六个荣誉提名：agents.md（Codex 的版本，类似于 Claude.md）。项目级上下文。当你在终端中使用 Hermes 进行编码时有用。

拯救你的 Claude Code 技巧

这是大多数人跳过的动作。不要。

构建一个 Claude Code 项目来管理你的 Hermes 智能体。

我有一个叫 vps-agents 的。在里面，每个智能体有自己的文件夹。我的有 bull（我的交易机器人）、我的主要 Hermes、uppit-os 和 claus（我的个人助理）。

每个文件夹存储： → IP 地址 → 管理员用户名和密码 → 哪些 API 密钥住在哪里的笔记 → 容器设置细节 → Docker 信息 → 安全和集成笔记

为什么重要：当晚上 11 点某物坏了，我不会在 Hostinger 中挖掘密码。我打开 Claude Code，指向项目，它为我修复智能体。

你在为助手构建助手。

设置你的 VPS

VPS 是你租用的云端计算机。获取 IP，获取密码，SSH 进入，安装东西。完成。

路径： → 选择一个计划。KVM2 足够开始。KVM1 如果你想要便宜。如果需要更多 CPU/RAM，以后扩展 → 年度计划节省真金白银。使用代码 NATEHURK 享受 10% 折扣 → 选择 Ubuntu 24.04 LTS 作为操作系统 → Hostinger 市场有一键安装 Hermes Agent 如果你想跳过手动路线 → 设置 root 密码（如果忘记，以后可以重新生成） → 打开免费恶意软件扫描器

现在重要的选择：在 VPS 的根目录安装还是使用 Docker？

→ 根安装： Hermes 直接生活在 VPS 的根级别 → Docker 容器（一键）： 每个智能体在自己的隔离容器中，有自己的密钥、记忆和工具

我选择了 Docker。每个智能体保持干净分离。以后很容易启动营销 Hermes、财务 Hermes 或内容 Hermes，每个在自己的容器中，每个有自己的 .env。

专业提示：更改主机名，这样你的 VPS 列表保持有序。我的看起来像 youtube-hermes.vps。Hostinger 的 UI 即时更新。

接入 Hermes

容器部署后，点击打开。输入管理员用户名和密码。接入触发。

推理提供商调用。Hermes 支持大量提供商。对大多数人来说最便宜的：

→ 通过 OAuth 的 OpenAI Codex。插入你现有的 ChatGPT 订阅（ $20、$ 100 或 $200/月）到 Hermes，而不是燃烧 API token。

对于开源纯粹主义模式，你可以在本地运行 Qwen 或 LLaMA。我还没到那一步。计划实验。

选择你的模型（我的情况是 GPT-5.5）。设置消息。从列表中用空格键选择 Telegram。

Telegram 设置，90 秒： 1️⃣ 打开 Telegram，给 BotFather 发消息，输入 /newbot 2️⃣ 命名你的机器人。用户名必须以 "Bot" 结尾 3️⃣ 复制 token。粘贴回 Hermes 终端 4️⃣ 从 USERINFO 机器人获取你的 Telegram 用户 ID 5️⃣ 将用户 ID 粘贴到 Hermes 以锁定机器人给你

附带的工具已启用：视觉、浏览器自动化、图像生成、文本转语音、终端命令、任务规划、技能。

保存 Hermes 在接入期间打印的一切（设置路径、API 密钥路径、配置路径）到你的 Claude Code 项目。未来的你会感谢现在的你。

这是突出的。我开始之前不需要知道这些。我只是问 Hermes 和 Claude Code 在我进行时解释它。

API 密钥，正确的方式

不要在聊天中粘贴 API 密钥。即使模型是私人的，密钥现在在对话历史中。

如果你使用托管模型，不小心掉了一个，就轮换它。不是世界末日。但最佳实践是永远不要粘贴它们。

正确的方式： 1️⃣ SSH 进入你的容器 2️⃣ 运行 hermes config set GITHUB_TOKEN [your_token] 3️⃣ 密钥保存到容器的 /opt/data/.env。模型永远看不到。不在日志中。

每个密钥相同模式。按智能体命名。范围限制到智能体实际需要的最小权限。

如果你需要擦除或轮换密钥，要求 Hermes 提供 Nano 命令打开正确的 .env。我第一次尝试时，命令指向根 VPS .env，不是容器的。我告诉它智能体在 Docker 内运行后，Hermes 纠正了自己。教训：你不需要理解路径树，你只需要清楚沟通你看到了什么。

第一个值得构建的定时任务

将 Hermes 连接到私有 GitHub 仓库。然后安排夜间同步。

如果 VPS 损坏，你的技能和记忆就没了。有了 GitHub 备份，你启动新的 Hermes，指向仓库，你就回来了。

我告诉我的智能体："每天晚上午夜 Central，把除秘密外的一切推送到我的私有 GitHub 仓库。"

它构建了技能。设置了定时任务。写了 .gitignore，这样秘密永远不会被提交。完成。

烦人的部分：容器默认在 UTC 运行。Hermes 在整点自检 Central 时间以处理夏令时。它自己弄清楚了。

Token 最佳实践：经典 GitHub token，范围仅限 repo + contents（读写）。不要授予智能体超过需要的权限。

这就是循环。自然语言输入。工作自动化输出。

CLI vs Telegram

相同的智能体，相同的大脑，相同的技能，相同的记忆，相同的窗口。不同的界面。

→ CLI（终端） 是驾驶舱。最适合深度工作、编码、硬核构建。你可以看到上下文使用、管理压缩、点击斜杠命令，并像操作系统一样生活在里面。

→ Telegram 是遥控器。最适合定时任务、快速任务、语音消息、随身知识工作、从你的手机与之交谈。

Telegram 对上下文的可见性较低。会话感觉模糊，因为自动压缩在后台运行，你真的看不到何时。所以不要从 Telegram 进行 vibe coding 应用。上下文腐烂的风险太高。

但对于"嘿检查 ClickUp"、"为我研究这个"、"安排这个定时任务"、"发布到 Skool"——Telegram 比 CLI 更快。

基于 token 的上下文，不是基于消息的。模型总是看到系统提示词 + user.md + soul.md + memory.md。那都必须适合。当你接近限制时，自动压缩触发。

你的第一个技能的两种路径

添加技能有两种方式。

→ 描述一个结果。 "每天晚上午夜 Central，同步这个仓库。" Hermes 构建技能，命名它，设置定时任务，发布它。

→ 从 URL 安装一个。 从社区中心或你自己的 Claude Code 项目获取技能。告诉 Hermes 链接。它安装并注册它。

我通过要求 Hermes 安装官方 HyperFrames 技能并基于自己的 soul.md 生成一个 5 秒的介绍自己的视频来测试。它做了安装，运行了技能，并产生了可用的剪辑，无需额外手把手。

观察智能体工作时。如果你想让它调用技能而它没有，那是你的信号告诉它："更新 YAML front matter，这样这个技能在我这样说时触发。"

技能就是这样变锐利的。

像对待新员工一样对待 Hermes

这是不可协商的。

→ 每个 Hermes 智能体有自己的账户（Gmail 或智能体邮件），不是你的 → 每个智能体有自己的 API 密钥，范围紧 → 使用按智能体命名的 API 密钥（OpenRouter、Perplexity 等），这样你可以看到哪个智能体在花费什么 → 最小权限规则：只有工作需要的凭证和工具 → 营销智能体不需要 QuickBooks 的读取访问。财务智能体需要

你不会把信用卡交给全新实习生。也不要交给你的智能体。

也锁定 VPS。在 Hostinger 上设置防火墙，限制到你的 IP，阻止未使用的端口。构建一个运行夜间安全审计的技能。Hermes 可以攻击自己的设置并报告它发现了什么。

我之前对防火墙一无所知。Hermes 和 Claude Code 带我走过。智能体教你系统。

维护规则

这些是我遵循的规则，以保持智能体锐利：

→ 同一件事错了两次？当场纠正它，并告诉它更新相关技能或记忆 → 相同指令两次？要求 Hermes 为它写一个技能 → 冗长或语调不对？编辑灵魂 → 新定时任务？构建技能，然后要求 Hermes 安排它 → 某物坏了？首先检查 memory.md。陈旧的记忆是奇怪智能体行为的第一大原因

随时审计。"读你的记忆文件。读你的灵魂文件。"看看里面有什么。剪掉错误的。

这不是你完成设置的工具。这是你不断训练的队友。

压缩会击中。不要恐慌

最终你会击中自动压缩阈值。我的在约 170K token 触发（阈值约 136K）。

当它失败时，Hermes 插入回退上下文标记，暂停需要暂停的定时任务，并在继续前更新记忆。

如果你不理解刚刚发生了什么，把消息粘贴回给它："向我解释这个。那个回退标记是什么意思？"它会解释。那是循环的一部分。

何时启动第二个 Hermes

简单决策树：

→ 需要自己的凭证、秘密或工具？→ 新智能体 → 需要自己的长期记忆？→ 新智能体 → 持续的、重复的工作，基本上是单独的角色？→ 新智能体 → 否则 → 保留在你的主要个人智能体中

建议：首先从你的主要个人 Hermes 中获取最大使用。一旦你在那里构建了五到十个技能，分裂就变得明显。

迁移很容易。技能、定时任务、灵魂、记忆都是 markdown 文件。移动它们，指向新智能体，你就运行了。

坏模式：一个拥有每个 API 密钥、每个技能、每个定时任务的巨型智能体。高混乱。某物坏时高爆炸半径。

好模式：一个主要个人 Hermes 加上为营销、财务、内容或任何适合的垂直领域分离的智能体。每个在自己的 Docker 容器中。每个有范围的密钥。每个有自己的 .env，永远不会提交到 GitHub。

你的主要 Hermes 可以帮助你规划组织结构。像对待你的 COO 一样对待它。问它："基于我们构建的，我应该首先分裂什么？"它会有意见。

仪表板和看板

Hermes 附带自己的仪表板。最近会话、连接平台、密钥、配置、技能、插件、定时任务，以及用于在多个智能体之间分配任务的看板。

第一次打开时，你必须隧道进入容器，打开网关，并运行几个命令。第一次尝试很笨拙。

修复：告诉你的 Hermes "我想打开仪表板。带我走过。"一旦有效，要求它将步骤保存为技能，这样未来的打开是三个命令。

我很少使用仪表板，因为我的大部分 Hermes 工作在随身进行。但如果你运行多个智能体并想视觉分配任务，看板是可靠的。

总结

Hermes 不是 Claude Code 的替代品。

它是随身、语音优先、定时自动化层，生活在你的口袋里并随你成长。