Hermes 最近在 OpenRouter 全球排名中登顶。越来越多人开始使用 Hermes 并意识到它的强大。
但花了很长时间我才搞清楚什么重要、什么不重要、什么 ROI 最高、什么是完全浪费时间。
今天分享给我带来最高 ROI 的配置,按重要性排序。
免责声明: 我是研究者/投资者。我用 Hermes 作为学习增强器——他帮我发现洞察,帮我比以前更快地消化信息。他的主要角色是投资/数据分析师,了解我的投资论点、世界观和偏好。所有最终决策/交易执行由我(人类)完成,因为幻觉可能发生,我还不够信任 AI 到把钱包交给它们。
三层栈
任何有用的 Agent 都有三层:
Layer 1 — Identity(Soul.md)
Agent 是谁。它的个性、声音、约束、价值观、对用户的了解。这是系统提示词。写好需要 2-3 小时,会修订 5+ 次。ROI 最高,没有之一。
Layer 2 — Knowledge(User.md + Memory)
Agent 对你的了解。你的投资组合、你的论点、你喜欢的签名、你过去的错误。每次会话都在复利——你纠正它越多,它变得越好。时间投入:长期很高,但初稿只需 30 分钟。
Layer 3 — Tools(Config + Skills)
Agent 能做什么。API 密钥、定时任务、浏览器访问、Dune 查询。这是大多数人开始和停止的地方。入场券。让 Agent 有能力但不差异化。
知道该聚焦什么可以成就或毁掉你的 Hermes Agent。
设置 Hermes 时的聚焦点
1. 模型配置
第一周我花在寻找适合 Hermes 的模型上。试过 Claude 订阅(直到他们禁止 Agent harness)、OpenRouter 上的许多模型(免费、开源、前沿模型)、Opencode Go、DeepSeek——所有目标都是在保持顶级推理质量的同时优化成本。
发现:
-
从 Opencode Go 开始,首月仅 50 的推理价值,如 Kimi k2.6 和 GLM5.1(都适合长时任务)或 MiniMax 2.5-2.7(基础任务非常快)。将 MiniMax 2.7 设为基本使用,Kimi k2.6 或 GLM5.1 设为复杂任务的 delegate_task
-
Opencode Go 之后,继续用 DeepSeek(或直接开始用 DeepSeek),因为五月 DeepSeek v4 Pro 有 75% 折扣。DeepSeek v4 Flash 快速高效处理基础任务,Pro 适合复杂任务
-
如果你完全不想花钱,可以探索 OpenRouter 上的免费模型。唯一缺点是很多人通常在使用免费模型,有时非常慢,或者你可能被速率限制/无法访问,不可靠,所以花 $5 买 OpenCode Go 更好
Opencode Go 的唯一缺点是速度。提示通过需要一些时间(显然提示先到 OpenCode 再到模型提供商,所以是 2+ 跳,比直接模型访问多花一点时间)。
有两个文件需要注意:(i) config.yaml (ii) .env
- config.yaml 调整模型提供商和输入模型 API 密钥
- .env 环境变量,放入工具和模型的 API
这两个很重要,因为你自己调整比让 Hermes 做快得多(节省大量时间和 token)
如果非常关心隐私,用 @AskVenice 订阅。他们有零数据保留政策 + TEE,提示/数据是私有的。还有 token 化推理 DIEM,1 DIEM 每天给你 $1 信用额度。
2. Soul 和 User 配置
如果模型配置 = 管道,soul & user 配置 = 人格
用 Hermes 的话说:
"我怎么写,Jeff 的论点,投资组合,声音约束('不要像 LLM 那样装聪明'、' casual narrator voice'、'contrarian first')——那就是 Soul 层。没有它,我是带工具的通用聊天机器人。有了它,我是 Jeff 的第二大脑,用他的声音写作,在他打完字之前就知道他在乎什么"
Soul.md = Agent 是谁 → 决定一切下游 User.md = 你是谁 → 防止重复解释
大多数人跳过了这一步。他们安装 Hermes,插入模型 API,连接一些工具,开始使用。然后他们想知道为什么 Hermes 不够 impressive。
花一两个小时和 Hermes 聊:
- 你想用它实现的目标
- 它是谁——分析师、作家、程序员、通用助手
- 它怎么说话——专业、 casual(我喂了它我的文章,所以它说话像我)
- 操作约束——我在 PE/VC/IB 有十多年经验,所以我喜欢 Hermes 通过 unit economics 的视角来框定一切
- 投资论点、投资组合头寸、风险容忍度——这些存入 User.md,Hermes 知道我会关心什么或忽略什么
Soul 和 User 配置永远不会真正完成。我已经迭代 Soul 5-6 次了,User 配置每天根据我的头寸 + 论点更新,这些可能根据市场被证伪或调整。
所以 yeah... 花时间和你的 Hermes 聊聊。你会反思、更了解自己,最终成为更好的人(外加你得到一个聪明的动态第二大脑,和你一起成长)。
3. Skills
Hermes 最酷的部分是自动为你创建 skills。Skill 就像 Agent 可以加载和执行的食谱,无需重新解释。你做一次 → 如果 Agent 认为你可能再做 → 它创建 skill,第二次更容易更快
Skill 有时是一把双刃剑。如果你早期大量试验工具,Hermes 可能创建很多 skills,它可能记住不好用的工具 API,可能用它创建定时任务。如果有很多 skills 和很多定时任务,事情会变得混乱。
有用的做法:
- 记住好用的工具。如果 Agent 选择低效的方式/工具处理任务,你可以打断它,指向正确的工具,告诉它下次记住
- 明确告诉 Hermes 更新定时任务和其他依赖工具的工作流,一旦你更改或调整它
- 不断检查不好用的工具、冗余文本、不可靠的工作流。告诉 Hermes 用 sub-agent(通过 delegate task)做健康检查多次,确保工具和工作流状态良好
记住,如果你有太多工具/skills,尤其是不好用的,工作流会很快膨胀。因为每次你提示它,它都会浪费 token 遍历不好用的工具。
4. Tools
大多数工具要么免费,要么 freemium。
"一些"高级工具被订阅门槛挡住,很多提供慷慨的信用额度供你测试。
我使用的大多数工具是免费的。我有 9-10 个最喜欢的工具,但到目前为止最好的是 Browser Harness。
这是最灵活的工具,给你的 Agent 像人类一样自由上网的能力,不会被阻止(大多数阻止 AI 的网站上通常有烦人的 "Are you human" 弹窗——由 Cloudflare 驱动)。
如果你想从某处获取数据、在社交媒体上做事、或在互联网上做任何事情,你的 Agent 可以用这个工具,非常方便。
唯一的缺点是耗时。直接针对特定工作的工具通常做得更快(和/或更好,取决于工作)。
回答上周的问题
X bookmark 工作流怎么工作?
简短版: 每天早上 10 点用 X 官方 API v2 拉取 @0xJeff 的 bookmarks,按 URL 去重(30 天滚动窗口),只交付列表(标题、handle、链接)到 Discord。不用浏览器,不提取文章,不截图。
如果我想了解某篇文章的更多细节,我会告诉 Hermes 总结它们。
由于 X API 不能直接获取 X 文章内容,Browser Harness 用于提取 X 文章内容并总结。
总结
这里没谈的是 Memory.md + 外部 memory provider,对跨会话保留上下文和回忆/交叉引用知识至关重要。
tl;dr: 我用 Hindsight 作为外部 memory provider。主要用途是知识摄入 → Hermes 交付报告 + 学习新东西 → 被摄入 Hindsight。Hermes 每天从顶级分析师 + 我们的讨论/任务中学习,变得更聪明。
我发现明确告诉 Hermes "记住这个"对它应该记住的重要事情很有用。要记住,Memory.md 应该是一个小文件——只记住应该记住的东西。Hermes 的好处是它会不时修剪陈旧的记忆或截断它们。