← 返回 FEED
AGENT2026-05-11

Hermes 分析师工作流:最高 ROI 的三层配置

Hermes 最近在 OpenRouter 全球排名中登顶。越来越多人开始使用 Hermes 并意识到它的强大。

但花了很长时间我才搞清楚什么重要、什么不重要、什么 ROI 最高、什么是完全浪费时间。

今天分享给我带来最高 ROI 的配置,按重要性排序。

免责声明: 我是研究者/投资者。我用 Hermes 作为学习增强器——他帮我发现洞察,帮我比以前更快地消化信息。他的主要角色是投资/数据分析师,了解我的投资论点、世界观和偏好。所有最终决策/交易执行由我(人类)完成,因为幻觉可能发生,我还不够信任 AI 到把钱包交给它们。

三层栈

任何有用的 Agent 都有三层:

Layer 1 — Identity(Soul.md)

Agent 是谁。它的个性、声音、约束、价值观、对用户的了解。这是系统提示词。写好需要 2-3 小时,会修订 5+ 次。ROI 最高,没有之一。

Layer 2 — Knowledge(User.md + Memory)

Agent 对你的了解。你的投资组合、你的论点、你喜欢的签名、你过去的错误。每次会话都在复利——你纠正它越多,它变得越好。时间投入:长期很高,但初稿只需 30 分钟。

Layer 3 — Tools(Config + Skills)

Agent 能做什么。API 密钥、定时任务、浏览器访问、Dune 查询。这是大多数人开始和停止的地方。入场券。让 Agent 有能力但不差异化。

知道该聚焦什么可以成就或毁掉你的 Hermes Agent。

设置 Hermes 时的聚焦点

1. 模型配置

第一周我花在寻找适合 Hermes 的模型上。试过 Claude 订阅(直到他们禁止 Agent harness)、OpenRouter 上的许多模型(免费、开源、前沿模型)、Opencode Go、DeepSeek——所有目标都是在保持顶级推理质量的同时优化成本。

发现:

  • 从 Opencode Go 开始,首月仅 5,提供来自顶级开源模型超过5,提供来自顶级开源模型超过 50 的推理价值,如 Kimi k2.6 和 GLM5.1(都适合长时任务)或 MiniMax 2.5-2.7(基础任务非常快)。将 MiniMax 2.7 设为基本使用,Kimi k2.6 或 GLM5.1 设为复杂任务的 delegate_task

  • Opencode Go 之后,继续用 DeepSeek(或直接开始用 DeepSeek),因为五月 DeepSeek v4 Pro 有 75% 折扣。DeepSeek v4 Flash 快速高效处理基础任务,Pro 适合复杂任务

  • 如果你完全不想花钱,可以探索 OpenRouter 上的免费模型。唯一缺点是很多人通常在使用免费模型,有时非常慢,或者你可能被速率限制/无法访问,不可靠,所以花 $5 买 OpenCode Go 更好

Opencode Go 的唯一缺点是速度。提示通过需要一些时间(显然提示先到 OpenCode 再到模型提供商,所以是 2+ 跳,比直接模型访问多花一点时间)。

有两个文件需要注意:(i) config.yaml (ii) .env

  • config.yaml 调整模型提供商和输入模型 API 密钥
  • .env 环境变量,放入工具和模型的 API

这两个很重要,因为你自己调整比让 Hermes 做快得多(节省大量时间和 token)

如果非常关心隐私,用 @AskVenice 订阅。他们有零数据保留政策 + TEE,提示/数据是私有的。还有 token 化推理 DIEM,1 DIEM 每天给你 $1 信用额度。

2. Soul 和 User 配置

如果模型配置 = 管道,soul & user 配置 = 人格

用 Hermes 的话说:

"我怎么写,Jeff 的论点,投资组合,声音约束('不要像 LLM 那样装聪明'、' casual narrator voice'、'contrarian first')——那就是 Soul 层。没有它,我是带工具的通用聊天机器人。有了它,我是 Jeff 的第二大脑,用他的声音写作,在他打完字之前就知道他在乎什么"

Soul.md = Agent 是谁 → 决定一切下游 User.md = 你是谁 → 防止重复解释

大多数人跳过了这一步。他们安装 Hermes,插入模型 API,连接一些工具,开始使用。然后他们想知道为什么 Hermes 不够 impressive。

花一两个小时和 Hermes 聊:

  • 你想用它实现的目标
  • 它是谁——分析师、作家、程序员、通用助手
  • 它怎么说话——专业、 casual(我喂了它我的文章,所以它说话像我)
  • 操作约束——我在 PE/VC/IB 有十多年经验,所以我喜欢 Hermes 通过 unit economics 的视角来框定一切
  • 投资论点、投资组合头寸、风险容忍度——这些存入 User.md,Hermes 知道我会关心什么或忽略什么

Soul 和 User 配置永远不会真正完成。我已经迭代 Soul 5-6 次了,User 配置每天根据我的头寸 + 论点更新,这些可能根据市场被证伪或调整。

所以 yeah... 花时间和你的 Hermes 聊聊。你会反思、更了解自己,最终成为更好的人(外加你得到一个聪明的动态第二大脑,和你一起成长)。

3. Skills

Hermes 最酷的部分是自动为你创建 skills。Skill 就像 Agent 可以加载和执行的食谱,无需重新解释。你做一次 → 如果 Agent 认为你可能再做 → 它创建 skill,第二次更容易更快

Skill 有时是一把双刃剑。如果你早期大量试验工具,Hermes 可能创建很多 skills,它可能记住不好用的工具 API,可能用它创建定时任务。如果有很多 skills 和很多定时任务,事情会变得混乱。

有用的做法:

  • 记住好用的工具。如果 Agent 选择低效的方式/工具处理任务,你可以打断它,指向正确的工具,告诉它下次记住
  • 明确告诉 Hermes 更新定时任务和其他依赖工具的工作流,一旦你更改或调整它
  • 不断检查不好用的工具、冗余文本、不可靠的工作流。告诉 Hermes 用 sub-agent(通过 delegate task)做健康检查多次,确保工具和工作流状态良好

记住,如果你有太多工具/skills,尤其是不好用的,工作流会很快膨胀。因为每次你提示它,它都会浪费 token 遍历不好用的工具。

4. Tools

大多数工具要么免费,要么 freemium。

"一些"高级工具被订阅门槛挡住,很多提供慷慨的信用额度供你测试。

我使用的大多数工具是免费的。我有 9-10 个最喜欢的工具,但到目前为止最好的是 Browser Harness

这是最灵活的工具,给你的 Agent 像人类一样自由上网的能力,不会被阻止(大多数阻止 AI 的网站上通常有烦人的 "Are you human" 弹窗——由 Cloudflare 驱动)。

如果你想从某处获取数据、在社交媒体上做事、或在互联网上做任何事情,你的 Agent 可以用这个工具,非常方便。

唯一的缺点是耗时。直接针对特定工作的工具通常做得更快(和/或更好,取决于工作)。

回答上周的问题

X bookmark 工作流怎么工作?

简短版: 每天早上 10 点用 X 官方 API v2 拉取 @0xJeff 的 bookmarks,按 URL 去重(30 天滚动窗口),只交付列表(标题、handle、链接)到 Discord。不用浏览器,不提取文章,不截图。

如果我想了解某篇文章的更多细节,我会告诉 Hermes 总结它们。

由于 X API 不能直接获取 X 文章内容,Browser Harness 用于提取 X 文章内容并总结。

总结

这里没谈的是 Memory.md + 外部 memory provider,对跨会话保留上下文和回忆/交叉引用知识至关重要。

tl;dr: 我用 Hindsight 作为外部 memory provider。主要用途是知识摄入 → Hermes 交付报告 + 学习新东西 → 被摄入 Hindsight。Hermes 每天从顶级分析师 + 我们的讨论/任务中学习,变得更聪明。

我发现明确告诉 Hermes "记住这个"对它应该记住的重要事情很有用。要记住,Memory.md 应该是一个小文件——只记住应该记住的东西。Hermes 的好处是它会不时修剪陈旧的记忆或截断它们。