你第一次打开 Hermes,20 分钟后关闭它,心想:「这不就是 Telegram 里的 Claude 吗,有什么区别?」
Ole Lehmann 说:几周前他也是这么想的。但原因不是 Hermes 的错——是他还没往里面插任何集成。
Agent 就像一个泡在罐子里的聪明大脑。它聪明、快速、可以聊几小时,但完全切断与你的实际生活。集成就是给这个大脑装上的感官和四肢。插的越多,它能为你做的事就越多。
4 类工作,每个有用的 Agent 设置都要覆盖
每个真正工作的 Hermes 设置最终都在做 4 件事:research、action、workspace、memory。缺一个,Agent 在那个方向上就瞎了。覆盖全部四个,你得到的感觉就像一个同事。
Job 1: Research(观察世界的眼睛和耳朵)
让 Hermes 能自己发现信息,不需要你一勺一勺喂上下文。
- Firecrawl:为 Agent 设计的 web search。比原生 Hermes search 更干净、更快、消耗更少 token。默认开启。
- Reddit:了解人们对产品、niche 或问题的真实想法的最佳渠道。5 分钟内就能发现某个空间里人们是否在暗暗愤怒。
- YouTube transcripts:从任何视频拉取字幕,长播客、教程、会议演讲秒变可搜索笔记。几乎没人插这个,但杠杆极高。
Job 2: Action(在世界中行动的手和声音)
让 Hermes 能实际做事,而不是只描述它会做什么。
- Browserbase:真正的浏览器访问,意味着登录、点击按钮、导航反爬虫网站。如果同时插了 Firecrawl 和 Browserbase,Hermes 会根据任务自动选择。
- Bland(或 Twilio):给 Hermes 一个电话声音,可以打实时电话。你可以让 Agent 帮你打电话订餐厅,自己不用在场。
- Stripe:处理支付、客户、失败扣款和退款。你可以问 Hermes「这个客户为什么流失」,它给出直截了当的答案,附带收据。
Job 3: Workspace(你实际生活的地方)
让 Hermes 在你的业务内部运作。没有它,Agent 能谈论你的工作,但无法触及或完全理解它。
- Google Workspace:覆盖 Gmail、Calendar、Drive、Docs、Sheets。绝对必要。如果你的 Agent 不能读你的收件箱或写你的文档,它就无法真正为你工作。
- Discord:Ole 把整个业务放在 Discord 上。他把 Hermes 接入不同频道,每个频道运行不同工作流。例如客户支持频道每天早上扫描邮件,提取支持工单,按优先级标记后丢进 Discord。
- GitHub:覆盖代码、Issue、PR,把 Hermes 变成能开 PR、review 代码、triage issue 的工程队友。如果你 ship 代码,这是不可协商的。
Job 4: Memory(长期大脑)
让 Hermes 永远不忘记你已经读过、学过、说过或写过的东西。
- Readwise:把你从书、文章、推文、播客中保存的所有高亮拉到一个可查询的地方。解决「死知识」问题——你高亮过某个 brilliant 的东西一次,然后永远看不到它了,因为它埋在 47 个你永远不会重新打开的 PDF 里。
- Granola:给你每次会议的可搜索 transcript。Hermes 可以秒答「那个客户上个月关于定价说了什么」。
- Obsidian:Karpathy 风格的 LLM wiki 第二大脑。如果你在 Obsidian 里记笔记,Hermes 可以跨整个 vault 读取并连接你已经忘记自己有的想法。
链式组合:1+1 > 2
单独插每个集成都有用。但当你把它们堆叠起来,它们开始做你可能没意识到可能的事。
实际 Workflow 示例 1:赞助商过滤器
有人在 X 上 DM 或发邮件谈赞助,Hermes 自动读取,通过 Firecrawl 抓取对方网站,扫描 Reddit 和 YouTube 上关于该公司的真实讨论,然后在 Discord 丢一个 one-pager,附带对受众匹配度的评分。
实际 Workflow 示例 2:客户支持 Agent
每天早上 Hermes 扫描 Gmail 中的支持邮件,按问题类型分类,标记优先级后记录到 Discord 支持频道。每周一次在 Obsidian 丢一个总结,列出 5 个应该从根本上修复的重复问题。
实际 Workflow 示例 3:周一商业仪表盘
每周一早上 8 点,Hermes 从 Stripe 拉取收入、新订阅、退款和流失,通过 Browserbase 从 X 和 LinkedIn 抓取粉丝增长和帖子浏览量,然后在 Discord 发布周环比分析。10 秒读完,而不是一小时的仪表盘跳转。
每个 workflow 都需要 3-4 个集成互相配合。没有一个集成能单独做到。
如何插入(10 分钟)
Step 1:打开 Hermes,问「怎么连接 [工具]?」
它会告诉你怎么操作(OAuth、API key、MCP 等),全部在同一个对话中完成。
Step 2:测试后再继续。
问一个需要该工具连接才能给出真实答案的问题:
- 「我今天日历上有什么?」
- 「找到那个客户关于合同的最后一封邮件。」
- 「拉取最近 5 笔失败的 Stripe 扣款。」
Step 3:堆叠它们。
两个工具有用。十二个工具是上面那些 workflow 开始工作的时候。
第一次它直接做了你一小时前还做不到的事——聊天机器人死了,超级 Agent 出现了。