Ole Lehmann 分享了他将 Hermes 从"普通聊天机器人"升级为"超级 Agent"的 12 个核心集成。他的核心观点:Agent 像是一个漂浮在罐子里的聪明大脑——集成是给这个大脑接上的感官和四肢。
四大工作维度
每个真正有用的 Agent 设置最终都做四件事:研究、行动、工作空间、记忆。缺一个,Agent 就在那个方向上失明。
1. 研究(世界的眼睛和耳朵)
让 Hermes 能自己发现信息,而不需要你 spoon-feed 上下文。
- Firecrawl:专为 Agent 构建的网络搜索。比原生 Hermes 搜索更干净、更快、token 消耗更少。默认开启。
- Reddit:了解人们对产品、细分领域或问题的真实想法。每当探索新想法时运行——5分钟内就能发现人们是否在某个领域暗暗愤怒。
- YouTube Transcripts:拉取任何视频的字幕,长播客、教程、会议演讲秒变可搜索笔记。高杠杆集成,几乎没人接入。
2. 行动(世界中的手和声音)
让 Hermes 能在世界中做事,而不只是描述它会做什么。
- Browserbase:真正的浏览器访问,意味着登录、点击按钮、导航阻止爬虫的网站。如果同时接入 Firecrawl 和 Browserbase,Hermes 会根据任务自动选择。
- Bland(或 Twilio):给 Hermes 电话语音,可以打实时电话。你可以让 Agent 打电话帮你预订,不用自己上。作者喜欢听录音哈哈。
- Stripe:处理支付、客户、失败收费和退款。可以问 Hermes "这个客户为什么流失",得到直接答案并附上收据。Stripe 正在推出 Agentic 支付,很快 Hermes 就能用你的卡实际预订东西。
3. 工作空间(你实际生活的地方)
让 Hermes 在你的业务内部运作。没有它,Agent 能谈论你的工作,但不能触碰或完全理解。
- Google Workspace:一个连接器覆盖 Gmail、Calendar、Drive、Docs、Sheets。绝对必要。如果 Agent 不能读你的收件箱或写文档,它就不能真正为你工作。
- Discord:作者把整个业务托管在 Discord。Hermes 接入不同频道运行不同工作流。例如,客服频道每天早上扫描邮件,提取支持工单,按优先级标记整理。
- GitHub:覆盖代码、Issue 和 PR,把 Hermes 变成能开 PR、审查代码、分类 Issue 的工程队友。如果你写代码,这是不可协商的。
4. 记忆(长期大脑)
让 Hermes 永远不忘你已经读过、学过、说过或写下的东西。
- Readwise:把你从书籍、文章、推文、播客中保存的所有高亮拉到一个可查询的地方。解决"死知识"问题——你高亮了一次就再也没见过,因为它埋在47个你永远不会重新打开的 PDF 里。
- Granola:给你每次会议的可搜索转录。Hermes 可以秒答"那个客户上个月关于定价说了什么"。
- Obsidian:Karpathy 风格的 LLM wiki 第二大脑。如果你用 Obsidian 记笔记,Hermes 可以跨整个 vault 阅读,连接你忘记自己有的想法。
堆叠的涌现能力
单独接入时,每个集成都有用。但堆叠在一起时,它们开始做你可能没意识到可能的事情。
赞助商筛选器:当有人在 X 上 DM 或发邮件谈赞助时,Hermes 自动读取、通过 Firecrawl 抓取对方网站、扫描 Reddit 和 YouTube 关于该公司的真实讨论,在 Discord 里丢一页纸,附上对作者受众的适配评级。
客服 Agent:每天早上 Hermes 扫描 Gmail 收件箱,按问题类型分类每个支持邮件,在 Discord 支持频道记录并标记优先级。每周在 Obsidian 里丢一个摘要,列出5个作者应该从根本上修复的重复问题。
周一业务仪表盘:每周一早上8点,Hermes 从 Stripe 拉收入、新订阅、退款和流失,从 X 和 LinkedIn 通过 Browserbase 抓取粉丝增长和帖子浏览量,在 Discord 发布周环比分析。10秒读完,而不是一小时仪表盘跳转。
每个工作流需要3-4个集成互相交谈。没有一个集成单独能做到。
接入方法
Step 1:打开 Hermes,问"如何接入 [工具]?"
Step 2:测试。问一个需要该工具连接才能给出真实答案的问题:
- "我今天日历上有什么?"
- "找到那个客户关于合同的最后一封邮件。"
- "拉取最后5个失败的 Stripe 收费。"
Step 3:堆叠。两个工具有用。十二个工具是上述工作流开始运作的地方。