Ole Lehmann 分享了他将 Hermes 从"只是 Telegram 里的 Claude"升级为超级代理的 12 个核心集成。
核心比喻:Agent 像泡在罐子里的聪明大脑——它能说会道,但完全切断与你的实际生活。集成是 bolt 上去的感觉器官和四肢。
四大职能,12 个集成
职能 1:研究(看世界的眼和耳)
让 Hermes 能自主发现信息,无需你 spoon-feed 上下文。
- Firecrawl:专为 Agent 设计的网络搜索。比原生搜索更干净、更快、token 消耗更少。默认开启。
- Reddit:了解人们对产品、 niche 或问题的真实想法。评估新想法时运行——5 分钟内知道人们是否在默默愤怒。
- YouTube transcripts:拉取任何视频的 captions,长播客、教程、会议演讲秒变可搜索笔记。高杠杆集成,几乎没人接入。
职能 2:行动(在世界中的手和声音)
让 Hermes 能做实事,而非只描述它会做什么。
- Browserbase:真正的浏览器访问——登录、点击按钮、导航反爬虫网站。与 Firecrawl 同时接入时,Hermes 自动根据任务选择工具。
- Bland/Twilio:给 Hermes 电话声音,可以拨打实时电话。可以让 Agent 替你打电话预订餐厅。
- Stripe:处理支付、客户、失败收费和退款。问"这个客户为什么流失",得到带收据的直接答案。Stripe 正在推出 Agentic 支付,未来 Agent 将能用你的卡实际预订东西。
职能 3:工作空间(你实际生活的地方)
让 Hermes 在你的业务内部运作。
- Google Workspace:覆盖 Gmail、Calendar、Drive、Docs、Sheets。绝对必要。如果 Agent 不能读你的 inbox 或写你的 docs,它就无法真正为你工作。
- Discord:Ole 的整个业务都在 Discord 上运行。将 Hermes 接入不同频道,每个频道运行不同工作流。例如客户支持频道:每天早上扫描邮件,提取支持票,按优先级标记后投入 Discord。
- GitHub:覆盖代码、issue 和 PR。将 Hermes 变成工程队友——可以开 PR、审查代码、分类 issue。如果你写代码,这是不可协商的。
职能 4:记忆(长期大脑)
让 Hermes 永远不忘记你已读、已学、已说或已写的东西。
- Readwise:将你从书籍、文章、推文、播客中保存的所有高亮拉入一个可查询的地方。解决"死知识"问题——高亮一次 brilliant 的东西,然后永远看不到,因为它埋在 47 个你永远不会重新打开的 PDF 中。
- Granola:给你每次会议的可搜索转录。Hermes 可以瞬间回答"那个客户上个月关于定价说了什么"。
- Obsidian:Karpathy 风格的 LLM wiki 第二大脑。如果你在 Obsidian 中记笔记,Hermes 可以跨整个 vault 阅读,连接你已忘记自己有的想法。
真正的魔法:链式组合
单独接入时,每个集成都有用。但叠加在一起时,它们开始做你可能没意识到可能的事。
工作流 1:赞助商过滤器
有人通过 X DM 或邮件谈赞助时,Hermes 自动读取、通过 Firecrawl 抓取对方网站、扫描 Reddit 和 YouTube 关于该公司的真实讨论,然后在 Discord 投放一页纸的受众匹配度评估。
工作流 2:客户支持代理
每天早上 Hermes 扫描 Gmail 的入站支持邮件,按问题类型分类,标记优先级后投入 Discord 支持频道。每周一次在 Obsidian 投放总结——5 个应该从根本上修复的重复问题。
工作流 3:周一商业仪表盘
每周一早上 8 点,Hermes 从 Stripe 拉取收入、新订阅、退款、流失,通过 Browserbase 抓取 X 和 LinkedIn 的粉丝增长和帖子浏览量,投放周环比 breakdown 到 Discord。10 秒读完,而非一小时 dashboard 跳转。
每个工作流都需要 3-4 个集成对话。没有一个集成能单独做到。
如何接入(10 分钟)
步骤 1:打开 Hermes,问"如何接入 [工具]?"
步骤 2:测试。问需要该工具连接才能给出真实答案的问题:
- "我今天日历上有什么?"
- "找那封客户关于合同的最后一封邮件。"
- "拉取最近 5 笔失败的 Stripe 收费。"
步骤 3:叠加。两个工具有用,十二个工具才是上述工作流开始工作的时候。
第一次它直接做了你一小时前还做不到的事时——聊天机器人死亡,超级代理现身。