Hermes 跑着你就睡着了:17 个 prompt 让它替你干一整周
2026 年 2 月,Nous Research 放出 Hermes Agent:一个开源、自托管、不住在 IDE 里、关掉 tab 也不忘事的 agent。它以 daemon 形式跑在你自己的机器上,跨 session 保留记忆,接收自然语言排程,还能从经验里写出可复用的 skill。
一年里它成了最出圈的开源 agent 之一:GitHub star 狂涨,OpenRouter 上使用量排到前面。最近又上了一个原生 TUI。
然后有个人把它当成自己的"常驻基础设施"跑了 5 周——$5 VPS,底下跑 Claude。
工具是真的。但一个空装的 Hermes 自己啥也不干。它是 runtime,不是 workflow。从"我 star 过这个有意思的 repo"到"它在我睡着时替我干了 3 小时",分界线是 day 1 你喂给它的 prompt,而几乎没人分享这些 prompt。
下面就是他的。17 条 prompt 和 config 直接粘,外加让最尖锐那几条入选的具体时刻,以及他先踩的 3 个坑让你跳过。
Hermes 填的是哪条缝
几乎所有你用的 AI 工具都是 session 制的。Claude Code、Cursor、聊天窗口:打开、干活、关掉,context 跟着 session 死。这是为它们做的事设计的合理形态,Claude Code 仍然是单项目编码场景下更好的工具。
但有一整类工作不是 session 形态的:你醒之前就该 ready 的简报、你盯不盯都该被盯着的 build、你埋头干正事时还在涨的 inbox。session 工具扛不住,因为它们在事情发生时根本没跑。
Hermes 填的是这条缝。它 persistent(记忆跨 session 活下来)、scheduled(按时钟行动,不按你的注意力)、reachable(Telegram、Discord、Slack、email,不是一个你忘了的 tab)。模型负责思考。Hermes 让你不在的时候它仍然对着你的活儿。
任何 prompt 之前:三件事必须先成立
- 一个有真实 context 的模型。 小本地模型在多步任务中会半路掉 tool call。frontier 模型才有 headroom。Claude 轻松过关。
- 一个不在你闲着时也收费的后端。 serverless 后端会在两个 job 之间冬眠,24/7 的 agent 不会变成 24/7 的账单。
- 一个常驻的物理位置。 你的笔记本不行。$5 VPS 行,因为"合上盖子"不该 kill 你凌晨 3 点的 job。
这三件事先搞定,下面 17 条 prompt 才有东西可跑。跳过它们,recipe 1 第一晚就死。
17 条 prompt
1. 晨间简报
每天早 7 点,拉我所有 repo 的未读 GitHub 通知和打开的 PR,归纳"变了什么、什么在 block",发到 Telegram 3-5 条 bullet。
入选时刻:他每天早上前 35 分钟在 6 个 repo 手动做这件事,发生在任何一行正式工作之前。一周 5 天,每周 3 小时的 triage 集中在他一天里最贵的时间段,处于 autopilot。现在简报在 Telegram 等他坐下,35 分钟没了。
2. 仓库静默监控(沉默原则)
一个什么都 ping 你的监控,一周内就被静音。能力在沉默里。
盯 [org/repo]。保持沉默,除非 CI 变红或有 label 为 "bug" 的新 issue 打开。任一发生时,给我发失败任务名或 issue 正文,其它什么都不发。
入选时刻:周五 deploy 的红 CI,他到周一才发现,主干断了 3 天、其实 10 分钟就能修。现在 ~90 秒就 ping,平时沉默。
Hermes 单进程接 Telegram、Discord、Slack、WhatsApp、Signal、email——意味着 triage 终于能在一个地方完成。
3. 收件箱 triage
每小时,看一遍我所有接入的 channel,按发送人和紧急程度分组,新闻订阅和通知自动归档,只升级提到"截止日期"、"有人在等我"或"钱"的那几条。
入选时刻:6 个平台每天 ~120 条消息,一条客户 DM 因为埋在 Discord 噪音里两天没回。升级规则——截止日期、有人等我、或钱——就是整个 prompt 的全部。其它一切归档,他永远看不到。
4. 研究周报
每周五晚 6 点,搜 [你的话题] 领域的新发布和严肃讨论,和上周发给我的内容去重,发一份 5 条 bullet 的摘要加链接到 Telegram。
效果:~2 小时周五刷 feed 变成 5 条 bullet 阅读。去重条款是诀窍——它记得上周,所以登门的是真的新东西。
5. 仓库冷启动
clone [repo url],用 5 条 bullet 归纳架构,找出主入口和"最危险"那个文件,draft 一份干净的 PR 工作流以便贡献。
效果:陌生代码库的冷启动日被压成 ~4 分钟"够开始"的地图。不是理解的替代品,是"不知道东西在哪"的替代品。
6. 异步研究
研究 [问题],按价格、限额、锁定风险比较 top 3,今晚完成就发我结果。不要等我追问,做合理假设并把它们列在开头。
效果:"不要等我、做假设并列出"这一条,把一个凌晨 2 点的卡住变成早晨起床就有的结果。
7. 竞品盯盘
每天早 9 点,检查 [A 产品]、[B 产品]、[C 产品] 的 changelog 和定价页,只有真的变了(新功能、定价变动、deprecation)才告诉我。引用原文 diff。
效果:竞品动作你当天早上就知道,不是客户提起来才知道。
8. 夜间 code review
每天晚 11 点,看今天所有 repo 的 commit,flag 任何风险:漏掉的 TODO、上线的 console.log、超过 80 行的函数、改了路径但没测的。短列表,配咖啡读。
入选时刻:他上线了一条带 token 的 console.log 一周都没发现。夜间 pass 现在在他醒之前就能抓这类事,列表通常三行,有时为零。这是他跑的最便宜的 code review。
9. 晨会
每个工作日早 9:55,组装我的晨会:从 repo 和接入的 channel 拉"昨天关了什么、进行中什么、block 什么",三条短 bullet。
效果:你走进晨会时它已经写好了,而不是从记忆里重建昨天。
10. 舆情雷达
每天一次,搜网和我所在的平台对 [项目名或 handle] 的新提及,忽略夸赞,升级 bug 报告、投诉、和本人没回过的提问。
效果:愤怒的用户和安静的 bug 报告会找你,而不是你三天后才找到它们。
11. 长视频/播客压缩
拿 [视频或播客 url],拉 transcript,给我 5 条 bullet 提炼论点,附"值得完整看"的 timestamp 段。跳过开场和口播。
效果:所有人都在引用的演讲,2 分钟读完,附 90 分钟里真正值得看的 timestamp。
12. 解释这条报错
这是 stack trace:[粘贴]。在我 repo 里搜原因,两句话讲清到底哪里挂了,draft 一个最小 patch 修它,不动其它东西。
入选时刻:一条生产 stack trace 他本来要花一小时二分定位。交出去后他还没读完 trace,模型就返回了失败行、两句话原因、三行 patch。他仍然 review patch,只是不再大海捞针。
13. Inbox-zero 草稿
对常规邮件(排期、介绍、状态 ping),用我的口吻 draft 回信,放进一个队列等我一键批准。永远不要自己发。需要真决定的升级给我。
效果:十几条"好的,周四可以"的回复写好了等你说 yes,而不是要你的注意力。Nothing 离开不等你点。
14. 告警诊断
监控告警触发时,不要只转发。拉相关日志最后 50 行,查最近部署了什么,发我一段一段首因猜测的假设,连同原始告警。
效果:凌晨 3 点的寻呼带着假设一起来,不只是红灯。一个带自己 terminal 的子 agent 拉日志,所以诊断不花你一分钱。
15. 模型配置
hermes config set model anthropic/claude-opus-4.8
入选时刻:他一开始用便宜的本地模型想把成本压到零。多步任务到一半就掉 tool call,因为 hold 不住真正 workflow 需要的 context。1-14 条 recipe 都以"看着像 prompt bug 实际不是"的方式静默失败。
一行换成 Claude,所有 14 条同时被修好,因为失败从来不是 prompt,是底下那个模型。一行就能换回去,没有 lock-in。
16. 后端配置
hermes config set terminal.backend daytona
入选时刻:他头一个月跑在 always-on 后端上,23 小时闲置的算力静悄悄加起来比真在干活还贵。serverless 后端闲置就冬眠、按需唤醒,把 24/7 agent 的"常驻开销"压到 job 之间的几分钱。
17. 把它变永久
这个工作。把它存成一个可复用 skill 叫 "morning-brief",下次你按同样方式跑,不用我重新讲格式。
入选时刻:他把 morning brief 的精确格式重新解释了 4 次才想起来让它变永久。Hermes 会从这次运行写自己的 SKILL.md 并复用,所以第 5 次他只说"跑 morning brief"它就懂。这是复利部分——每条 prompt 一旦管用一次,就变成一项你再也不用输入的能力。
一周对比:手做 vs 交出去
他用同一种方式记录了一周"常年要做的工作":手做一次(他原本那样)、交给 Hermes 跑这 17 条一次。同样的任务。
Unattended = 按 schedule 跑或异步跑,初始 prompt 之后他不再参与。
头条不是省下的几小时。是这堆事没有一件发生在他得醒着的时间。简报 7 点跑不管他起没起。仓库周末被盯着。研究周五晚落地。稀缺资源从来不是时间,是他的注意力。persistent agent 的意义就是让工作停止和它竞争。
3 个先踩的坑
头两周基本是他学"什么 prompt 是对着常驻 agent 写的、什么是对着聊天窗口写的"。
-
含糊的 schedule。 "给我发我 repo 的更新"出来一条 firehose。没有升级规则,agent 报一切,无法略读的报就是被静音的报。现在每条 schedule prompt 都带显式的"只在 X 时告诉我"。
-
小时级 job 没设 token 预算。 多话的小时 triage 一周悄悄花掉的钱超过他计划一个月。Persistent + unbounded = 惊喜账单。把节奏控制在你真的会读的量,第一周查账。
-
为了省钱用便宜模型。 Recipe 15 覆盖了。小本地模型多步任务到一半掉 tool call,失败看着像 prompt bug。Model 不是省的地方。
3 个诚实的 tradeoffs(自托管不是没有代价)
- 你成了 admin。 更新、uptime、权限模型都是你的。一个什么都记得、还在你机器上行动的 agent,监管要严过那种关 tab 就忘的聊天 bot。
- 它代表你跑 shell 命令。 给它真实访问之前就设好带隔离的 Docker 或 serverless 后端,不是等它开始动你文件之后。沙箱是 day 1 决定,不是 later。
- 噪音很响。 Star 数在博文之间大起大眼,很多"deploy 指南"内容是 affiliate 噪音。按它对你这一周做什么来判,不按 leaderboard。
完整清单(直接粘)
# config (set once)
hermes config set model anthropic/claude-opus-4.8
hermes config set terminal.backend daytona
# 1. morning brief
every weekday at 7am, pull my unread GitHub notifications and open PRs, summarize what changed and what's blocking each, send to Telegram as 3-5 bullets
# 2. repo watch
watch [org/repo]. stay silent unless CI goes red or a new issue opens with label "bug". then message me the failing job name or the issue body, nothing else
# 3. inbox triage
every hour, check my connected channels, group by sender and urgency, auto-archive newsletters, only escalate ones mentioning a deadline, a person waiting on me, or money
# 4. research digest
every Friday at 6pm, search new releases and serious discussion in [topic], dedupe against last week, deliver a 5-bullet digest with links to Telegram
# 5. repo cold-start
clone [repo url], summarize the architecture in 5 bullets, find the main entrypoint and the single riskiest file, draft a clean PR workflow for contributing
# 6. async research
research [question], compare top 3 options on price, limits, lock-in, send the result tonight when done. don't wait on me, make reasonable assumptions and list them at the top
# 7. competitor watch
every day at 9am, check the changelog and pricing pages of [product A], [product B], only message me when something changed: a feature, a price move, a deprecation. quote the diff
# 8. nightly code review
every night at 11pm, look at today's commits and flag anything risky: a TODO left in, a console.log shipped, a function over 80 lines, a changed path with no test. short list
# 9. stand-up
every weekday at 9:55am, assemble my stand-up from my repos and channels: what closed, what's in progress, what's blocked, as three short bullets
# 10. mention radar
once a day, search for new mentions of [my project or handle] across the web and my platforms, ignore praise, escalate bug reports, complaints, and unanswered questions
# 11. talk to bullets
take [video or podcast url], pull the transcript, give me the argument in 5 bullets with timestamps for the parts worth watching. skip the intro and sponsor read
# 12. explain this error
here's a stack trace: [paste]. search my repo for the cause, explain what's failing in two sentences, draft the smallest patch that fixes it without touching anything else
# 13. inbox-zero drafts
for routine emails (scheduling, intros, status), draft a reply in my voice and hold it in a queue for my approval. never send on your own. escalate anything needing a real decision
# 14. on-call diagnosis
when a monitoring alert fires, pull the last 50 lines of the relevant logs, check what deployed recently, and send me a one-paragraph first guess at the cause with the raw alert
# 17. make it permanent (after any good run)
that worked. save it as a reusable skill called "[name]" so you run it the same way next time without me re-explaining
runtime 一条命令,然后跑 setup wizard:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
hermes setup
hermes setup 会引导你接 Telegram、Discord、Slack、WhatsApp、Signal 或 email 并把 Hermes 跑成 service。然后把上面 config 和 prompt 粘进去。
那个真正的转变
给聊天窗口的 prompt 是一个问题。给常驻 agent 的 prompt 是一份岗位描述:它需要一个触发器(schedule 或事件)、一个动作主体(做什么)、一个升级规则(什么情况打扰你)。三件套缺任何一件,prompt 要么不触发,要么做错事,要么把你埋在噪音里。
整个转变就在这:你不再想"我要问什么",开始想"哪些常驻工作我想从自己盘里拿走、在什么条件下我想听到它"。
你的周不是他的周。不住在 6 个聊天平台上,跳过 recipe 3。从不碰陌生 repo,跳过 recipe 5。粘 17 条,留对应你真重复的事的,删剩下的。3 条调成你真日常的 beat 17 条你设完永不看的。
Nous Research 发的 runtime 很多人 star、很多人用。大多数人还在瞪着空装看,因为 repo 给你的是引擎,不是路线。
引擎不是重点。重点是简报 7 点 ready、build 周末自盯、研究在你睡着时落地——这些事不抢你的注意力,因为没一件需要你在 loop 里。
17 条 prompt。5 周 $5 VPS。他一周里 3 小时不再发生在他醒着的时间。
如果这给你省了一个早上,转发它。下周 Part 2:撑过一个月还活着的 cron schedule 和自写 skill,以及被他删掉的那 3 条。
工作在跑。你不用醒着。