核心洞察
过去两年行业优化的方向都忽略了最关键的问题:记忆。
- 更大上下文窗口 ✓
- 更好工具调用 ✓
- 更快推理 ✓
- 更便宜模型 ✓
- 真正的学习循环 ✗
大多数 agent 是「临时上下文 + 提示工程」的金鱼——每次对话重置,明天又是全新的。
Hermes Agent 的四大差异
1. 从经验创建技能
不是只执行任务,而是将重复工作流转换为可重用「技能」:
- 转换重复工作流为可重用 "skills"
- 在 future execution 中改进这些 skills
- 持久化程序知识(procedural knowledge)
- 跨会话复用学习
范式对比:
| 传统 Agent | Hermes |
|---|---|
| 临时上下文 + 提示工程 | 操作记忆 + 迭代能力增长 |
| 每次对话重置 | 递归精炼执行 |
| 消耗 tokens | 压缩经验为工作流 |
一旦 agent 开始:
- 生成可重用抽象
- 将经验压缩为工作流
- 递归精炼执行
你停止与 chatbot 交互,开始与 compound 的系统交互。
2. 跨会话召回(Cross-Session Recall)
被严重低估的功能:使用 FTS5 + LLM summarization 搜索过去对话。
效果:
- 旧决策保持可发现
- 工作流变得可重用
- 长期项目停止碎片化
- Agent 发展连续性
未来 AI UX 不会看起来像:「每天打开新聊天」
而会像:「与持久操作上下文的持续协作」
Hermes 直接推进到那个未来。
3. 基础设施原生(Infrastructure-Native)
大多数 AI agent 仍然像本地玩具一样行为。Hermes 感觉基础设施原生。
部署选项:
- 便宜 VPS
- Docker
- Modal
- Daytona
- SSH backends
- GPU 集群
- Serverless 环境
交互渠道:
- Telegram
- Discord
- Slack
- Signal
- CLI
关系转变:
- 从「你打开的应用」
- 到「持续运行的数字操作员」
特性:持久、始终可用、云原生、异步。
4. 多模型编排层(Multi-Model Layer)
不试图将用户 hard-lock 到一个提供商。
支持的提供商:
- OpenRouter
- OpenAI
- Hugging Face
- NVIDIA NIM
- Nous Portal
- Moonshot/Kimi
- MiniMax
- GLM
- 自定义 endpoints
未来栈愿景:
- 不同模型用于不同推理风格
- 按工作负载路由
- 成本感知编排
- 动态推理策略
研究驱动的设计 DNA
不是优化:
- demos
- virality
- wrapper aesthetics
- "10x engineer" 营销
而是深入思考:
- Agent 架构
- 记忆系统
- 程序学习
- 自主循环
- 长期交互
研究 DNA 在设计中处处可见:
- Skills
- Memory persistence
- Subagents
- Automation
- Trajectory generation
- Recursive workflows
关键数据点
$5 VPS 即可运行。
这就是真正的信号:强大的自主系统正在变得 radically 更易获取。
为什么值得研究
不是因为 Hermes "完美"。
而是因为它指向一个非常重要的架构转变:
"AI systems that compound."
Agent 的下一个突破不是来自:
- 添加另一个工具
- 另一个 UI 层
- 另一个 prompt 模板
而是来自能够:
- 记住
- 压缩经验
- 改进行为
- 跨时间持久化身份
资源
- 作者:Suryansh Tiwari (@Suryanshti777)
- 原文:https://x.com/Suryanshti777/status/2055320336477180332
- GitHub:https://github.com/NousResearch/hermes-agent
- 文档:https://docs.nousresearch.com/hermes-agent
- 构建者:Nous Research(Hermes、Nomos、Psyche 背后的团队)