Hermes Skills Hub 上线了,17 个类别,672 个技能。作者从中筛选出 7 个可直接接入生产的 Skill,连起来刚好是一条完整的 Agent 生产链路。
7 个 Skill 的链路
MCP 打底 → 模型能碰系统 Instructor → 输出能落库 Qdrant → 知识能检索 vLLM → 模型能自跑 Docker → 部署能自动化 可观测 → 挂了能定位 安全 → 暴露了能兜底
1. fastmcp(工具层)
Agent 接触真实业务系统的入口。把内部 API、DB、CLI 包装成 Agent 能调的工具。
- 提供脚手架,一键生成模板
- 写工具用
.tool,命名用 verb-based,docstring 写清楚类型 - 本地开发跑
fastmcp run / inspect / call,上线转 HTTP endpoint - 生产环境 auth 走环境变量,错误全报出来
路径:optional/mcp/fastmcp
2. Instructor(输出层)
很多 AI 项目翻车都是同一个问题:模型能答,但答出来的东西不能落库,不能进 workflow。
Instructor 基于 Pydantic,做三件事:
- 结构化输出:让模型输出系统可以直接消费的对象
- 自动重试:解析失败时自动重试
- 类型安全解析:不再只是"回答一段话"
from openai import OpenAI
import instructor
client = instructor.from_openai(OpenAI())
result = client.completions.create(
model="gpt-4o-mini",
response_model=MyModel,
messages=[{"role": "user", "content": "..."}],
)
路径:optional-skills/mlops/instructor
3. Qdrant(知识层)
FAISS 是玩具,Qdrant 是生产。
- hybrid search、多向量、metadata filter
- 量化、HNSW、Raft 分布式、on-disk payload
换 Qdrant 之后最直观的感受:延迟可控了,扩展不慌了,filter 精准了。
路径:optional/mlops/mlops-qdrant
4. vLLM(推理层)
不想被 API 供应商锁死的话,vLLM 是最成熟的自部署方案。
一行启动:
vllm serve model --quantization awq --tensor-parallel-size N
内置 PagedAttention、continuous batching、prefix-caching、Prometheus metrics。支持 OpenAI API 兼容和离线 batch。
自己控成本、控延迟、控合规。三控都在自己手里。
路径:bundled/mlops/mlops-inference-vllm
5. Docker Management(部署层)
覆盖 Docker / Compose 全生命周期:
- 容器起停、exec、logs
- image prune、volume / network cleanup
- Compose up / down / config
- 健康检查模板
Agent 自己能管容器 = 部署、运维、回滚全自动化。
路径:optional/devops/devops-docker-management
6. 可观测(监控层)
不是独立 Skill,是 Hermes 核心 + vLLM metrics 的组合。
生产里最痛苦的事是系统挂之后不知道哪挂了。这套东西做的事:
- vLLM 内置 Prometheus,暴露 TTFT、请求数、GPU cache
- Docker logs
- Skill 执行 trace
Agent 被训练成:先查 metrics,再关联日志。出问题 10 秒内能定位是 MCP 挂了、RAG 慢了还是 inference 爆了。
7. 安全(防护层)
所有 Skill 安装时自动做三件事:
- 扫描:防 prompt injection
- 检查:防 credential 泄露
- 审计:防 destructive command
MCP 层强制 env var auth + command approval + container isolation。开箱就有,不需要自己搭。
为什么这 7 个能连成一条线
MCP 打底 → 模型能碰系统 Instructor → 输出能落库 Qdrant → 知识能检索 vLLM → 模型能自跑 Docker → 部署能自动化 可观测 → 挂了能定位 安全 → 暴露了能兜底
这条链路比大多数公司的 AI 架构图都清晰。每个环节都有具体的工具、具体的安装命令、具体的生产验证。
安装命令:
hermes skills install fastmcp
hermes skills install instructor
hermes skills install qdrant-vector-search
hermes skills install serving-llms-vllm
hermes skills install docker-management
672 个技能里筛出 7 个能落地的,这才是真正的选型能力。