返回 FEED
AGENT2026-05-09

Hermes Skills Hub 生产精选:7 个 Skill 跑通 Agent 全链路

Hermes Skills Hub 上线了,17 个类别,672 个技能。作者从中筛选出 7 个可直接接入生产的 Skill,连起来刚好是一条完整的 Agent 生产链路。

7 个 Skill 的链路

MCP 打底 → 模型能碰系统 Instructor → 输出能落库 Qdrant → 知识能检索 vLLM → 模型能自跑 Docker → 部署能自动化 可观测 → 挂了能定位 安全 → 暴露了能兜底

1. fastmcp(工具层)

Agent 接触真实业务系统的入口。把内部 API、DB、CLI 包装成 Agent 能调的工具。

  • 提供脚手架,一键生成模板
  • 写工具用 .tool,命名用 verb-based,docstring 写清楚类型
  • 本地开发跑 fastmcp run / inspect / call,上线转 HTTP endpoint
  • 生产环境 auth 走环境变量,错误全报出来

路径:optional/mcp/fastmcp

2. Instructor(输出层)

很多 AI 项目翻车都是同一个问题:模型能答,但答出来的东西不能落库,不能进 workflow。

Instructor 基于 Pydantic,做三件事:

  • 结构化输出:让模型输出系统可以直接消费的对象
  • 自动重试:解析失败时自动重试
  • 类型安全解析:不再只是"回答一段话"
from openai import OpenAI
import instructor

client = instructor.from_openai(OpenAI())
result = client.completions.create(
    model="gpt-4o-mini",
    response_model=MyModel,
    messages=[{"role": "user", "content": "..."}],
)

路径:optional-skills/mlops/instructor

3. Qdrant(知识层)

FAISS 是玩具,Qdrant 是生产。

  • hybrid search、多向量、metadata filter
  • 量化、HNSW、Raft 分布式、on-disk payload

换 Qdrant 之后最直观的感受:延迟可控了,扩展不慌了,filter 精准了。

路径:optional/mlops/mlops-qdrant

4. vLLM(推理层)

不想被 API 供应商锁死的话,vLLM 是最成熟的自部署方案。

一行启动:

vllm serve model --quantization awq --tensor-parallel-size N

内置 PagedAttention、continuous batching、prefix-caching、Prometheus metrics。支持 OpenAI API 兼容和离线 batch。

自己控成本、控延迟、控合规。三控都在自己手里。

路径:bundled/mlops/mlops-inference-vllm

5. Docker Management(部署层)

覆盖 Docker / Compose 全生命周期:

  • 容器起停、exec、logs
  • image prune、volume / network cleanup
  • Compose up / down / config
  • 健康检查模板

Agent 自己能管容器 = 部署、运维、回滚全自动化。

路径:optional/devops/devops-docker-management

6. 可观测(监控层)

不是独立 Skill,是 Hermes 核心 + vLLM metrics 的组合。

生产里最痛苦的事是系统挂之后不知道哪挂了。这套东西做的事:

  • vLLM 内置 Prometheus,暴露 TTFT、请求数、GPU cache
  • Docker logs
  • Skill 执行 trace

Agent 被训练成:先查 metrics,再关联日志。出问题 10 秒内能定位是 MCP 挂了、RAG 慢了还是 inference 爆了。

7. 安全(防护层)

所有 Skill 安装时自动做三件事:

  1. 扫描:防 prompt injection
  2. 检查:防 credential 泄露
  3. 审计:防 destructive command

MCP 层强制 env var auth + command approval + container isolation。开箱就有,不需要自己搭。

为什么这 7 个能连成一条线

MCP 打底 → 模型能碰系统 Instructor → 输出能落库 Qdrant → 知识能检索 vLLM → 模型能自跑 Docker → 部署能自动化 可观测 → 挂了能定位 安全 → 暴露了能兜底

这条链路比大多数公司的 AI 架构图都清晰。每个环节都有具体的工具、具体的安装命令、具体的生产验证。

安装命令:

hermes skills install fastmcp
hermes skills install instructor
hermes skills install qdrant-vector-search
hermes skills install serving-llms-vllm
hermes skills install docker-management

672 个技能里筛出 7 个能落地的,这才是真正的选型能力。