← 返回 FEED
AGENT2026-05-13

Skill Curation:AI 的下一个瓶颈不是模型,是技能管理

过去一年,AI 行业把「Agent」当作进步的主要度量单位。讨论焦点集中在 Agent 能不能浏览网页、调用工具、写代码、自主完成长任务。但这周的研究论文暗示,另一个度量单位正在走向前排:skills(技能)

什么是 Skill?

Skill 比 Agent 小,比 Prompt 持久。它是一个可复用的操作流程,用于完成特定类型的工作。可以很具体——「为 Obsidian 创建一个 skill」「把 skill creator 接到 Mimestream」;也可以很抽象——「行动前验证信息」「不确定时升级给人类」「从混乱文件中提取结构」。

Anthropic 的 Agent Skills 发布让这个词更可见:一个放在文件夹里的 SKILL.md 文件,按需加载。现在研究社区开始描述这个产品动作背后的架构。

为什么 Skill 重要?

很多现有 Agent 仍在从零即兴发挥。它们能完成一次任务,但往往无法积累稳定的过程性知识来提升长期表现。上周发表的几篇论文指向同一个转变:从把 Agent 看作推理引擎,转向把 Agent 看作积累、精炼、组织技能的系统

四篇论文勾勒的架构迁移

From Context to Skills — 语言模型能否把临时上下文示例转化为可复用的操作行为。

Skill1 — Agent 如何通过强化学习进化,同时积累类似技能的能力。

SkillOS — 技能策展本身:不只是学习新行为,还要决定哪些学习到的行为仍然有用、可复用。

From Skill Text to Skill Structure — 把 Agent 技能形式化为结构化表示,而不是松散的自然语言指令。

连起来看,这四篇论文描述了一次架构转型:

  • 第一代 AI 产品聚焦模型访问
  • 第二代聚焦工作流与编排
  • 正在浮现的第三层是操作记忆:能够存储、评估、版本化、检索和改进操作流程的系统

从语义检索到过程检索

这个趋势在搜索和检索研究中尤其明显。早期假设检索就是找语义相似的文本块,但 Agent 系统越来越需要过程检索:找到正确的证据、行动序列、或当前任务的操作策略。

在这个语境下,skill 开始像某种介于软件、记忆和组织实践之间的东西。一旦工作流可以被读作一组可复用技能的集合,它就可以被评估、改进、审计、跨团队或跨系统转移。

核心判断

孤立地看哪个模型最聪明已经不重要了。重要的是什么系统最擅长在不因自身复杂性而崩溃的前提下,持续积累有用的技能

更深层的含义:在智能过剩的时代,被精心整理的过程性知识将成为被争夺的资源。这也是在组织和社会中分布最不均的资源。谁构建了操作记忆,谁就构建了将继承这份丰裕的机构。