核心观点
Skill 没多神秘,就是一个文件夹。理解了文件夹里每个东西干嘛的,今晚就能写自己的第一个 Skill。
Skill 通用结构
底线只需要一个 SKILL.md,其他四个文件夹全可选:
my-skill/
├── SKILL.md ← 唯一必需
├── references/ ← 参考文件(如 HTML 规范)
├── assets/ ← 静态资源(模板、图片)
├── evals/ ← 测试用例集
└── scripts/ ← 特定脚本(可选)
SKILL.md 五个核心组件
1. YAML 触发头
决定 Claude 什么时候激活这个 Skill。description 必须包含三件事:
- 明确触发短语(3-5 条)
- 一句话产物描述(具体到不会乱来)
- 负向边界(挡掉劫持)
2. Skill 内容描述
一句话讲清"是什么 + 视觉/约束锁死"。
3. Workflow
编号的、顺序的执行步骤。关键是把模糊指令变成查表操作。
4. Output Format
禁令式规则,不是建议。例如:
- 全部 inline style,禁止
<style>块 - 不要 JS / 不要伪元素
- 色板锁死
5. Examples
至少两个:理想路径 + 边界情况。
一个具体示例,胜过五十行抽象指令。
从想法到可用的四步实操
Step 1: 一句话说清干嘛、何时触发
Step 2: 先做视觉/规范参考
Step 3: 把图 + 需求喂给 skill-creator
Step 4: Review + 测试
重点盯 description 三要素和 Workflow 是否"查表化"。
测试方法论
- 白盒:浏览 SKILL.md 和子目录,对照五个组件查描述是否符合预期
- 黑盒:跑两三个真实 case,输出不对就把问题提给 AI 让它改
- evals.json 必须包含边界 case:纯文本输入、MD 嵌公式/表格等翻车重灾区
模型选择
Skill 执行要的不是顶级推理,是老老实实 follow 指令。Ring-2.6-1T(万亿参数 agentic 模型)在 Skill 执行上:
- 不漂——4 步 workflow 跑到第 3、4 步还能严格按 SKILL.md 走
- 不偏——读了 references/ 真的去用,不会"读完忘"
- 便宜——比旗舰模型便宜一个量级
关键金句
"禁令比建议好测试"——大多数人写 Skill 满篇"建议""尽量""推荐",跑起来全靠模型心情。你把 workflow 写成查表、规则写成禁令,这两刀下去 Skill 的稳定性直接跨档。