Addy Osmani(Chrome 团队前工程主管、Google 工程实践专家)发布了一套面向 AI 编程 Agent 的生产级工程技能包——agent-skills。21 个技能覆盖从定义到发布的完整开发流程,支持 Claude Code、Cursor、Gemini CLI、Windsurf、GitHub Copilot 等主流 Agent 工具。
核心理念:Process, not prose
Skills 不是给 Agent 读的参考资料,而是 Agent 要执行的工作流。每个技能包含:步骤、检查点、退出条件。Agent 不是"看看建议然后自己决定",而是按流程走到底。
这套技能包的设计哲学很明确:AI coding agents 默认走最短路径——跳过 spec、跳过测试、跳过安全审查。Agent Skills 给它们结构化的工作流,强制执行资深工程师带到生产代码里的纪律。
七个 slash 命令,映射开发全周期
DEFINE → /spec → 先写 spec 再写代码
PLAN → /plan → 小而原子的任务
BUILD → /build → 一次一个垂直切片
VERIFY → /test → 测试是证明
REVIEW → /review → 改善代码健康度
→ /code-simplify → 清晰优于聪明
SHIP → /ship → 更快更安全
每个命令激活对应的技能自动触发。设计 API 时自动触发 api-and-interface-design,构建 UI 时自动触发 frontend-ui-engineering。
21 个技能全览
Define(定义)
idea-refine:结构化发散/收敛思考,把模糊想法变成具体提案spec-driven-development:写 PRD 覆盖目标、命令、结构、代码风格、测试和边界
Plan(规划)
planning-and-task-breakdown:把 spec 分解成小任务,带验收标准和依赖排序
Build(构建)
incremental-implementation:薄垂直切片,实现、测试、验证、提交test-driven-development:红绿重构、测试金字塔(80/15/5)、DAMP 优于 DRY、Beyonce Rulecontext-engineering:在正确的时间给 Agent 正确的信息source-driven-development:每个框架决策都基于官方文档验证doubt-driven-development:对抗性新鲜上下文审查——CLAIM → EXTRACT → DOUBT → RECONCILE → STOPfrontend-ui-engineering:组件架构、设计系统、状态管理、响应式、WCAG 2.1 AAapi-and-interface-design:契约优先设计、Hyrum's Law、One-Version Rule
Verify(验证)
browser-testing-with-devtools:Chrome DevTools MCP 实时运行时数据debugging-and-error-recovery:五步诊断:复现、定位、缩减、修复、防护
Review(审查)
code-review-and-quality:五轴审查、变更大小(~100 行)、严重度标签code-simplification:Chesterton's Fence、500 行规则、在保持行为的前提下降低复杂度security-and-hardening:OWASP Top 10 预防、认证模式、密钥管理performance-optimization:测量优先——Core Web Vitals、性能分析、包分析
Ship(发布)
git-workflow-and-versioning:主干开发、原子提交、提交作为保存点ci-cd-and-automation:Shift Left、更快更安全、功能开关、质量门deprecation-and-migration:代码即负债、强制 vs 建议弃用、僵尸代码清理documentation-and-adrs:架构决策记录、API 文档、记录"为什么"shipping-and-launch:发布前检查清单、功能开关生命周期、分阶段推出
反合理化表格:每个技能的杀手锏
每个技能都包含一个"Rationalizations"表格——Agent 常用的借口和对应的反驳:
| 借口 | 反驳 |
|---|---|
| "我以后再写测试" | 以后不会来。现在写。 |
| "这个改动很小,不需要 review" | 小改动破坏大系统的案例太多了。 |
| "先上线,再优化" | 上线后再优化 = 永远不优化。 |
这不是给人类的建议,这是给 Agent 的硬规则。Agent 想跳过步骤时,技能文件直接阻止它。
验证是非协商的
每个技能以证据要求结束——测试通过、构建输出、运行时数据。"看起来对了"永远不够。
多工具支持
- Claude Code:通过 marketplace 安装,/plugin 命令
- Cursor:复制 SKILL.md 到
.cursor/rules/ - Gemini CLI:
gemini skills install - Windsurf:添加到 rules 配置
- GitHub Copilot:作为 copilot-instructions.md
- OpenCode:通过 AGENTS.md 和 skill 工具
- Kiro IDE:
.kiro/skills/目录
所有技能都是纯 Markdown,任何接受 system prompt 或 instruction 文件的 Agent 都能用。
融入 Google 工程文化
技能里直接嵌入了 Google 工程实践的概念:
- Hyrum's Law(API 设计)
- Beyonce Rule 和测试金字塔(测试)
- 变更大小和 review 速度规范(代码审查)
- Chesterton's Fence(简化)
- 主干开发(Git 工作流)
- Shift Left 和功能开关(CI/CD)
- 代码即负债(弃用)
这些不是抽象原则,是嵌入到 Agent 逐步工作流里的具体操作。
为什么这很重要
Addy Osmani 的身份让这套技能有了特别的分量——他不是某个 AI 工具的布道者,他是从 Google 工程文化里走出来的人。他把"资深工程师怎么做生产代码"编码成了 Agent 可以执行的工作流。
对于任何用 AI Agent 写代码的团队,这不是"要不要用"的问题,是"什么时候用"的问题。21 个技能覆盖了开发全周期,每个都有验证要求、反合理化表格、明确的退出条件。
Agent 时代,不是 Agent 能做什么的问题,是 Agent 按什么标准做的问题。 这套技能包给出了一个答案。