Addy Osmani 发布 Agent Skills：21 个生产级工程技能包

Addy Osmani（Chrome 团队前工程主管、Google 工程实践专家）发布了一套面向 AI 编程 Agent 的生产级工程技能包——agent-skills。21 个技能覆盖从定义到发布的完整开发流程，支持 Claude Code、Cursor、Gemini CLI、Windsurf、GitHub Copilot 等主流 Agent 工具。

核心理念：Process, not prose

Skills 不是给 Agent 读的参考资料，而是 Agent 要执行的工作流。每个技能包含：步骤、检查点、退出条件。Agent 不是"看看建议然后自己决定"，而是按流程走到底。

这套技能包的设计哲学很明确：AI coding agents 默认走最短路径——跳过 spec、跳过测试、跳过安全审查。Agent Skills 给它们结构化的工作流，强制执行资深工程师带到生产代码里的纪律。

七个 slash 命令，映射开发全周期

DEFINE → /spec    → 先写 spec 再写代码
PLAN   → /plan    → 小而原子的任务
BUILD  → /build   → 一次一个垂直切片
VERIFY → /test    → 测试是证明
REVIEW → /review  → 改善代码健康度
       → /code-simplify → 清晰优于聪明
SHIP   → /ship    → 更快更安全

每个命令激活对应的技能自动触发。设计 API 时自动触发 api-and-interface-design，构建 UI 时自动触发 frontend-ui-engineering。

21 个技能全览

Define（定义）

idea-refine：结构化发散/收敛思考，把模糊想法变成具体提案
spec-driven-development：写 PRD 覆盖目标、命令、结构、代码风格、测试和边界

Plan（规划）

planning-and-task-breakdown：把 spec 分解成小任务，带验收标准和依赖排序

Build（构建）

incremental-implementation：薄垂直切片，实现、测试、验证、提交
test-driven-development：红绿重构、测试金字塔（80/15/5）、DAMP 优于 DRY、Beyonce Rule
context-engineering：在正确的时间给 Agent 正确的信息
source-driven-development：每个框架决策都基于官方文档验证
doubt-driven-development：对抗性新鲜上下文审查——CLAIM → EXTRACT → DOUBT → RECONCILE → STOP
frontend-ui-engineering：组件架构、设计系统、状态管理、响应式、WCAG 2.1 AA
api-and-interface-design：契约优先设计、Hyrum's Law、One-Version Rule

Verify（验证）

browser-testing-with-devtools：Chrome DevTools MCP 实时运行时数据
debugging-and-error-recovery：五步诊断：复现、定位、缩减、修复、防护

Review（审查）

code-review-and-quality：五轴审查、变更大小（~100 行）、严重度标签
code-simplification：Chesterton's Fence、500 行规则、在保持行为的前提下降低复杂度
security-and-hardening：OWASP Top 10 预防、认证模式、密钥管理
performance-optimization：测量优先——Core Web Vitals、性能分析、包分析

Ship（发布）

git-workflow-and-versioning：主干开发、原子提交、提交作为保存点
ci-cd-and-automation：Shift Left、更快更安全、功能开关、质量门
deprecation-and-migration：代码即负债、强制 vs 建议弃用、僵尸代码清理
documentation-and-adrs：架构决策记录、API 文档、记录"为什么"
shipping-and-launch：发布前检查清单、功能开关生命周期、分阶段推出

反合理化表格：每个技能的杀手锏

每个技能都包含一个"Rationalizations"表格——Agent 常用的借口和对应的反驳：

借口	反驳
"我以后再写测试"	以后不会来。现在写。
"这个改动很小，不需要 review"	小改动破坏大系统的案例太多了。
"先上线，再优化"	上线后再优化 = 永远不优化。

这不是给人类的建议，这是给 Agent 的硬规则。Agent 想跳过步骤时，技能文件直接阻止它。

验证是非协商的

每个技能以证据要求结束——测试通过、构建输出、运行时数据。"看起来对了"永远不够。

多工具支持

Claude Code：通过 marketplace 安装，/plugin 命令
Cursor：复制 SKILL.md 到 .cursor/rules/
Gemini CLI：gemini skills install
Windsurf：添加到 rules 配置
GitHub Copilot：作为 copilot-instructions.md
OpenCode：通过 AGENTS.md 和 skill 工具
Kiro IDE：.kiro/skills/ 目录

所有技能都是纯 Markdown，任何接受 system prompt 或 instruction 文件的 Agent 都能用。

融入 Google 工程文化

技能里直接嵌入了 Google 工程实践的概念：

Hyrum's Law（API 设计）
Beyonce Rule 和测试金字塔（测试）
变更大小和 review 速度规范（代码审查）
Chesterton's Fence（简化）
主干开发（Git 工作流）
Shift Left 和功能开关（CI/CD）
代码即负债（弃用）

这些不是抽象原则，是嵌入到 Agent 逐步工作流里的具体操作。

为什么这很重要

Addy Osmani 的身份让这套技能有了特别的分量——他不是某个 AI 工具的布道者，他是从 Google 工程文化里走出来的人。他把"资深工程师怎么做生产代码"编码成了 Agent 可以执行的工作流。

对于任何用 AI Agent 写代码的团队，这不是"要不要用"的问题，是"什么时候用"的问题。21 个技能覆盖了开发全周期，每个都有验证要求、反合理化表格、明确的退出条件。

Agent 时代，不是 Agent 能做什么的问题，是 Agent 按什么标准做的问题。 这套技能包给出了一个答案。