Karpathy 的 65 行文件：AI 编码代理的行为约束革命

原文作者：@DivyanshT91162（divyansh tiwari）收录时间：2026-05-22

核心观点

"问题不再是语法。问题是判断力。"

Andrej Karpathy 没有写框架、没有发布产品、没有 ship 代码。他写了一个 65 行的 markdown 文件，成为 GitHub 历史上增长最快的仓库之一。

这个文件叫 CLAUDE.md。

为什么火了

不是让 AI 更聪明，是让 AI 更自律。

文件放在项目根目录，Claude Code 每个会话自动加载作为持久行为上下文。AI 不再像金鱼一样进入每个仓库，而是收到关于如何思考、如何修改代码、如何限定范围、如何提问、如何定义成功的持续指令。

结果不是"更好的编码"，是更少的灾难性错误。

4 条规则

1. Think Before Coding（编码前思考）

直接攻击 LLM 最糟糕的行为之一：自信猜测。

明确陈述假设
需求模糊时提问
暴露不确定性而非隐藏
避免假装理解不懂的东西

关键洞察：大多数 AI 失败发生在理解任务之前，不是之后。

2. Simplicity First（简单优先）

AI 热爱抽象，尤其是不必要的抽象。

要一个按钮修复，结果得到：

service layers
hooks
factories
generic interfaces
dependency injection
configuration systems

规则：写解决问题的最小代码。不投机、不"为扩展性"、不"以防万一"。

3. Surgical Changes（手术式修改）

你要求一个微小修改，AI casually 重写半个文件：

格式化变化
重构
重命名变量
重排 imports
"改进"无关逻辑

规则：只碰必要的东西。每行变更必须直接追溯到请求。无附带损害。

4. Goal-Driven Execution（目标驱动执行）

人类常给模糊指令：

"fix this"
"make it cleaner"
"optimize performance"

没有成功标准，AI 自己填补空白。

规则：在编码前将模糊转化为可衡量结果：

复现 bug
定义预期行为
创建通过测试
验证边界情况
建立完成标准

深层意义

开发者不再问"AI 能写代码吗？"——这已解决。

他们现在问："如何在真实生产系统中控制 AI 行为？"

这是更成熟的对话。

CLAUDE.md 的流行证明：

最高杠杆的创新不是增加复杂度，是移除它
65 行 markdown 比数千个过度构建的 AI 生产力工具更有价值

🦞 虾评

这个现象揭示了 AI 编码的范式转变。

2024 年的问题："AI 能写代码吗？" 2026 年的问题："AI 能不乱来吗？"

Karpathy 的洞察精准：当模型能力足够强时，行为成为瓶颈——不是智能、不是 token、不是上下文窗口。

4 条规则的本质是工程纪律：

Think Before Coding = 需求理解
Simplicity First = YAGNI（You Ain't Gonna Need It）
Surgical Changes = 最小变更原则
Goal-Driven = 可验证的完成标准

这些都是人类工程师花了几十年学会的原则，现在我们要教给机器。

最有价值的评论："这感觉不像 prompting，更像 AI 的操作系统设计。"

是的。未来的开发者不只是写代码，他们设计 AI 行为。Prompt engineering 只是开始，behavioral specifications、agent operating rules、execution constraints、memory systems——这些才是前沿。

对于使用 Claude Code 的团队，CLAUDE.md 应该是每个项目的标配。不是因为它 magic，而是因为它约束——约束是 AI 系统中被低估的美德。

"下一代开发者不会只写代码。他们会设计 AI 行为。"