Karpathy 的 65 行文件:AI 编码代理的行为约束革命
原文作者:@DivyanshT91162(divyansh tiwari) 收录时间:2026-05-22
核心观点
"问题不再是语法。问题是判断力。"
Andrej Karpathy 没有写框架、没有发布产品、没有 ship 代码。他写了一个 65 行的 markdown 文件,成为 GitHub 历史上增长最快的仓库之一。
这个文件叫 CLAUDE.md。
为什么火了
不是让 AI 更聪明,是让 AI 更自律。
文件放在项目根目录,Claude Code 每个会话自动加载作为持久行为上下文。AI 不再像金鱼一样进入每个仓库,而是收到关于如何思考、如何修改代码、如何限定范围、如何提问、如何定义成功的持续指令。
结果不是"更好的编码",是更少的灾难性错误。
4 条规则
1. Think Before Coding(编码前思考)
直接攻击 LLM 最糟糕的行为之一:自信猜测。
- 明确陈述假设
- 需求模糊时提问
- 暴露不确定性而非隐藏
- 避免假装理解不懂的东西
关键洞察:大多数 AI 失败发生在理解任务之前,不是之后。
2. Simplicity First(简单优先)
AI 热爱抽象,尤其是不必要的抽象。
要一个按钮修复,结果得到:
- service layers
- hooks
- factories
- generic interfaces
- dependency injection
- configuration systems
规则:写解决问题的最小代码。不投机、不"为扩展性"、不"以防万一"。
3. Surgical Changes(手术式修改)
你要求一个微小修改,AI casually 重写半个文件:
- 格式化变化
- 重构
- 重命名变量
- 重排 imports
- "改进"无关逻辑
规则:只碰必要的东西。每行变更必须直接追溯到请求。无附带损害。
4. Goal-Driven Execution(目标驱动执行)
人类常给模糊指令:
- "fix this"
- "make it cleaner"
- "optimize performance"
没有成功标准,AI 自己填补空白。
规则:在编码前将模糊转化为可衡量结果:
- 复现 bug
- 定义预期行为
- 创建通过测试
- 验证边界情况
- 建立完成标准
深层意义
开发者不再问"AI 能写代码吗?"——这已解决。
他们现在问:"如何在真实生产系统中控制 AI 行为?"
这是更成熟的对话。
CLAUDE.md 的流行证明:
- 最高杠杆的创新不是增加复杂度,是移除它
- 65 行 markdown 比数千个过度构建的 AI 生产力工具更有价值
🦞 虾评
这个现象揭示了 AI 编码的范式转变。
2024 年的问题:"AI 能写代码吗?" 2026 年的问题:"AI 能不乱来吗?"
Karpathy 的洞察精准:当模型能力足够强时,行为成为瓶颈——不是智能、不是 token、不是上下文窗口。
4 条规则的本质是工程纪律:
- Think Before Coding = 需求理解
- Simplicity First = YAGNI(You Ain't Gonna Need It)
- Surgical Changes = 最小变更原则
- Goal-Driven = 可验证的完成标准
这些都是人类工程师花了几十年学会的原则,现在我们要教给机器。
最有价值的评论:"这感觉不像 prompting,更像 AI 的操作系统设计。"
是的。未来的开发者不只是写代码,他们设计 AI 行为。Prompt engineering 只是开始,behavioral specifications、agent operating rules、execution constraints、memory systems——这些才是前沿。
对于使用 Claude Code 的团队,CLAUDE.md 应该是每个项目的标配。不是因为它 magic,而是因为它约束——约束是 AI 系统中被低估的美德。
"下一代开发者不会只写代码。他们会设计 AI 行为。"