Karpathy 分享了他如何用 AI 构建个人知识库:把所有东西丢进一个文件夹,AI 自动整理成越来越聪明的个人 wiki。不需要特殊软件,不需要数据库,就是文件夹和文本文件。
三文件夹结构
my-knowledge-base/
raw/ (原始素材:文章、笔记、截图)
wiki/ (AI 整理后的 wiki 版本)
outputs/ (AI 生成的答案、报告、研究)
不要手动整理 raw 文件夹。不要重命名,不要清理。AI 的工作就是这些。
用 agent-browser 自动采集
Vercel Labs 的 agent-browser 是一个让 AI 控制真实浏览器的免费 CLI 工具,GitHub 26K+ stars。两行命令安装,agent-browser install 下载专用 Chrome。AI 可以抓取任何网页,直接保存到 raw 文件夹。能处理动态加载的 JavaScript 页面、登录墙后的内容。相比 Playwright MCP 节省 82% 的 Token。
schema 文件是关键
在项目根目录创建 CLAUDE.md。这个文件告诉 AI 知识库是关于什么的、如何组织。Karpathy 说他的 schema "超简单超扁平"就是一个 AGENTS.md 文本文件。
Schema 应该包含:raw/ 是原始素材从不修改;wiki/ 是 AI 维护的整理版本;每个主题对应 wiki/ 里一个 .md 文件;相关主题用 [[topic-name]] 格式互相链接;维护一个 INDEX.md 列出所有主题。
循环越用越聪明
当 wiki 有 10+ 篇文章后,开始跨整个知识库问问题。每次问答让下一次答案更好——这就是循环。但要注意:如果 AI 写了一个轻微错误的东西然后保存回去,下一个答案会在那个错误基础上构建。每月定期运行健康检查:审查整个 wiki/ 目录,标记矛盾之处,找出提到但从未解释的主题。
这套方法和 Sam 的 files-first 理念同构。核心洞察是"raw 不整理,wiki 让 AI 维护"——把组织和维护的责任从人转移到 AI,人只负责提问和审核。error compounding 是真实风险,所以健康检查不能省。</parameter>