返回 FEED
AGENT2026-05-16

RAG 不会学习——Karpathy 的 LLM Wiki 改变知识范式

Nainsi Dwivedi 解读了 Andrej Karpathy 提出的"LLM Wiki"模式,指出 RAG 有一个没人谈论的致命缺陷:它从不真正学习任何东西。

RAG 的死循环

每次上传文档到 AI 系统,同样的循环发生:

检索 chunks → 生成答案 → 丢弃合成 → 重复 forever

模型听起来很聪明。但在底层,它在每次查询时都从原始上下文窗口重建理解。没有持久合成。没有演化结构。没有复利知识。只是临时推理覆盖原始上下文。

这就是今天几乎所有"与你的文档聊天"产品的天花板:NotebookLM、PDF 聊天应用、大多数企业 AI copilot、甚至 ChatGPT 的文件上传。有用吗?绝对。但根本上是无状态的。

LLM Wiki:从检索到积累

Karpathy 的"LLM Wiki"模式引入了一个更重要的想法:如果模型维护知识而不是反复检索它?

区别听起来很小。它完全改变了架构。

不是把文档当作需要持续重新扫描的东西,系统在用户和原始来源之间构建一个持久的 wiki 层。不是嵌入索引。是一个演化的知识基底:

  • 结构化 markdown 页面
  • 互连概念
  • 实体映射
  • 摘要
  • 比较
  • 矛盾
  • 开放问题
  • 长期合成

最重要的是:系统持续更新这一层。所以当你添加新论文或转录时,模型不只是"存储"它——它整合它。

单篇文档的连锁效应

一篇新文档可能:

  • 精炼现有摘要
  • 修改实体页面
  • 创建全新的概念链接
  • 暴露不一致
  • 加强或削弱先前结论
  • 更新跨系统的长期合成

知识基础本身复利增长。这是真正的突破。

维护瓶颈的消解

传统 RAG 没有理解记忆。只有数据记忆。LLM Wiki 翻转了这一点。系统保留合成理解本身。这意味着未来推理变得显著更便宜、更深入、更具上下文感知。

知识系统的瓶颈从来不是智力。是维护。

人类创建的系统会衰减,因为维护开销最终变得难以忍受。链接断裂。笔记碎片化。矛盾堆积。分类法漂移。上下文消失。最终系统变得比重建更难维护。

LLM 首次改变了这个等式。它们让持续组织维护几乎免费。一旦维护接近零成本,全新的知识架构变得可行。

巨大的影响

  • 研究系统 —— 持续演化
  • 个人知识库 —— 随时间成熟
  • 公司记忆 —— 复利而非每季度重置
  • AI 协作者 —— 拥有持久概念理解
  • 第二大脑 —— 随时间真正发展连贯性

范式转移

Karpathy 的想法之所以重要,是因为它重新定义了 AI:

从:"按需检索信息" 到:"持续构建和精炼理解"

这是比大多数人意识到的更大的转变。

RAG 检索上下文。LLM Wiki 积累知识。这不是一回事。