Nainsi Dwivedi 解读了 Andrej Karpathy 提出的"LLM Wiki"模式,指出 RAG 有一个没人谈论的致命缺陷:它从不真正学习任何东西。
RAG 的死循环
每次上传文档到 AI 系统,同样的循环发生:
检索 chunks → 生成答案 → 丢弃合成 → 重复 forever
模型听起来很聪明。但在底层,它在每次查询时都从原始上下文窗口重建理解。没有持久合成。没有演化结构。没有复利知识。只是临时推理覆盖原始上下文。
这就是今天几乎所有"与你的文档聊天"产品的天花板:NotebookLM、PDF 聊天应用、大多数企业 AI copilot、甚至 ChatGPT 的文件上传。有用吗?绝对。但根本上是无状态的。
LLM Wiki:从检索到积累
Karpathy 的"LLM Wiki"模式引入了一个更重要的想法:如果模型维护知识而不是反复检索它?
区别听起来很小。它完全改变了架构。
不是把文档当作需要持续重新扫描的东西,系统在用户和原始来源之间构建一个持久的 wiki 层。不是嵌入索引。是一个演化的知识基底:
- 结构化 markdown 页面
- 互连概念
- 实体映射
- 摘要
- 比较
- 矛盾
- 开放问题
- 长期合成
最重要的是:系统持续更新这一层。所以当你添加新论文或转录时,模型不只是"存储"它——它整合它。
单篇文档的连锁效应
一篇新文档可能:
- 精炼现有摘要
- 修改实体页面
- 创建全新的概念链接
- 暴露不一致
- 加强或削弱先前结论
- 更新跨系统的长期合成
知识基础本身复利增长。这是真正的突破。
维护瓶颈的消解
传统 RAG 没有理解记忆。只有数据记忆。LLM Wiki 翻转了这一点。系统保留合成理解本身。这意味着未来推理变得显著更便宜、更深入、更具上下文感知。
知识系统的瓶颈从来不是智力。是维护。
人类创建的系统会衰减,因为维护开销最终变得难以忍受。链接断裂。笔记碎片化。矛盾堆积。分类法漂移。上下文消失。最终系统变得比重建更难维护。
LLM 首次改变了这个等式。它们让持续组织维护几乎免费。一旦维护接近零成本,全新的知识架构变得可行。
巨大的影响
- 研究系统 —— 持续演化
- 个人知识库 —— 随时间成熟
- 公司记忆 —— 复利而非每季度重置
- AI 协作者 —— 拥有持久概念理解
- 第二大脑 —— 随时间真正发展连贯性
范式转移
Karpathy 的想法之所以重要,是因为它重新定义了 AI:
从:"按需检索信息" 到:"持续构建和精炼理解"
这是比大多数人意识到的更大的转变。
RAG 检索上下文。LLM Wiki 积累知识。这不是一回事。