返回 FEED
OTHER2026-05-30

0xShimei:10 分钟搭 AI 自生长知识库——Obsidian + Codex 让信息自动帮你干活

你的笔记是不是也这样:

  • 收藏了 1000+ 篇文章,再也没打开过
  • 看到好的观点就截图,图库满了知识还是零
  • 每次写方案都要从零开始搜资料,过去的积累用不上
  • 明明整理了很多笔记,真正输出时却想不起来

问题不是你不够勤奋——是知识库只是个"收藏夹",不是个"能自动帮你干活的系统"

0xShimei 给了 Obsidian + Codex 方案:10 分钟搭出来,让知识库自己生长、自己整理、自己输出

核心理念:消化系统 vs 收藏夹

传统知识库 = 收藏夹——只进不出,越堆越乱。

自生长知识库 = 消化系统——

吃进原料(网页 / 论文 / 截图 / 会议纪要)
    ↓ AI 消化
抽出概念(核心观点 / 数据 / 案例 / 方法论)
    ↓ 任务调用
输出产物(文章 / 报告 / 方案 / 代码)

关键是"消化"这一步——Codex 定期读你的原料库,结构化整理进概念库再抽取方法论到 Skill 库

4 文件夹闭环

整个系统分成 4 个文件夹:

📁 A. 原料库(未处理原始资料)
   - 网页、论文、截图、视频字幕、会议纪要
   ↓ Codex 定期消化复盘
📁 B. 概念库(处理后的结构化知识)
   - 核心观点、数据、案例、方法论
   ↓ 根据任务/场景调用
📁 C. Skill 库(可复用的方法论模板)
   - 选题判断标准、写作风格、周报模板、分析框架
   ↓ 任务触发
📁 D. 输出库(任务产物)
   - 写完的文章、做完的报告、产出的代码
   ↓ 反馈学习
📁 B. 概念库(更新方法论)
   ↻ 闭环

每个文件夹功能清晰,不混淆

  • A 原料库 = 你日常"吃进去"的东西,不整理,只进不出
  • B 概念库 = Codex 消化后的"知识肌肉",可 query、可调用
  • C Skill 库 = 可复用的方法论,触发即用
  • D 输出库 = 任务产物,反哺 B 的方法论

没有 Codex——这套系统就是 4 个文件夹,你手工整理。有了 Codex——它定期跑 ETL,把 A 消化成 B,从 B 抽取 C

Codex 在知识库里的具体工作

任务 1:消化原料(A → B)

每天/每周 Codex 定时跑:

扫描 A 原料库所有新文件
↓
按主题分类(技术 / 设计 / 商业 / 个人)
↓
每篇提取 3-5 个核心观点
↓
写入 B 概念库,附上原文链接

不是"全文复制"——是结构化抽取。B 概念库里是结构化的知识卡片,不是文章。

任务 2:抽取方法论(B → C)

每月底 Codex 跑:

扫描 B 概念库所有新概念
↓
按"可复用方法"vs"单次案例"分类
↓
可复用方法 → 提取成 Skill 模板
↓
写入 C Skill 库

Skill 不是 prompt 模板——是触发条件 + 操作流程 + 验收标准的完整方法论。

任务 3:按任务生成(D 从 C 调用)

每次你要做任务时:

告诉 Codex:"我要写一篇关于 X 的文章"
↓
Codex 查 C Skill 库:"X 主题的写作 Skill 是什么?"
↓
Codex 查 B 概念库:"X 主题的核心观点、案例、数据有哪些?"
↓
按 Skill 模板 + B 概念 → 生成 D 输出
↓
写入 D 输出库

D 输出库的所有产物都附带"使用了哪些 B 概念 + 触发了哪些 C Skill"——可追溯

关键工程细节

文件夹隔离很重要

A / B / C / D 必须物理隔离——

  • A 不能引用 B 的内容(避免循环)
  • D 不能修改 A(保护原始资料)
  • C 是 Codex 唯一能写入 + 读取的"方法论真理之源"

Obsidian 的 vault 分文件夹 + Codex 通过 MCP 限定文件路径——这是工程基础。

Codex 不是"一个 agent"是"多个角色"

0xShimei 提到:Codex 在知识库里跑 3 个不同 role

  • 消化员(A → B):专注提取结构化观点
  • 方法论提炼员(B → C):专注抽象可复用模式
  • 执行员(C + B → D):专注按 Skill + 概念生成产物

每个 role 调不同的 model

  • 消化员 + 执行员 = Sonnet(成本甜点)
  • 方法论提炼员 = Opus(需要 judgment)

反馈循环

D 输出库不是"扔掉"——产物完成后 Codex 回头评估

  • 这篇用了哪些 Skill
  • 哪个 Skill 在这次用得不对
  • 哪个概念被错误引用

评估结果写回 B 概念库 + C Skill 库——Skill 库会自我迭代

跟传统 Obsidian 笔记的区别

维度传统 Obsidian0xShimei 方案
笔记量越多越乱Codex 自动整理
检索手工搜索Codex 按任务调用
复用凭记忆C Skill 库显式沉淀
输出重新开始D 输出库有完整素材
反馈没反馈Codex 评估 → 更新 Skill

核心区别:传统 Obsidian 是"死的笔记",0xShimei 方案是"活的系统"

适合谁 vs 不适合谁

适合

  • 每天产生大量信息(研究者、咨询、投资、内容创作者)——消化系统是刚需
  • 重复类型任务(每周写报告、每月复盘)——Skill 库的价值最大化
  • 跨项目复用方法论(同一套方法做不同行业)——C Skill 库抽象对
  • 愿意花 10 分钟搭系统——一次性成本,永久受益

不适合

  • 每天任务都是新类型(探索性研究、创意工作)——Skill 库价值有限
  • 信息量小(每周 1-2 篇文章的输入)——overhead 大于收益
  • 不愿意维护——Codex 跑 ETL 需要监督,"扔进去不管"会乱

0xShimei 没说的两件事

1. Codex 在 B/C 写入的"判断错误"很难发现。Codex 提炼的 Skill、写回 B 的概念,有错误时只有用错时才暴露——比如"这个 Skill 适用 X 场景"被错标成"Y 场景",所有按 Y 调用 Skill 的任务都会失败Skill 库越大,错误标签的"爆炸半径"越大需要定期人工 review C Skill 库——这是隐藏的运维成本。

2. A 原料库的"消化优先级"决定知识库质量。Codex 扫 A 提炼 B 时,它不知道哪些原料"重要"——你截图的一张图、你收藏的一篇水文、你精心研读的论文,在 Codex 眼里都是"新文件"结果可能是:次要内容被消化成概念,主要内容被跳过实操需要给 A 文件加 priority 标签(Obsidian frontmatter),Codex 按 priority 决定消化顺序。

结论

0xShimei 的 4 文件夹闭环方案把"知识库"从"收藏夹"变成"消化系统"——这是个人知识管理的范式转移

关键洞察

  • Codex 不是"帮你写",是"帮你消化"——它跑 ETL
  • Skill 库(C)是核心资产——不是 B 概念库
  • 反馈循环让 Skill 库自我迭代——飞轮效应

SOTA Sync 的判断:未来 12 个月,"自生长知识库"会成为 AI 重度用户的标配——Obsidian + Codex/Claude Code 组合会成为个人知识管理的事实标准。Notion / Roam / Logseq 这些传统工具会被冲击——它们没原生支持 agent 跑 ETL。

"消化优先级"是知识库质量的关键变量——垃圾进、垃圾出给原料打 priority 标签是这套方案的工程基础,不是可选项