← 返回 FEED
AGENT2026-05-10

Garry Tan 的 AI 第二大脑:从聊天窗口到操作系统

从 CEO 到 Builder:为什么一个管理数千创业者的人会在凌晨 2 点写代码

Garry Tan 的身份是 Y Combinator 的 CEO,每年帮助数千名创业者创建真实的、快速增长的初创公司。但在过去 5 个月里,他重新成为了一个 builder。

不是玩具项目,而是"复利系统"——那些每次使用都会变得更好的系统。他想展示的是:当你停止把 AI 当作聊天窗口,开始把它当作操作系统时,个人 AI 真正的样子。

书籍镜像(Book Mirror):AI 如何真正理解一本书对你的意义

Garry 最近在读 Pema Chödrön 的《When Things Fall Apart》——一本关于佛教视角下痛苦、无根基感和放手的 162 页书。

他让 AI 做了一个"书籍镜像":

  • 提取全书 22 章
  • 每章运行子 Agent,同时做两件事:总结作者观点 + 映射到 Garry 的实际生活
  • 不是泛泛的"这适用于领导者",而是具体到他的家庭历史(移民父母、香港和新加坡的父亲、缅甸的母亲)、职业背景(运营 YC、构建开源工具、指导数千创始人)、深夜思考、甚至与心理治疗师的工作内容

输出:3 万字的"大脑页面",每章双栏呈现——左边是 Pema 说什么,右边是这如何映射到 Garry 正在经历的生活。

"关于无根基感的章节,关联到了我一周前与某位创始人的特定对话。关于恐惧的章节,映射到了心理治疗师识别的模式。关于放手的章节,引用了一个深夜 session,我在那里写下了今年发现的创作自由。"

整个过程约 40 分钟。Garry 指出:一个每小时收费 300 美元的治疗师,即使读这本书并应用到他的生活中,40 小时也做不到这一点——因为他们没有他的职业背景图谱、阅读历史、会议记录和创始人关系的完整交叉引用。

他已经对 20 多本书做了这个处理,每本都因为"大脑"变得更丰富而效果更好。

迭代质量:从错误中学习,把修复写入系统

第一版书籍镜像很糟糕:

  • 说他的父母离婚了(实际没有)
  • 说他在香港长大(实际出生在加拿大)

这些基础错误如果分享出去会损害信任。所以他增加了一个强制事实核查步骤——每本镜像在发布前都要针对大脑中的已知事实运行跨模型评估。

然后他升级到 GBrain 工具使用的深度检索:

  • 原版擅长综合但缺乏特异性
  • V3 版本做逐节大脑搜索
  • 每个右栏条目都引用实际的大脑页面
  • 当书谈到"困难对话"时,不是综合一般原则,而是从他的实际会议记录中拉出特定创始人与联合创始人之间的艰难对话

这就是 skillification(使用 /skillify)的实践:从第一次手动尝试中提取可重复模式,编写带触发器和边缘情况的测试技能文件,每次修复都会复利到所有未来的书籍镜像。

元技能的递归:技能创造技能

最大的洞察在这里递归地出现:

运行他生活的系统不是作为单体存在的。它是从技能组装而来的。而这些技能本身是由一个技能创造的。

Skillify 是一个元技能,创造新技能。当 Garry 遇到要重复的工作流时,他说"skillify this",系统检查刚刚发生的事情,提取可重复模式,编写带触发器和边缘情况的测试技能文件,并在解析器中注册。

  • 书籍镜像管道从第一次手动操作就被 skillified
  • 会议准备工作流在被注意到每次通话前都做相同步骤后被 skillified

技能组合:书籍镜像调用 brain-ops 存储、enrich 获取上下文、cross-modal-eval 质量保证、pdf-generation 输出。每个技能专注于一件事,它们链在一起创建复杂工作流。改进一个技能,每个使用它的工作流都会自动变得更好。

会议准备的真正含义:不只是更好的 Google 搜索

Demis Hassabis 来 YC 做炉边谈话时,Sebastian Mallaby 的传记刚出版。

Garry 让系统准备他。不到两分钟,系统拉出:

  • Demis 的完整大脑页面(数月积累的文章、播客转录、个人笔记)
  • 他对 AGI 时间线的公开信念("50% 扩展,50% 创新",认为 AGI 还有 5-10 年)
  • Mallaby 传记亮点
  • 他的研究优先级(持续学习、世界模型、长期记忆)
  • 与 Garry 公开谈论 AI 的内容的交叉引用
  • 三个展示大脑多跳推理能力的演示脚本
  • 基于世界观重叠和分歧的对话切入点

这不是更好的 Google 搜索。这是利用积累的对 Demis 的上下文、Garry 自己的立场,以及对话的战略目标来做的准备。系统准备的不只是事实,而是角度

知识基础设施:10 万页的结构化知识

Garry 维护着约 10 万页的结构化知识库:

  • 每个人:时间线、状态部分(当前真实情况)、开放线索、评分
  • 每次会议:转录、结构化摘要、实体传播(会后遍历提到的每个人和公司,用讨论内容更新他们的大脑页面)
  • 每本书:逐章镜像
  • 每篇文章、播客、视频:摄入、标记、交叉引用

页面结构

  • 顶部:编译真相(当前最佳理解)
  • 下方:仅追加的时间线(按时间顺序的事件)
  • 侧面:源材料的原始数据附件

把它想象成个人 Wikipedia,每个页面都由参加了会议、读了邮件、看了演讲、消化了 PDF 的 AI 持续更新。

复利示例:在 office hours 见一位创始人。系统创建/更新人物页面、公司页面、交叉引用会议记录、检查是否见过面(并调出上次讨论内容)、检查申请数据、拉取最新指标、识别是否有投资组合公司或联系人与其问题相关。下次见面时,系统已准备好完整的上下文包。

这是文件柜和神经系统的区别。文件柜存储东西。神经系统连接它们,标记变化,并浮现与当下相关的内容。

架构哲学:Fat Skills, Fat Code, Thin Harness

Harness 很薄:OpenClaw 作为运行时。接收消息,找出适用哪个技能,分派。几千行的路由逻辑。它不知道书、会议或创始人。它只是路由。

Skills 很厚:现在超过 100 个,每个都是一个独立的 markdown 文件,包含一个特定任务的详细指令。已展示的书籍镜像和会议准备之外,还有:

  • meeting-ingestion:每次会议后拉取转录,创建结构化摘要,然后遍历提到的每个人和公司,用讨论内容更新他们的大脑页面。会议页面不是最终产品,实体传播回每个人和公司页面才是真正的价值。
  • enrich:给一个人名,从五个不同来源拉取,合并成单个大脑页面,包含职业轨迹、联系信息、会议历史、关系上下文。每个声明都有引用来源。
  • media-ingest:处理视频、音频、PDF、截图、GitHub 仓库。转录、提取实体、归档到正确的大脑位置。YouTube 视频、播客、语音备忘录的常用工具。
  • perplexity-research:大脑增强的网络研究。通过 Perplexity 搜索网络,但在综合前检查大脑已知道什么,告诉你什么是真正新的 vs 已经捕获的。

还有更多:email-triage、investor-update-ingest(检测邮件中的投资组合更新并提取指标到公司页面)、calendar-check(冲突检测和旅行不可能性检测)、新闻研究栈等。

每个技能编码了运营知识,新员工助理需要数月才能学会。当有人问 Garry 如何"提示"他的 AI 时,答案是:我不提示。Skills 就是提示。

数据、代码、模型的角色

数据很厚:大脑仓库中 10 万页结构化知识。每个人、公司、会议、书、文章、想法,全部链接、可搜索、每天都在增长。

代码很厚:喂养它的代码(转录、OCR、社交媒体归档、日历同步、API 集成脚本)也很重要,但数据是复利价值所在。每天运行 100 多个 cron 检查所有内容:社交媒体、Slack、邮件,OpenClaw/Hermes Agents 也为他关注这些内容。

模型可互换

  • Opus 4.7 1M 用于精确性
  • GPT-5.5 用于回忆和穷尽提取
  • DeepSeek V4-Pro 用于创意工作和第三视角
  • Groq with Llama 用于速度

技能决定哪个模型用于哪个任务。Harness 不关心。当有人问"哪个 AI 模型最好"时,答案是:错误的问题。模型只是引擎。其他一切都是车。

复利思维:不是生产力,是复利

人们问 Garry 关于生产力。他不这么想。他想的是复利

  • 每次会议都增加大脑
  • 每本书都丰富下一本书的上下文
  • 每个技能都让下一个工作流更快
  • 每个人物页面更新都让下一次会议准备更锐利

系统今天比两个月前好 10 倍,两个月后又会好 10 倍。

凌晨 2 点还在编码(他经常如此,因为 AI 给了他回归构建的快乐),他不只是在写软件。他在添加到一个每小时都变得更好的系统。100 个 cron 作业 24/7 运行。会议摄入自动运行。邮件分类每 10 分钟运行。知识图谱从每次对话中自我丰富。系统处理每日转录并提取他实时错过的模式。

这不是写作工具。不是搜索引擎。不是聊天机器人。这是一个真正工作的第二大脑——不是作为比喻,而是作为运行系统:10 万页、100+ 技能、15 个 cron 作业,以及过去一年中每次职业关系、会议、书和想法的积累上下文。

如何构建:从做一件事开始

Garry 开源了整个栈。

核心论点:未来属于构建复利 AI 系统的个人,不属于使用企业拥有的中心化 AI 工具的个人。区别是记日记和拥有神经系统的区别。

如果你想构建这个

  1. 选一个 harness。OpenClaw 或 Hermes,或从头构建。保持薄。Harness 只是路由器。在家用 Tailscale 托管,或用 Render/Railway。
  2. 从 brain 开始。GBrain 是知识基础设施,97.6% 的 LongMemEval 召回率,击败 MemPalace。附带 39 个可安装技能,一个命令安装。Git 仓库,每个人、会议、文章、想法都有一个页面。
  3. 做有趣的事。不要从规划技能架构开始。从做一件事开始。写报告。研究一个人。下载一季 NBA 比分并构建体育投注预测模型。分析你的投资组合。用 Agent 做,迭代到好,然后运行 Skillify 提取模式为可重用技能。运行 check_resolvable 验证新技能已接入解析器。这个循环把一次性工作变成复利基础设施。
  4. 持续使用并查看输出。技能一开始会很平庸。这就是重点。使用它,阅读它产生的内容,当有问题时,运行跨模型评估:把输出发送给多个模型,让它们在你关心的维度上互相评分。这就是 Garry 如何发现书籍镜像中的事实错误。修复被烘焙进技能,此后每个镜像都是干净的。六个月后,你会拥有聊天机器人无法复制的东西,因为价值不在模型中,而在你教给系统的关于你特定生活、工作和判断的东西。

第一个构建的东西很糟糕。第一百个是你愿意托付日历、收件箱、会议准备和阅读列表的东西。系统在学习。你在学习。复利曲线是真实的。

Fat skills. Fat code. Thin harness. LLM 本身只是引擎。你可以构建自己的车。