返回 FEED
AGENT2026-05-19

Sutton重申「苦涩的教训」:捕获隐性知识是AI演进的必经阶梯

Sutton 的 26 字宣言

强化学习之父 Richard Sutton 今日用 26 个英文单词重申了他著名的「苦涩的教训(The Bitter Lesson)」:

"Don't be distracted by human knowledge, as AI has been historically. Instead focus on methods for creating knowledge that scale with computation, like search and learning."

(不要被人类知识分散注意力,这是AI历史上的常态。相反,要专注于能随算力扩展的创造知识的方法,如搜索和学习。)

这条推文获得 40万+ 浏览、6,300 点赞、2,500 转发,再次点燃了大模型路线辩论。

三方交锋

Gary Marcus:大模型极度依赖人类知识

知名 AI 评论家、认知科学家 Gary Marcus 直接反驳:

当前大模型仍极度依赖人类知识作为主要燃料,甚至已将其编入系统提示词和超 50 种定制工具中。

Marcus 的潜台词:Sutton 的愿景很美好,但当下的工程现实是——没有人类知识,大模型什么都做不了。

Thomas G. Dietterich:研究人类认知不是「分心」

机器学习奠基人 Thomas G. Dietterich 提出异议:

研究人类的抽象认知结构能为 AI 标定盲区,绝不该被视为一种「分心」。

Dietterich 强调的是互补性:人类认知研究不是替代计算扩展,而是为搜索和学习提供方向。

John Fletcher:《甜蜜的教训》——综合视角

The Innovation Game 联合创始人兼首席科学家 John Fletcher 的长文《甜蜜的教训》为这场冲突提供了关键综合:

Sutton 的战略盲区:

  • AI 的终局确实是纯算力驱动
  • 但在书面语料面临枯竭的当下,通向终局的路径无法绕开人类

产业当前拉开差距的打法:

  • 打造顶级协同工具
  • 高频捕获专家大脑中从未写下过的「隐性知识(Tacit knowledge)」
  • 跳过这一阶段直奔纯环境交互学习,在工程上并不切实际

隐性知识:AI 的下一个燃料来源

什么是隐性知识

显性知识隐性知识
写在文档里的存在于专家大脑中的
可被搜索引擎索引从未被写下或说出
静态、结构化动态、情境化
容易数字化需要交互才能提取

估计:人类大脑中 90% 的知识从未被写下。

为什么书面语料正在枯竭

  • 互联网公开文本已被大模型训练用尽
  • 高质量书面内容的生产速度远低于模型吞噬速度
  • 专业领域的深度知识大量存在于专家头脑中,而非论文或文档中

捕获隐性知识的工程路径

Fletcher 指出的产业实践:

  1. 高频人机协同工具 — 让 AI 在日常工作流中与专家互动
  2. 实时记录决策过程 — 不只是结果,而是"为什么这样决定"
  3. 情境化知识提取 — 在特定业务场景中捕获判断逻辑
  4. 持续学习闭环 — 每次交互都增强模型对领域知识的理解

这与 Lucius 的「让 AI 住进群聊跟着真人学」形成直接呼应。

辩论的核心:终局 vs 路径

立场终局判断路径判断代表
Sutton纯算力驱动直接跳过人类知识强化学习之父
Marcus人类知识不可或缺当前必须依赖认知科学家
Dietterich人机互补研究人类认知提供方向ML奠基人
Fletcher纯算力终局隐性知识是必经阶梯Innovation Game

关键洞察:

Sutton 和 Fletcher 可能在终局上是一致的——都相信算力扩展是终极答案。分歧在于路径

  • Sutton 认为人类知识是干扰,应该直接抛弃
  • Fletcher 认为在书面语料枯竭的现实下,隐性知识是通往终局的桥梁

产业映射

这场辩论与当前产业实践高度相关:

公司/产品路径选择与辩论的对应
Lucius群聊中捕获隐性知识Fletcher 路径的工程化
Claude强调人机协作、Artifacts介于 Marcus 和 Fletcher 之间
OpenAI追求纯自监督+RL更接近 Sutton 的纯算力路线
Sierra/Harvey垂直领域专家知识注入Marcus 路线的商业实践

结论

Sutton 的「苦涩的教训」在终极意义上可能是对的——AI 终将找到不依赖人类知识的方法。但在工程现实中:

  1. 书面语料正在枯竭,纯自监督学习的收益递减
  2. 隐性知识是未被开发的巨大资源,存在于数十亿专业从业者的大脑中
  3. 捕获隐性知识需要人机协同工具,这正是当前产业创新的热点
  4. 这不是对 Sutton 的反驳,而是通往他终局的阶梯

正如 Fletcher 所言:跳过隐性知识捕获阶段直奔纯环境交互学习,在工程上并不切实际。产业当前拉开差距的打法,是先让 AI 学会与人类专家共舞,再从共舞中学习飞翔


来源: Richard Sutton on X