Sutton 的 26 字宣言
强化学习之父 Richard Sutton 今日用 26 个英文单词重申了他著名的「苦涩的教训(The Bitter Lesson)」:
"Don't be distracted by human knowledge, as AI has been historically. Instead focus on methods for creating knowledge that scale with computation, like search and learning."
(不要被人类知识分散注意力,这是AI历史上的常态。相反,要专注于能随算力扩展的创造知识的方法,如搜索和学习。)
这条推文获得 40万+ 浏览、6,300 点赞、2,500 转发,再次点燃了大模型路线辩论。
三方交锋
Gary Marcus:大模型极度依赖人类知识
知名 AI 评论家、认知科学家 Gary Marcus 直接反驳:
当前大模型仍极度依赖人类知识作为主要燃料,甚至已将其编入系统提示词和超 50 种定制工具中。
Marcus 的潜台词:Sutton 的愿景很美好,但当下的工程现实是——没有人类知识,大模型什么都做不了。
Thomas G. Dietterich:研究人类认知不是「分心」
机器学习奠基人 Thomas G. Dietterich 提出异议:
研究人类的抽象认知结构能为 AI 标定盲区,绝不该被视为一种「分心」。
Dietterich 强调的是互补性:人类认知研究不是替代计算扩展,而是为搜索和学习提供方向。
John Fletcher:《甜蜜的教训》——综合视角
The Innovation Game 联合创始人兼首席科学家 John Fletcher 的长文《甜蜜的教训》为这场冲突提供了关键综合:
Sutton 的战略盲区:
- AI 的终局确实是纯算力驱动
- 但在书面语料面临枯竭的当下,通向终局的路径无法绕开人类
产业当前拉开差距的打法:
- 打造顶级协同工具
- 高频捕获专家大脑中从未写下过的「隐性知识(Tacit knowledge)」
- 跳过这一阶段直奔纯环境交互学习,在工程上并不切实际
隐性知识:AI 的下一个燃料来源
什么是隐性知识
| 显性知识 | 隐性知识 |
|---|---|
| 写在文档里的 | 存在于专家大脑中的 |
| 可被搜索引擎索引 | 从未被写下或说出 |
| 静态、结构化 | 动态、情境化 |
| 容易数字化 | 需要交互才能提取 |
估计:人类大脑中 90% 的知识从未被写下。
为什么书面语料正在枯竭
- 互联网公开文本已被大模型训练用尽
- 高质量书面内容的生产速度远低于模型吞噬速度
- 专业领域的深度知识大量存在于专家头脑中,而非论文或文档中
捕获隐性知识的工程路径
Fletcher 指出的产业实践:
- 高频人机协同工具 — 让 AI 在日常工作流中与专家互动
- 实时记录决策过程 — 不只是结果,而是"为什么这样决定"
- 情境化知识提取 — 在特定业务场景中捕获判断逻辑
- 持续学习闭环 — 每次交互都增强模型对领域知识的理解
这与 Lucius 的「让 AI 住进群聊跟着真人学」形成直接呼应。
辩论的核心:终局 vs 路径
| 立场 | 终局判断 | 路径判断 | 代表 |
|---|---|---|---|
| Sutton | 纯算力驱动 | 直接跳过人类知识 | 强化学习之父 |
| Marcus | 人类知识不可或缺 | 当前必须依赖 | 认知科学家 |
| Dietterich | 人机互补 | 研究人类认知提供方向 | ML奠基人 |
| Fletcher | 纯算力终局 | 隐性知识是必经阶梯 | Innovation Game |
关键洞察:
Sutton 和 Fletcher 可能在终局上是一致的——都相信算力扩展是终极答案。分歧在于路径:
- Sutton 认为人类知识是干扰,应该直接抛弃
- Fletcher 认为在书面语料枯竭的现实下,隐性知识是通往终局的桥梁
产业映射
这场辩论与当前产业实践高度相关:
| 公司/产品 | 路径选择 | 与辩论的对应 |
|---|---|---|
| Lucius | 群聊中捕获隐性知识 | Fletcher 路径的工程化 |
| Claude | 强调人机协作、Artifacts | 介于 Marcus 和 Fletcher 之间 |
| OpenAI | 追求纯自监督+RL | 更接近 Sutton 的纯算力路线 |
| Sierra/Harvey | 垂直领域专家知识注入 | Marcus 路线的商业实践 |
结论
Sutton 的「苦涩的教训」在终极意义上可能是对的——AI 终将找到不依赖人类知识的方法。但在工程现实中:
- 书面语料正在枯竭,纯自监督学习的收益递减
- 隐性知识是未被开发的巨大资源,存在于数十亿专业从业者的大脑中
- 捕获隐性知识需要人机协同工具,这正是当前产业创新的热点
- 这不是对 Sutton 的反驳,而是通往他终局的阶梯
正如 Fletcher 所言:跳过隐性知识捕获阶段直奔纯环境交互学习,在工程上并不切实际。产业当前拉开差距的打法,是先让 AI 学会与人类专家共舞,再从共舞中学习飞翔。