返回 FEED
AGENT2026-06-27

《Agentic AI 漫游指南》:从 Transformer 到多 Agent 系统的全栈手册

AI Agent 领域又迎来一份重量级参考资料。IBM 研究员 Haggai Roitman 在 arXiv 上发布了《The Hitchhiker's Guide to Agentic AI: From Foundations to Systems》——一本面向实践者的 Agentic AI 全栈参考书。

核心定位

这本书的核心理念是:构建优秀的 Agentic 系统需要理解 pipeline 的每一层,而不是只掌握某一层。

它不是又一本讲 Prompt Engineering 的入门书,而是一本从第一性原理出发、覆盖从底层模型到生产部署的完整技术栈的 practitioner 指南。

内容结构

全书分为三大部分:

第一部分:LLM 基础层

把 Transformer 架构、GPU 系统、训练与微调(SFT、LoRA、MoE)、模型压缩和推理优化作为"必要基础"来讲,而不是 primary focus。作者认为,不懂这些底层机制的 Agent 开发者,就像不懂引擎原理的赛车手。

第二部分:对齐与推理

深入讲解 RLHF、PPO、DPO 及其变体、GRPO、奖励建模,以及面向大推理模型的强化学习——包括 Chain-of-Thought 和 Test-time Scaling。这部分回答了"如何让模型不仅生成文本,还能可靠推理"的问题。

第三部分:Agentic AI 核心

这是全书的主体,涵盖:

Agentic 训练与轨迹强化学习:如何让 Agent 从交互经验中学习,而不是只靠静态数据。

RAG 与 Agentic RAG:从基础检索增强到 Agent 主动决策何时检索、检索什么。

记忆系统:上下文记忆、外部记忆、情景记忆、语义记忆的分层设计——解决 Agent "健忘"的核心问题。

Agent Harness 与上下文管理:如何设计 Agent 的"缰绳",既给它足够自主权,又不让它失控。

Agent 设计模式分类学:系统性地梳理了各种 Agent 架构模式。

Agent 间协调:深度覆盖 MCP(Model Context Protocol)、Agent Skills 与工具使用、A2A(Agent-to-Agent)通信协议,以及多 Agent 架构——中心化、去中心化和层级拓扑。

开发框架与生产部署:从 Agent 开发框架选型到 Agentic UI 设计,再到 Agentic 任务的评估方法论和生产环境部署策略。

独特价值

每章都配有三样东西:严格的理论基础实现指导主要文献引用。这让本书既适合想深入理解原理的研究者,也适合需要落地实现的工程师。

在 Agentic AI 知识碎片化的当下,这本书试图做一件事:建立一套纵向打通的知识框架。从 "Transformer 怎么工作" 到 "多 Agent 怎么协调" 到 "怎么部署到生产",一条线串到底。

背景信息

  • 作者:Haggai Roitman(IBM 研究员)
  • 发布日期:2026 年 6 月 22 日
  • 篇幅:5,525 KB(约 5000+ 页)
  • 学科分类:cs.AI、cs.CL、cs.IR、cs.LG

这本书目前只有 arXiv 预印本,但已经引起社区广泛关注。对于正在构建 Agent 系统的团队来说,它可能成为未来一段时间内的标准参考手册。