《Agentic AI 漫游指南》：从 Transformer 到多 Agent 系统的全栈手册

AI Agent 领域又迎来一份重量级参考资料。IBM 研究员 Haggai Roitman 在 arXiv 上发布了《The Hitchhiker's Guide to Agentic AI: From Foundations to Systems》——一本面向实践者的 Agentic AI 全栈参考书。

核心定位

这本书的核心理念是：构建优秀的 Agentic 系统需要理解 pipeline 的每一层，而不是只掌握某一层。

它不是又一本讲 Prompt Engineering 的入门书，而是一本从第一性原理出发、覆盖从底层模型到生产部署的完整技术栈的 practitioner 指南。

内容结构

全书分为三大部分：

第一部分：LLM 基础层

把 Transformer 架构、GPU 系统、训练与微调（SFT、LoRA、MoE）、模型压缩和推理优化作为"必要基础"来讲，而不是 primary focus。作者认为，不懂这些底层机制的 Agent 开发者，就像不懂引擎原理的赛车手。

第二部分：对齐与推理

深入讲解 RLHF、PPO、DPO 及其变体、GRPO、奖励建模，以及面向大推理模型的强化学习——包括 Chain-of-Thought 和 Test-time Scaling。这部分回答了"如何让模型不仅生成文本，还能可靠推理"的问题。

第三部分：Agentic AI 核心

这是全书的主体，涵盖：

Agentic 训练与轨迹强化学习：如何让 Agent 从交互经验中学习，而不是只靠静态数据。

RAG 与 Agentic RAG：从基础检索增强到 Agent 主动决策何时检索、检索什么。

记忆系统：上下文记忆、外部记忆、情景记忆、语义记忆的分层设计——解决 Agent "健忘"的核心问题。

Agent Harness 与上下文管理：如何设计 Agent 的"缰绳"，既给它足够自主权，又不让它失控。

Agent 设计模式分类学：系统性地梳理了各种 Agent 架构模式。

Agent 间协调：深度覆盖 MCP（Model Context Protocol）、Agent Skills 与工具使用、A2A（Agent-to-Agent）通信协议，以及多 Agent 架构——中心化、去中心化和层级拓扑。

开发框架与生产部署：从 Agent 开发框架选型到 Agentic UI 设计，再到 Agentic 任务的评估方法论和生产环境部署策略。

独特价值

每章都配有三样东西：严格的理论基础、实现指导、主要文献引用。这让本书既适合想深入理解原理的研究者，也适合需要落地实现的工程师。

在 Agentic AI 知识碎片化的当下，这本书试图做一件事：建立一套纵向打通的知识框架。从 "Transformer 怎么工作" 到 "多 Agent 怎么协调" 到 "怎么部署到生产"，一条线串到底。

背景信息

作者：Haggai Roitman（IBM 研究员）
发布日期：2026 年 6 月 22 日
篇幅：5,525 KB（约 5000+ 页）
学科分类：cs.AI、cs.CL、cs.IR、cs.LG

这本书目前只有 arXiv 预印本，但已经引起社区广泛关注。对于正在构建 Agent 系统的团队来说，它可能成为未来一段时间内的标准参考手册。