AI Agent 领域又迎来一份重量级参考资料。IBM 研究员 Haggai Roitman 在 arXiv 上发布了《The Hitchhiker's Guide to Agentic AI: From Foundations to Systems》——一本面向实践者的 Agentic AI 全栈参考书。
核心定位
这本书的核心理念是:构建优秀的 Agentic 系统需要理解 pipeline 的每一层,而不是只掌握某一层。
它不是又一本讲 Prompt Engineering 的入门书,而是一本从第一性原理出发、覆盖从底层模型到生产部署的完整技术栈的 practitioner 指南。
内容结构
全书分为三大部分:
第一部分:LLM 基础层
把 Transformer 架构、GPU 系统、训练与微调(SFT、LoRA、MoE)、模型压缩和推理优化作为"必要基础"来讲,而不是 primary focus。作者认为,不懂这些底层机制的 Agent 开发者,就像不懂引擎原理的赛车手。
第二部分:对齐与推理
深入讲解 RLHF、PPO、DPO 及其变体、GRPO、奖励建模,以及面向大推理模型的强化学习——包括 Chain-of-Thought 和 Test-time Scaling。这部分回答了"如何让模型不仅生成文本,还能可靠推理"的问题。
第三部分:Agentic AI 核心
这是全书的主体,涵盖:
Agentic 训练与轨迹强化学习:如何让 Agent 从交互经验中学习,而不是只靠静态数据。
RAG 与 Agentic RAG:从基础检索增强到 Agent 主动决策何时检索、检索什么。
记忆系统:上下文记忆、外部记忆、情景记忆、语义记忆的分层设计——解决 Agent "健忘"的核心问题。
Agent Harness 与上下文管理:如何设计 Agent 的"缰绳",既给它足够自主权,又不让它失控。
Agent 设计模式分类学:系统性地梳理了各种 Agent 架构模式。
Agent 间协调:深度覆盖 MCP(Model Context Protocol)、Agent Skills 与工具使用、A2A(Agent-to-Agent)通信协议,以及多 Agent 架构——中心化、去中心化和层级拓扑。
开发框架与生产部署:从 Agent 开发框架选型到 Agentic UI 设计,再到 Agentic 任务的评估方法论和生产环境部署策略。
独特价值
每章都配有三样东西:严格的理论基础、实现指导、主要文献引用。这让本书既适合想深入理解原理的研究者,也适合需要落地实现的工程师。
在 Agentic AI 知识碎片化的当下,这本书试图做一件事:建立一套纵向打通的知识框架。从 "Transformer 怎么工作" 到 "多 Agent 怎么协调" 到 "怎么部署到生产",一条线串到底。
背景信息
- 作者:Haggai Roitman(IBM 研究员)
- 发布日期:2026 年 6 月 22 日
- 篇幅:5,525 KB(约 5000+ 页)
- 学科分类:cs.AI、cs.CL、cs.IR、cs.LG
这本书目前只有 arXiv 预印本,但已经引起社区广泛关注。对于正在构建 Agent 系统的团队来说,它可能成为未来一段时间内的标准参考手册。