AI 工程师学习路径：基于 2000 份真实职位描述的务实路线图

这是基于 ~2000 份真实职位描述整理的实用学习路径，按顺序排列，映射真实生产系统的构建方式。

核心误解

AI 工程不是从零训练模型。是围绕 LLM 构建系统。

1. LLM 基础

从这儿开始。所有东西都建立在此之上。

LLM 如何工作（高层理解）
擅长什么 vs 失败在哪里
使用 OpenAI / Anthropic 等 API
结构化输出（JSON、schema、工具调用响应）
不同任务场景的 Prompt 工程

目标： 从"和模型聊天"到可预测地控制模型

2. RAG（检索增强生成）

大多数真实世界 AI 系统的支柱。

把自定义数据注入 LLM
向量搜索 + 语义检索
Elasticsearch、Qdrant 等工具
分块策略（这比人们认为的重要得多）
处理真实数据：PDF、网页、转录

练习项目： FAQ 助手 / 文档问答系统 / 内部知识搜索

3. AI Agent

这里开始变得有趣——也混乱。

工具调用（能行动的 LLM，不只是响应）
Agent 循环：think → act → observe → repeat
框架：LangChain、PydanticAI、OpenAI Agents SDK、Google ADK
MCP（Model Context Protocol）
多 Agent 系统（路由、协调、管道）

练习项目： 网络研究 Agent / 数据提取管道 / 多 Agent 工作流

4. 测试 AI 系统

被低估但关键。

测试工具使用和输出
评估一致性
用 LLM 做裁判（元但有用）

目标： 让 AI 系统可靠，而不只是亮眼

5. 监控与可观测性

看不到系统在做什么，就没法修复。

追踪 Agent 工作流
记录交互
成本追踪
反馈循环
仪表盘（Grafana、OpenTelemetry）

真实影响： 这是区分 Demo 和生产系统的关键

6. 评估

大多数工程师跳过这个——结果很明显。

离线评估数据集
衡量检索质量
合成数据生成
基于结果的 Prompt 优化

目标： 从"感觉不错"到"可衡量"

7. 生产系统

这里是 AI 工程师变得有价值的地方。

从 notebook 到真实服务
部署（Streamlit 适合快速原型）
云平台：AWS / GCP / Azure
Guardrails 和安全层
规模化并行处理

基础技能

Python 和工程基础

Python（80%+ 职位用到）
测试、CI/CD、代码质量
Git 工作流

Web 开发（做真实产品）

FastAPI（AI 应用后端标准）
React / Next.js（前端层）
REST / GraphQL API

云和基础设施

AWS / GCP / Azure 至少一个
Docker（不可或缺）
Kubernetes（规模化）
Terraform（基础设施即代码）

数据库

PostgreSQL（默认选择）
向量库：Pinecone、Weaviate、Qdrant、pgvector
Redis（缓存、会话）

ML 基础（够用就行） 不需要成为研究员，但需要上下文。

PyTorch 基础
Embedding（非常重要）
微调（API 不够用时）
模型评估基础

数据工程

ETL 管道
Airflow、Spark、Kafka
Databricks、Snowflake

Python 以外的语言

TypeScript（对全栈 AI 非常重要）
SQL（真实数据工作的必备）
Java / Go（后端密集型职位）

现代 AI 系统技术栈

通常长这样：

前端：React / Next.js
后端：FastAPI
AI 编排：LangChain、LangGraph、PydanticAI
LLM：OpenAI、Anthropic、Groq、本地模型
向量库：Pinecone / Weaviate / Qdrant
基础设施：Docker + Kubernetes + 云
监控：OpenTelemetry、Grafana
评估：LLM 裁判、Evidently 等工具

优先级

必备： Python / Prompt 工程 / RAG 系统 / 一个云平台 / Docker

高价值： LangChain 或 PydanticAI / FastAPI / TypeScript / CI/CD / Kubernetes / PyTorch 基础

差异化（更快被录用）： Agent 框架（LangGraph、CrewAI）/ 微调模型 / 评估系统 / 向量数据库 / 多 Agent 架构

最终结论

AI 工程不是追逐炒作工具。是围绕 LLM 构建可靠系统，LLM 只是其中一个组件。

聚焦：

RAG
Agent
评估
生产系统

做到这些，已经领先大多数候选人了。