这是基于 ~2000 份真实职位描述整理的实用学习路径,按顺序排列,映射真实生产系统的构建方式。
核心误解
AI 工程不是从零训练模型。是围绕 LLM 构建系统。
1. LLM 基础
从这儿开始。所有东西都建立在此之上。
- LLM 如何工作(高层理解)
- 擅长什么 vs 失败在哪里
- 使用 OpenAI / Anthropic 等 API
- 结构化输出(JSON、schema、工具调用响应)
- 不同任务场景的 Prompt 工程
目标: 从"和模型聊天"到可预测地控制模型
2. RAG(检索增强生成)
大多数真实世界 AI 系统的支柱。
- 把自定义数据注入 LLM
- 向量搜索 + 语义检索
- Elasticsearch、Qdrant 等工具
- 分块策略(这比人们认为的重要得多)
- 处理真实数据:PDF、网页、转录
练习项目: FAQ 助手 / 文档问答系统 / 内部知识搜索
3. AI Agent
这里开始变得有趣——也混乱。
- 工具调用(能行动的 LLM,不只是响应)
- Agent 循环:think → act → observe → repeat
- 框架:LangChain、PydanticAI、OpenAI Agents SDK、Google ADK
- MCP(Model Context Protocol)
- 多 Agent 系统(路由、协调、管道)
练习项目: 网络研究 Agent / 数据提取管道 / 多 Agent 工作流
4. 测试 AI 系统
被低估但关键。
- 测试工具使用和输出
- 评估一致性
- 用 LLM 做裁判(元但有用)
目标: 让 AI 系统可靠,而不只是亮眼
5. 监控与可观测性
看不到系统在做什么,就没法修复。
- 追踪 Agent 工作流
- 记录交互
- 成本追踪
- 反馈循环
- 仪表盘(Grafana、OpenTelemetry)
真实影响: 这是区分 Demo 和生产系统的关键
6. 评估
大多数工程师跳过这个——结果很明显。
- 离线评估数据集
- 衡量检索质量
- 合成数据生成
- 基于结果的 Prompt 优化
目标: 从"感觉不错"到"可衡量"
7. 生产系统
这里是 AI 工程师变得有价值的地方。
- 从 notebook 到真实服务
- 部署(Streamlit 适合快速原型)
- 云平台:AWS / GCP / Azure
- Guardrails 和安全层
- 规模化并行处理
基础技能
Python 和工程基础
- Python(80%+ 职位用到)
- 测试、CI/CD、代码质量
- Git 工作流
Web 开发(做真实产品)
- FastAPI(AI 应用后端标准)
- React / Next.js(前端层)
- REST / GraphQL API
云和基础设施
- AWS / GCP / Azure 至少一个
- Docker(不可或缺)
- Kubernetes(规模化)
- Terraform(基础设施即代码)
数据库
- PostgreSQL(默认选择)
- 向量库:Pinecone、Weaviate、Qdrant、pgvector
- Redis(缓存、会话)
ML 基础(够用就行) 不需要成为研究员,但需要上下文。
- PyTorch 基础
- Embedding(非常重要)
- 微调(API 不够用时)
- 模型评估基础
数据工程
- ETL 管道
- Airflow、Spark、Kafka
- Databricks、Snowflake
Python 以外的语言
- TypeScript(对全栈 AI 非常重要)
- SQL(真实数据工作的必备)
- Java / Go(后端密集型职位)
现代 AI 系统技术栈
通常长这样:
- 前端:React / Next.js
- 后端:FastAPI
- AI 编排:LangChain、LangGraph、PydanticAI
- LLM:OpenAI、Anthropic、Groq、本地模型
- 向量库:Pinecone / Weaviate / Qdrant
- 基础设施:Docker + Kubernetes + 云
- 监控:OpenTelemetry、Grafana
- 评估:LLM 裁判、Evidently 等工具
优先级
必备: Python / Prompt 工程 / RAG 系统 / 一个云平台 / Docker
高价值: LangChain 或 PydanticAI / FastAPI / TypeScript / CI/CD / Kubernetes / PyTorch 基础
差异化(更快被录用): Agent 框架(LangGraph、CrewAI)/ 微调模型 / 评估系统 / 向量数据库 / 多 Agent 架构
最终结论
AI 工程不是追逐炒作工具。是围绕 LLM 构建可靠系统,LLM 只是其中一个组件。
聚焦:
- RAG
- Agent
- 评估
- 生产系统
做到这些,已经领先大多数候选人了。