核心洞察
最热门的编程语言是英语。
@karpathy: "The hottest new programming language is English."
如果你能读这篇文章,你就能创建 agent。
三个基本原则
- 任何人都能创建 AI Agent
- 不需要会写代码
- 每个可想象的 agent 都可以通过 prompting 创建
选择平台
不要在选择工具上浪费时间。 选一个就开始。
推荐平台:
- OpenAI
- Claude Cowork
- Nebula(本文示例平台,专为无技术设置创建 agent 设计)
注意:相同框架适用于任何平台。
步骤 1:创建 Agent Memo
热辣观点:开始构建 agent 之前不要使用任何 AI。
(如果你 prompt AI 已经很舒服,不必遵循。如果不是,这是为了帮你避免日后大量头痛。)
你需要 backwards from goal 工作,agent 才能有效。
Agent Memo 框架
| 问题 | 说明 |
|---|---|
| 目标是什么? | 你想完成什么? |
| 如何知道达成了? | 成功标准是什么? |
| 需要哪些步骤? | 分解为可执行步骤 |
| 需要什么工具? | 哪些工具能帮助完成? |
| Agent 卡壳时怎么办? | 错误处理策略 |
| 交付物是什么? | 最终输出是什么? |
把 agent 当作你即将在项目上合作的人。
如果你是 lead,你可能想带着目标或 banger outcome 的样子出现。如果不这样做,人们会对该做什么或如何推进感到非常困惑。
Agent 也一样。它们不是 mind readers。
这是大多数人构建的 agent 不工作的主要原因。
你会听到:
- "这技术真烂"
- "Agent 需要这么多 babysitting!"
- "它们实际上不能做端到端的工作!"
几个月前这可能是真的。但事情已经指数级改善(字面意义上)。
所以如果 agent 失败了,很可能是技能问题——你没能清楚地向 agent 传达你想要什么。
步骤 2:用 AI 将 Memo 转为 Prompt
重要:此时还不是告诉 AI 创建 agent。
本质是做 vibe check——看看 AI 是否真正理解你在做什么。在构建 agent 之前 refine 和 clarify 不同的事情。
过去:需要写出好的结构化 prompts(XML 格式 + 详细示例)才能做更复杂的事。
现在:大多数 AI 模型非常擅长与你一起推理,理解对自己来说什么是好的 prompt 结构。
所以:让 AI 为你写出 agent 的 prompt。
Nebula 侧记:因为专为构建 agent 设计,它非常擅长自我创建 agent 需要的一切:Goals、Descriptions、Tools 以及成功所需的其他一切。
步骤 3:创建 Agent
目标已清晰设定。Prompt 已准备好。
关键技巧:在聊天框底部粘贴 prompt 并添加:
"Let's do a test run and report what you're doing step by step"
这会清楚地展示你的 agent 如何逐步工作,以及在哪里犯错。
预期:第一次运行时 agent 会遇到问题。
类比:如果你正在培训新员工,他们可能能正确完成 70% 的任务,但错过一些重要的事情。你不会立即解雇他们。这也是大多数人放弃 agent 的地方。
步骤 4:优化 Agent
这部分决定你是否会继续构建 agent。
这也是大多数人忽略的关于 agent 最重要的事情。
当 agent 失败时,很可能是因为 memo/prompt 不够清晰或范围太大。
优化步骤
| 步骤 | 行动 | 目的 |
|---|---|---|
| 1 | 始终从测试运行开始 | 建立基线 |
| 2 | 告诉 agent 每步需要向你报告结果再进入下一步 | 可见性 |
| 3 | 审查结果 | 质量控制 |
| 4 | 如果不正确,展示正确版本应该是什么样 | 明确反馈 |
| 5 | 让 agent 重新运行,看是否学会 | 学习能力测试 |
| 6 | 如果改进了——让 agent 更新 prompt,让它知道以后正确做法 | 知识固化 |
| 7 | 如果没改进——审查 memo/prompt 并重写 | 根本问题修复 |
好消息:
- 如果你花时间写出 memo + 创建结构化 prompt
- 你只需要做几次
- Agent 会达到至少 85%
- 每次迭代都会越来越好
最重要的收获
如果这是你第一次创建 agent,会有一些令人沮丧的部分。
但你需要记住:你是在像指导其他人一样指导它们。
- 花时间给反馈
- 清晰沟通
产品思维直接 transferable——知道好的输出是什么样、理解边界情况、将问题分解为清晰的步骤。
"it kinda works" 和 "it's actually useful" 之间的差距几乎总是取决于你能多精确地描述你想要什么。
关键洞察:Agent 设计的边界
评论区有一条非常有价值的反对意见:
「把 Agent 当新员工」这个类比有个致命漏洞。新员工接到不清楚的任务会说「老板这个我没懂」。Agent 不会。它会自信满满地执行一个它理解错了的版本。
所以你说的「写清楚 memo」治标不治本。问题不是你没说清楚,是你永远没法说清楚所有边界情况。你需要的是给 Agent 一个说「我不确定」的出口。
昨天看到一个推文,四个坑每个坑归根到底都是同一件事:Agent 在边界场景里自信地做了错误的决定,而没有任何机制让它停下来问一句。
memo 写得再好,拦不住模型自己发明枚举值。
这个批评击中了当前大多数 agent 框架的盲区。
资源
- 作者:Nebula (@NebulaAI)
- 原文:https://x.com/NebulaAI/status/2055331215041855664
- 平台:Nebula(专为无技术设置创建 agent 设计)
- 撰稿:@jeffreyando
- 反馈:@wordisbonz, @GGTurbo_