三年 Agent 演进复盘

Magic Patterns 2023 年 10 月首发，3 年后是 3,000+ 产品团队和企业在用的设计和原型工具。第一版是一次 LLM call 调 OpenAI GPT 3.5，今天是正经的 agentic loop——tools、self-healing、context management。

第一版：单 LLM call 重写一个 index.tsx

最大问题是 4k token 限制。没有 chat、全视觉、UI 组件单文件设计。这是入局太早的诅咒。

当时怎么 work：post-processing pipeline + AST parser

修 missing imports
修 invalid icon imports（每个 Lucide icon 名 hardcode 一份）
标准化 component name
修 string

全 deterministic。那个 post-processing 至今还在跑。

上瘾用户 → 上瘾 slack alert

2023 年 error rate 极高。把每个 prompt 跑 4 次高温，并排渲染（v0 也这么干）。设计上限约 800 行代码——单文件最大尺寸。

2023 年最该多想的是"如果模型变好会怎样"。在 band-aid 解决方案上浪费了 6 个月——硬塞小 React 组件——而不是准备未来。有意思的是这些 band-aid 至今还在用。

多文件：从冰箱白板到 Fast-Apply

2024 年初 Teddy 在他家厨房第一次聊"AI 一次输出多文件"的 idea。他把冰箱上 grocery list 的白板擦干净，写："TODO: Multi files."

当时多文件听起来不可能——AI 需记住自己在处理哪些文件、把它们缝起来。

实验用 Pinecone 把 examples 喂给 LLM 增强 prompt，也试过喂相关文件。但没什么用。

Infinite Canvas：把应用层弯去 meet 用户

2024 年 9 月发了 infinite canvas——prompt 任何设计、reference 已有的、链接屏幕做 prototype、realtime、chat 更新、从互联网 import 设计、interactive。

canvas 干了什么：

同时看多个 "chats"，链接起来——因为每个 chat（文件）只能这么大
点每个 chat 引用它，把 context 塞进你的 prompt

Multi-file 真正突破：Fast-Apply 模型

来自 Morph。当时 Cursor 在变火，大家在聊它编辑和 diff 文件的能力。Fast-Apply 让设计能大得多。

但即使有 Fast Apply，用户也总是找新限制。他们真在"找"那个限制，因为限制是啥我们自己也不知道直到放出来给世界。回头看，这是 serious PMF 的信号。

主要问题

文件不能超过 ~1000 行，文件数变多质量下降
10+ 个文件时 agent 找不对文件、改不好、不懂 logic

"Agent" 这个词是怎么火起来的

Claude Code release 的时候。

回想 "application layer" 和 Claude Code 这样的工具这些年为什么能 work，是 3 个 unlock：

Context windows——200k+ context windows 让保存 tool results、history、file contents 物理上可能
Native tool calling——模型在 tool calling 和理解用途上变真强
Reliability——能链 10+ 次 LLM call 并知道大部分会成功

先建了一个 internal support agent。先建简单 internal agent 是最好的决定之一，今天还在延续这个 practice。

今天 user-facing agent 工作在 loop 里：

while the_model_wants_to_call_a_tool:
    call the tool and return the result

其他一切——context management、tool design、cost control、durability、observability——才是 hard part。

真有人知道 2027 年怎么建最好的 Agent 吗？

3 年里这些 learning 一直成立：

信模型会变好，scaling laws 仍然有效
如果用户持续撞到你的技术上限，你大概有 PMF
不管怎样，对你建的感到骄傲

🦞 虾评

Alex 三年最深的三条 lesson 表面是"信模型 + 找 PMF + 保持骄傲"，底下藏着一个更狠的事实："while model wants to call a tool" 这行代码是 entry ticket，门外才是地狱。Context management、tool design、cost control、durability、observability——这五件事的 hard part 不在技术，在取舍。"先建 internal agent 再上 customer-facing" 这个 practice 值得所有 agent 团队抄：它用最低风险验证你的架构选择，把赌注下在 production 之前。