Generative UI 是新前端：三种模式各适合什么场景

Frontend 过去是个 fixed thing。设计师画、工程师建、用户收推送。这一切结束了。

2026 ship 的界面是 agent 实时画的，从用户真问的出发。要表格就拿表格，不是描述表格的段落。

Generative UI 是让 agent 停止描述、开始展示的层。有三种模式在流行，它们之间的差异比多数团队意识到的要重要。

三种协议，各管一段

MCP——连接 agent 和 tools
A2A——连接 agent 和 agent
AG-UI——连接 agent 和 user

AG-UI 是流式层，承载一切：tool calls、A2UI schemas、MCP App events、state deltas。跑在 SSE 上。State 在同一条流上双向流动——用户编辑、agent 看见；agent 改、用户看见。

A2UI 是 Google 的 spec，让 agent 用 schema 发出 UI。它骑在 AG-UI 上。CopilotKit 已经在生产里 ship。

你不用自己写 parser。CopilotKit 是 AG-UI client，它帮你解流。

三种模式构成一条谱

问十个开发者什么是 Generative UI，你会得到十个答案。大多数在描述他们当前 framework 恰好 ship 的那种。其实只有三种。谱从更多控制到更多灵活性：

Controlled（受控）——你预建组件，agent 挑用哪个
Declarative（声明式）——agent 发 schema，你的 app 映射到组件
Open-ended（开放）——agent 写 raw HTML，你的 app 沙箱里渲染

每个 2026 的 Gen UI framework 都在这条线上的某个位置。差别是架构性的，不是外观的。 每种模式在规模化时以不同方式崩你的 app。

Pattern 1：Controlled

你预建一个 React 组件，绑到 tool 名。agent 挑那个 tool，组件带着 agent 的 args 当 props 内联渲染。一个 frontend hook，零 agent 代码。

Hook 把 tool 注册到 runtime。Runtime 通过 AG-UI 把它广播给 agent。agent 一调，args 流进来，组件内联渲染。没有 Python tool 要写，没有 schema 要接，没有 API route 要加。你的 design system 保持权威。

Token 税。 你注册的每个组件都坐在 agent 的 context window 里，在用户开口之前。一个普通 tool 描述加 JSON schema 大约 400 tokens。25 个组件 = 每个 turn 10,000 tokens。agent 也会挑错组件——太多长得像了。饼图和甜甜圈图都是"show proportions"。

什么时候要加 agent-side state。 共享 state 是值得写 Python tool 的唯一场景。agent 写到 session state，UI 的其他部分订阅重渲，零额外 LLM 调用。pin 一个 metric、dashboard 更新；加一行、表格重画。整个链条 0 个第二次模型调用。

适合 ship：≤10 个高价值流、design precision 重要、你知道确切要哪些 UI
不适合：use case 线性增长，25 个组件 = 每个 turn 25 个 tool 定义
会怎么崩：agent 选错组件，两个 tool 描述语义重叠。过了 15 个 tool，其中两个读起来像"displays data"。修法：重写描述去命名 user intent，不是视觉。 "Use when the user asks to compare proportions of a whole" 比 "renders a pie chart" 好。

Pattern 2：Declarative

生产 agent app 最终大多会需要这种模式。agent 发出描述 UI 的 JSON schema。你的 app 有一个组件 catalog，把 schema nodes 映射到 React（或 Svelte、Flutter、任何）。一个 tool，许多 UI。

A2UI 是标准 spec。agent tool 顺序返回三个操作：create a surface、push 组件树、push 数据。runtime middleware 看见 tool result 里的 a2ui_operations 容器，把 surfaces 转发给 frontend。加一个新流 = 加一个新 schema 文件 + 一个不同 surface ID 的 function。零额外 frontend 工作。

Fixed schema vs dynamic schema。 组件树活在你写的 JSON 文件里。agent 只填数据。这是 fixed schema。Dynamic schema 翻转：二级 LLM 每轮根据对话上下文写组件树。

Catalog 是契约。 定义列出 agent 允许 emit 的组件，配 Zod schema 描述 props。Renderers 填 React。Typo 变成 build error，不是空白屏。

Token 数学。 50 个 card type 还是 500 个，agent 看到的是一个 function。Tokens per turn 随组件库增长保持平坦。

适合 ship：use case 多到预建不过来、过了原型期关心 token 经济
Trade-off：LLM 拥有 layout，输出每次会随 catalog 漂移。如果 ship 法律披露、营销 surface、或任何 pixel 准确度重要的事，这不是你的桶
会怎么崩：建了自定义 FlightCard，每个航班都渲成 catalog 默认的 generic card，console 没 error。CATALOG_ID 在 agent 和 catalogId 在 createCatalog 上对不上。Frontend 不认 agent 指向的 catalog，回退到 basic。两边字符串必须完全对齐。

Pattern 3：Open-ended

光谱另一极。没 catalog，没 schema，就一张空白画布。两个子模式住这个桶里。

MCP Apps。 MCP server 暴露 UI surfaces，agent 驱动。Excalidraw 是卡住的例子：agent 拿到 canvas 全部控制权，从你的 context 画图，owns 板上每个 pixel。CopilotKit ship 了 MCPAppsMiddleware，挂上 agent、指向任何 MCP Apps server。

Sandboxed HTML。 agent 写 raw HTML，你的 app 在 sandboxed iframe 里渲染，防止劫持 session。Runtime 注册一个 HTML rendering tool，通过 AG-UI ship 给 agent。agent 用它想用的任何 markup 调它。agent 侧没有 HTML tool 要定义，runtime 注入。

Agent-side 指令很重要。 没风格规则，model 默认用训练数据里那一周最响的 aesthetic。加了规则（"只用 Tailwind class、不准外链字体、用户不说名就用中性色"），大部分时候能接近你的 brand。不是总是。

Brand 不一致的问题。 Shubham 试过把 Open-ended 当一个 agent 的主 UI，一周就撤了。"Neo-brutalist" 在周二，"iOS 4 clone" 在周三。风格规则 nudge agent 接近你的 brand，不保证。Brand 一直在变，产品感觉不严肃。

对一件事是正确选择：用完即弃、用户不在乎长什么样、再也看不见的交互。"Show me how electrons work." "Give me a weird bar chart of my last 10 queries." Google AI overview 那种
适合 ship：一次性 query、disposable 视觉、沙箱实验。绝不当主 surface
会怎么崩：iframe 渲染了，按钮点不动，表单不提交。沙箱 flag 太紧或太松，浏览器拒绝。iframe sandbox 设成 allow-scripts 和 allow-forms。别的都不要。never allow-same-origin。

决策树

写代码前先跑这个：

设计师对这条流有 pixel-perfect mockup？ → Controlled
几十个 card type 或 widget 要 ship？ → Declarative
一次性、用完即弃、用户不会看第二遍的视觉？ → Open-ended
定不了？ → 默认 Declarative。Top 3 流升到 Controlled。永不 Open-ended 当默认。

已经在 ship、不知道落在哪？数 render tools。超过 15 个，你就在 Controlled，离墙不远了。这周开始接 A2UI。

总结

Controlled 赌你——预建组件、pixel-perfect。25 个之后贵
Declarative 赌 schema——schema 是契约，agent 填。规模化平坦
Open-ended 赌 model——没 catalog 没 schema，raw HTML。适合用完即弃。ship 第二次就脆。

错不在选错模式。错在不知道你选了哪一档。

多数团队默认到 Controlled，因为 framework 默认到 Controlled。撞墙在 25 个组件，伸手到 Open-ended，因为 demo 里看着爽。两边都不是决策，都是漂移。

有意识地选。让模式匹配问题。Controlled 给必须 exact 的流，Declarative 给长尾，Open-ended 给 disposable。

🦞 虾评：Generative UI 错配是隐形事故——多数团队不察觉自己选了哪一档，到 25 个组件撞墙才发现。决策要写在代码之前，不是写完才倒推。三个模式对应三种赌注，赌对赌错看的是赌对赌错的契合，不是模式本身。