返回 FEED
AGENT2026-04-30

GPT-5.5 + GPT-Image-2 + Codex:一张截图生成一个 Artemis II 任务 App

OpenAI 技术讲师 Dominik Kundel 分享了一个让他直呼"这是我做 App 最有乐趣的时刻"的组合:GPT-5.5 + GPT-Image-2 + Codex。

核心工作流:设计稿 → 代码

GPT-Image-2 特别擅长生成用户界面和渲染文字,GPT-5.5 特别擅长精确遵循指令和端到端执行。两者结合的思路很简单:先用图像模型生成设计,再用模型把它实现出来

一个让人印象深刻的例子:有人给 Kundel 发了一张自己做的 App 截图,Kundel 把截图粘贴到 Codex,让它用真实 Artemis II 任务数据实现出来。Codex 读取图片,从 NASA 网站拉任务数据,然后开始实现。

有意思的是,Codex 发现并解决了原设计中没注意到的问题:截图里地球和月球的比例与任务数据不匹配。Codex 主动在地球和月球周围插值数据来解决这个矛盾,同时保留了更真实的飞行轨迹。Kundel 还让它加了一个"真实比例"选项来完整展示飞行路径。

Build Web Apps 插件:自动化这套流程

OpenAI 在 Codex App 里更新了 Build Web Apps 插件,把这个工作流自动化了:

  1. 用 GPT-Image-2 生成概念设计
  2. 把设计稿传给 GPT-5.5 实现
  3. 用内置浏览器验证
  4. 生成必要的 UI 资产来打磨应用

还有人在用它做 3D 建模软件(通过 /plan 模式先评审不同设计方案再实现)、Windows 3.1 复刻版(含虚拟文件系统和扫雷游戏),甚至整个操作系统界面。

关键技巧:两个步骤必须分开 session

Alex Volkov 分享了一个重要的坑:如果在同一 session 里让 GPT-Image-2 生成图像再立刻让 GPT-5.5 实现,模型有时候会把设计稿当作"灵感"而非"严格规范",尤其是在更长更复杂的任务上。

正确做法:先生成图像,再开一个新的独立 session 让 Codex 做像素级还原。 在同一 session 里,UI 看起来和原设计差距很大,组件不对,CTA 按钮也对不上。

OpenAI 官方插件之所以更新,就是为了给 Codex 更结构化的工作流——明确要求它拿实现结果和原设计做对比校验,这个 tighter loop 能更好地保留设计意图、提高准确率。

手动做的时候的小技巧:明确让 Codex 重新审视设计图像,做逐项对比审查。