核心洞察
GPT-5 Pro 不是替代 Codex/Claude Code 的编码工具,而是「规划审查层」。
在复杂架构、技术或科学问题上提供第二意见,消除「遗漏关键 nuances」的风险。
为什么你没用够 Pro
GPT Pro 给出更好的答案,但代价是耗时极长。
另外,Codex 的 model picker 里没有 GPT Pro——这意味着很难把业务上下文、研究资料和代码库完整提供给这个最强大的模型。
本文目标:消除 GPT Pro 和 Codex 之间的摩擦,无需手动复制粘贴。
标准工作流程
迭代规划(Codex + Claude Code)
↓
[复杂度检查]
↓ 是 → GPT Pro 审查计划
↓ 否 → Codex 直接实现
↓
实施(Codex)
Codex vs Claude Code:
- 规划迭代:两者都用
- 实施:Codex 更强(长时任务、稳定保持目标)
何时使用 GPT Pro
条件 1:有显著疑虑
从技术、架构或产品角度对计划的某些方面有疑虑时,将计划连同 contextual questions 一起传给 Pro 审查。
条件 2:主题本身具有显著复杂度
即使没有疑虑,但主题涉及显著的架构、技术或科学复杂度,将计划或写作片段传给 Pro 审查。
复杂度阈值因领域、项目和个人而异,需要自行实验确定。
三个领域的实战案例
1. 经济学研究
工业组织(应用微观经济学中最技术性的分支):
- 使用 Pro 审查结构估计计划
- Pro 提出了许多 nuances 和 objections
- 顶尖教授(多篇 top five 期刊发表)反思后认为值得在计划中解决
劳动经济学和政治经济学:
- Pro 没有显著优势
- 实证方法对 coding agents 来说已经相当简单和 rote
Pro 的局限:
- 无法写代码、查询数据集、根据发现更新分析
- 不适用于实际模型实现或交互式数据分析
PDF 预处理技巧:
- 不要直接 dump PDF 提问
- 预处理输入 PDF,提取与问题相关的 essential parts
- 上下文管理技能对 Pro 的结果至关重要
2. 咨询工作
提案审查:
- Pro 善于发现提案结构层面的 flaws
- Lesser thinking models 通常 catch 不到的问题
- 包括:应该问的澄清问题、应该向哪些决策者提问、交付物 scope 不一致
课程设计:
- 更好地构建课程结构和主题引入顺序
- 创建能服务多能力水平受众的单一课程
3. 软件开发
架构复杂度示例:PaySlice(金融科技产品)
| 组件 | 详情 |
|---|---|
| 服务数量 | 6 个服务 |
| 环境 | 3 个不同环境 |
| 外部供应商 | Plaid(银行)、Finix(支付)、Supabase(认证) |
| 数据库 | 2 个运营数据库 + 1 个分析仓库 |
| 编排层 | Dagster |
| 其他 | BI 应用 + 运营工具链 |
复杂度:单一产品变更(如调整应用显示发薪日准备状态)可能波及 9 个组件,跨越所有环境。
判断:这种复杂度超出人脑可靠容纳范围,也超出 Codex/Claude Code 自主 surface 的能力——必须经 Pro 审查后才实施。
如何确定复杂度阈值
推荐方法:实验
- 对同一问题,在 Pro 线程和 Thinking 线程中发送相同 prompt
- 比较结果质量差异
- 初期:每个考虑给 Pro 的问题都同时发给 Pro 和 Thinking
- 随时间建立直觉,了解特定领域中哪些任务真正需要 Pro
技术方案:从 Codex 使用 GPT Pro
问题
Codex model picker 中没有 GPT Pro。API 方案(如 OpenCode)可行但账单会「荒谬地昂贵」。
解决方案:两步法
第一步:打包上下文(Oracle)
Oracle(Pete Steinberger 创建的 CLI 工具)功能:
- 给定 prompt 和文件/glob 集合
- 展开为单个 markdown 文件
- 尊重 .gitignore,忽略 node_modules 等文件夹
- 警告 context budget 超支
- 复制到剪贴板
oracle --render --copy -p "<your task>" --file "src/**" --file "docs/**"
公开 skill:https://github.com/aniketpanjwani/skills/tree/main/skills/general/oracle
第二步:自动传输到 ChatGPT(Codex Chrome 插件)
流程:
- Codex 打开 Chrome 中的 ChatGPT
- 粘贴 Oracle bundle
- 等待响应(5-30 分钟)
- 将响应带回 Codex
三种 browser 自动化方案对比:
| 方案 | 可用性 | 优点 | 缺点 |
|---|---|---|---|
| Chrome 插件 | 非欧洲地区 | 后台 tab,不占用 Chrome 窗口 | 有时无法访问 |
| Computer Use | Mac | 可控制任何应用 | 占用整个 Chrome 窗口,无法同时使用 |
| Browser Use | 通用 | Codex 内置 | 最不稳定,需单独认证 |
推荐:Chrome 插件 > Computer Use > Browser Use
完整循环
Codex/Claude Code 创建计划
↓
Oracle 打包相关上下文
↓
自动 browser flow 发送到 GPT Pro
↓
Pro 的响应带回 Codex
↓
审查、争论、或进入实施
核心原则
不是每个任务都需要 Pro。
但当问题复杂到「遗漏 nuances 的代价很高」时,Pro 是计划实施前必须通过的审查层。
资源
- 作者:Aniket Panjwani (@aniketapanjwani)
- 原文:https://x.com/aniketapanjwani/status/2055314153011581152
- YouTube 视频:https://youtu.be/R9GUUyB3Utk(含 Codex 使用 Pro 的 live demo)
- Oracle Skill:https://github.com/aniketapanjwani/skills/tree/main/skills/general/oracle
- AI Economist:https://aieconomist.io(作者的经济学 AI 培训项目)