Codex的10个工作流用法：从码农到任务设计师

很多人第一次用 Codex，都是打开一个项目丢一句话进去："帮我修这个 bug"、"帮我写个页面"。这当然没错，但如果你只把它当成"会写代码的聊天框"，就有点可惜了。

真正拉开差距的，不是你会不会多写几个提示词，而是你会不会把一个模糊任务，交代成 Codex 能持续推进、能看现场、能跑工具、能被你中途纠偏、最后还能验收的工作流程。

一、固定线程：别每次都重新开一个临时工位

很多人用 Agent 有个坏习惯：每来一个任务，就新开一个对话。短任务还好，但一旦做的是长期项目，新开线程就像每天换一个新同事上班。昨天刚交代过项目目标，今天又要重讲。昨天刚说过哪些文件不能乱改，今天又要提醒。

固定线程的价值不是"聊天记录更长"，而是给同一类任务一个长期工位。可以先建 3 个最简单的线程：

项目维护线程：专门处理这个项目的改代码、跑测试、看 diff
文档审查线程：专门检查 README、教程、文章草稿、发布说明
每日整理线程：专门整理收件箱、待办、网页资料、消息摘要

就像厨房里切菜、炒菜、洗碗各有地方。Codex 也一样，固定线程跑顺以后，它更容易记住这个任务的上下文，你也更容易回头检查它之前做过什么。

二、先让它看现场：别再靠嘴描述半天

以前用 AI 最累的一件事，是描述现场。网页哪里挤？按钮怎么错位？报错弹窗长什么样？你要么复制一堆文字，要么截图以后再补一句"你看右上角那个地方"。

现在 Codex 已经越来越像一个能看现场的工作台。Appshots 可以把当前应用窗口交给 Codex；浏览器工具可以看网页渲染效果；Computer Use 可以在 Mac 上点击、输入、滚动。

新手第一步不要急着让它操作。先让它复述现场：

请先看当前窗口，不要点击、不要输入、不要修改任何内容。请只做三件事：1. 复述你看到了哪些主要区域；2. 指出你认为最可能有问题的 3 个地方；3. 告诉我下一步如果要检查，应该点哪里，但先不要点。

你不是一上来就把鼠标交出去，而是先让它像新同事一样站在你旁边，把现场说清楚。它说对了，再让它继续。它说错了，你马上纠正。

三、用 /goal：不要只说"帮我改好"，要说"怎样算做好"

/goal 真正改变的是：你不再只给 Codex 一个动作，而是给它一个完成标准。

普通提示词是："帮我优化登录流程。" Codex 很难知道什么叫"优化完了"。

更好的写法是：

/goal 让登录流程对新用户稳定可用。范围：只检查登录、注册、找回密码这三个页面；不重构用户系统；不改数据库结构。完成标准：新增或修复必要测试；本地登录主流程能通过；失败状态有明确提示；输出改动摘要和剩余风险。暂停条件：需要删除数据；需要改生产配置；需要输入密码、密钥或付款信息。

前一句像许愿。后一句像交活。Agent 最怕的不是任务大，而是任务没有终点。没有终点，它就像在雾里开车，看起来一直在努力，实际不知道什么时候该停。

以后写 /goal，记住 4 个词：目标 / 范围 / 验收 / 停止。

四、学会中途打方向：Steering 和 Queue

Agent 跑偏的时候，很多人第一反应是等它做完，然后说"不是这个意思"。这就像你坐出租车，司机已经开过三个路口了，你才说刚才应该左转。

Steering 适合改当前重点：

先停一下，当前重点不是重构组件。请只检查首页按钮、间距、移动端换行。不要继续改数据结构。

Queue 适合交代下一步：

当前这一步完成后，请不要直接继续。请先输出：1. 改了哪些文件；2. 跑了哪些验证；3. 哪些地方还需要人工确认。

一个管"现在别跑偏"，一个管"下一步别忘"。

五、分清 Browser、Chrome、Computer Use

三者能做的事不一样，风险也不一样：

内置浏览器像公共阅览室：适合读页面、截图、检查公开信息
Chrome 像你的私人办公室：适合已登录后台，先限制范围，不要授权太多
Computer Use 像你把同事请到电脑前：适合桌面软件、系统窗口，先让它复述现场，再批准点击

新手最稳的原则是：公开、低风险、可重复的任务，先给 Codex 做。登录态、隐私、付款、删除、发送消息这类动作，必须先停下来问人。

六、把重复流程做成 Skill

如果你有一段提示词，已经复制过 3 次，就该考虑做成 Skill。Skill 不是插件，更像一张"标准作业卡"。

比如经常让 Codex 做文章审查，每次都要说："请检查这篇文章是不是太空，标题有没有痛点，正文有没有可复制步骤，不要只夸优点，要指出可改的地方，最后给我一个改稿清单。"

更好的办法是沉淀成一个 Skill，让 Codex 帮你写最小版：触发场景、执行步骤、禁止事项、输出格式固定成：问题 / 原因 / 修改建议 / 可复制示例。

Skill 的价值不是花哨。它是让 Agent 每次按同一套流程干活，少一点随机发挥。就像餐厅后厨的出餐单，你不可能每来一份菜都重新教厨师盐放多少。

七、把规则写进 AGENTS.md

很多项目最怕的不是 Agent 不聪明，而是它不知道规矩。哪些文件不能随便动？测试命令是什么？提交前必须跑什么？UI 风格有什么禁忌？涉及外部消息、删除、上传时要不要停？

这些东西不要每次靠嘴说，写进项目规则 AGENTS.md：

常用命令：安装依赖、本地启动、最小测试
修改边界：不要改数据库 schema、不要删除用户数据、不要修改 .env 和密钥文件、大改动前先输出计划
完成要求：每次改完先看 git diff、能跑测试就跑最小相关测试、输出改动摘要/验证结果/风险点
必须暂停：需要付款、需要登录新账号、需要发送外部消息、需要删除文件或数据

这不是给 AI 写作文，这是给它贴一张办公室规章制度。有了这张纸，它下次进项目，至少知道哪些门不能乱开。

八、用 Automations：不是让 Codex 没事骚扰你，而是让它定时检查

真正适合自动化的任务，一般有三个特点：固定时间出现、输入来源稳定、结果需要你审一眼。

比如每天早上整理昨天的 issue 和失败 CI、每周五生成项目进展摘要、每天下午检查收件箱里有没有需要处理的反馈、每次发布后检查日志里有没有新增错误。

注意，不是让它直接替你拍板。更稳的做法是让它整理成"待审结果"：最紧急的 3 件事、每件事的证据链接、建议下一步、需要你确认的地方。

自动化不是把方向盘拆掉，它更像早上有人把报纸、待办和风险点放到你桌上，你喝口水就能开始判断。

九、质量门要前置

用 Codex 最危险的阶段，不是它不会写，恰恰是它写得太快。它三分钟改完一堆文件，给你一段很顺的总结。你一看"测试通过"，心里就想：那应该没问题吧。

别急。Agent 的总结不是证据。真正的证据是 diff、测试、截图、日志和可重复步骤。

每次让 Codex 改东西，最后都可以加 5 道质量门：

列出 git diff 中真正改动的文件
说明每个改动为什么必要
跑最小相关测试，并贴出命令和结果
检查是否改了依赖、密钥、权限、删除逻辑
给出剩余风险和需要人工确认的地方

这段很朴素，但很管用。它会把你从"听 Agent 自述"拉回"看真实证据"。

十、人的角色变了：你不是遥控器，你是验收人

Codex 这些功能加起来，不是在告诉你"以后什么都不用管了"。正好相反，它是在逼你换一种工作方式。

以前你像遥控器：做这一步、再做下一步、这里错了、继续、再继续。现在你更像一个小项目负责人：目标是什么、边界在哪里、看到什么现场、允许用哪些工具、成功怎么验收、什么时候必须停。

这才是 Codex 真正厉害的地方。它不只是帮你写代码，它把"如何把事情交代清楚"这件事，摆到了你面前。你越会定义目标，它越能持续推进。你越会提供现场，它越少猜。你越会写边界，它越不容易乱动。你越会验收，它交付的东西越可信。

给新手的一条最小上手路线：

固定一个项目维护线程
每次开始前，让 Codex 先复述目标和限制
涉及页面或桌面，先让它看现场但不要操作
完成后必须过 5 道质量门

等这 4 步顺了，再加 /goal、Skill、Automations。工具越强，越需要顺序。就像刚拿到一把很锋利的菜刀，不是马上表演花活，而是先学会怎么拿、怎么切、怎么收刀。