很多人第一次接触 Codex App 的反应不是"哇,好强",而是:这玩意儿到底从哪开始?
左边一堆入口,中间是聊天,右边弹出网页、图片、文档、来源、代码变化。设置里还有一堆看起来很技术的东西。作为小白,困住你的大概率不是不想用 Codex,而是压根不知道如何第一次上手。
这篇教程不是技术文章,是一个普通人的使用路线图。
一句话解释 Codex App
Codex App 是一个把 AI Agent 放进你电脑里的工作台。只要你能在电脑上做的操作,它基本上也都能做,而且它会做得更完美、更高效。
它不是传统聊天框——它更像是你的助理,可以:
- 读你指定的本地文件
- 搜索网页,打开内置浏览器
- 生成图片、文档、PPT、网页、代码
- 用插件连接 Gmail、GitHub、Google Drive、Slack 等外部工具
- 设置自动化,定期帮你检查、总结或继续任务
对于非程序员,可以先把它理解成:一个更偏"做事"的 ChatGPT。
三种形态:普通对话 / Codex App / 云端 Codex
| 类型 | 适合做什么 |
|---|---|
| 普通 ChatGPT | 问问题、写文案、解释概念、生成文件 |
| Codex App(本地) | 处理本地文件或项目,最大的区别是能轻松读取本地文件 |
| 云端 Codex | 让 Codex 在远程环境里持续跑任务,关机也不影响 |
判断标准:一般任务用普通对话;处理本地文件用项目模式;需要持续跑任务用云端。
界面三分区
- 左边导航栏:找入口、找项目、找对话(新对话、搜索、插件、自动化、项目)
- 中间对话区:你和 Codex 真正交流的地方
- 右边结果区:展示证据和产物(来源、网页预览、图片、代码差异、Git 变化)
右侧的理解方式:Codex 交作业的地方。中间告诉你"Codex 做了什么",右边让你看"Codex 产出了什么"。
几个核心概念
插件(Plugin):给 Codex 装能力包。比如装了表格插件,它就更会处理表格;装了 GitHub 插件,可以和 GitHub 工作流配合。
连接器(Connector):连接外部账号或服务,比如连接 Gmail、GitHub、Google Drive。
技能(Skill):一套固定工作流说明书,比如"写教程时按我的风格来写"。
MCP:让外部工具接入 Codex 的一种方式,让 Codex 调用某个本地服务或工具。
大白话版本:插件是能力包,连接器是接账号,技能是工作流说明书,MCP 是接工具的通道。
设置里最该关注四个地方
- 工作模式:非程序员优先选"日常工作"模式,Codex 的表达会少一点工程黑话
- 权限:越大能做的事越多,但风险也越大。刚开始可以保守,熟练后放开
- 发送方式:长文本是否需要 Command + Enter,避免误触
- 语音输入:打开后可以在电脑任意对话框调用 Codex 的语音输入法
小白最容易犯的错
看到确认按钮就点。千万不要这样。如果看不懂权限,让 Codex 帮你解释:
"这个权限会让你访问什么?为什么这个任务需要它?有没有更低风险的做法?我是小白,应该允许吗?"
电脑操控是最强的功能
Codex App 最牛逼的功能是"电脑操控"——让 Codex 直接操作 Mac 上的应用:打开 App、点击按钮、查看界面、处理可视化任务。
举个例子:可以让 Codex 从零到一写一份法律检索报告,登录网站、搜索、探究内部结构、点击、整理资料全部一次性完成。
但也正因如此,边界一定要说清楚。小白建议:第一次用电脑操控,最好只让它操作无风险的 App,特别记住不要操作社媒账号和微信。
优先级建议
- 打开 App,先熟悉左侧导航
- 新建一个普通对话,问一个低风险问题
- 打开设置页,只看不改
- 建一个干净演示项目,不要用私人项目
- 让 Codex 读取项目,生成一个简单 Markdown
- 看右侧结果区
- 再尝试插件页和自动化页
- 最后再碰 Git、MCP、电脑操控这些高级功能
核心心态
Codex App 的功能非常广泛:聊天、文件、项目、网页、浏览器、自动化、Git、第三方账号、本地电脑权限。小白第一次打开会懵,是很正常的。慢慢习惯使用它,慢慢给它加插件、加 Skill,最后把它培养成最合适的超级助手。
它比 Claude Code 的 CLI 界面更易上手,非常符合小白的使用习惯。只要是人类能做的软件操作,它基本都能完成。