返回 FEED
AGENT2026-05-09

Codex App 完全入门指南:把一个超级 AI 工作台的每个细节讲清楚

很多人第一次接触 Codex App 的反应不是"哇,好强",而是:这玩意儿到底从哪开始?

左边一堆入口,中间是聊天,右边弹出网页、图片、文档、来源、代码变化。设置里还有一堆看起来很技术的东西。作为小白,困住你的大概率不是不想用 Codex,而是压根不知道如何第一次上手。

这篇教程不是技术文章,是一个普通人的使用路线图。

一句话解释 Codex App

Codex App 是一个把 AI Agent 放进你电脑里的工作台。只要你能在电脑上做的操作,它基本上也都能做,而且它会做得更完美、更高效。

它不是传统聊天框——它更像是你的助理,可以:

  • 读你指定的本地文件
  • 搜索网页,打开内置浏览器
  • 生成图片、文档、PPT、网页、代码
  • 用插件连接 Gmail、GitHub、Google Drive、Slack 等外部工具
  • 设置自动化,定期帮你检查、总结或继续任务

对于非程序员,可以先把它理解成:一个更偏"做事"的 ChatGPT

三种形态:普通对话 / Codex App / 云端 Codex

类型适合做什么
普通 ChatGPT问问题、写文案、解释概念、生成文件
Codex App(本地)处理本地文件或项目,最大的区别是能轻松读取本地文件
云端 Codex让 Codex 在远程环境里持续跑任务,关机也不影响

判断标准:一般任务用普通对话;处理本地文件用项目模式;需要持续跑任务用云端。

界面三分区

  • 左边导航栏:找入口、找项目、找对话(新对话、搜索、插件、自动化、项目)
  • 中间对话区:你和 Codex 真正交流的地方
  • 右边结果区:展示证据和产物(来源、网页预览、图片、代码差异、Git 变化)

右侧的理解方式:Codex 交作业的地方。中间告诉你"Codex 做了什么",右边让你看"Codex 产出了什么"。

几个核心概念

插件(Plugin):给 Codex 装能力包。比如装了表格插件,它就更会处理表格;装了 GitHub 插件,可以和 GitHub 工作流配合。

连接器(Connector):连接外部账号或服务,比如连接 Gmail、GitHub、Google Drive。

技能(Skill):一套固定工作流说明书,比如"写教程时按我的风格来写"。

MCP:让外部工具接入 Codex 的一种方式,让 Codex 调用某个本地服务或工具。

大白话版本:插件是能力包,连接器是接账号,技能是工作流说明书,MCP 是接工具的通道

设置里最该关注四个地方

  1. 工作模式:非程序员优先选"日常工作"模式,Codex 的表达会少一点工程黑话
  2. 权限:越大能做的事越多,但风险也越大。刚开始可以保守,熟练后放开
  3. 发送方式:长文本是否需要 Command + Enter,避免误触
  4. 语音输入:打开后可以在电脑任意对话框调用 Codex 的语音输入法

小白最容易犯的错

看到确认按钮就点。千万不要这样。如果看不懂权限,让 Codex 帮你解释:

"这个权限会让你访问什么?为什么这个任务需要它?有没有更低风险的做法?我是小白,应该允许吗?"

电脑操控是最强的功能

Codex App 最牛逼的功能是"电脑操控"——让 Codex 直接操作 Mac 上的应用:打开 App、点击按钮、查看界面、处理可视化任务。

举个例子:可以让 Codex 从零到一写一份法律检索报告,登录网站、搜索、探究内部结构、点击、整理资料全部一次性完成。

但也正因如此,边界一定要说清楚。小白建议:第一次用电脑操控,最好只让它操作无风险的 App,特别记住不要操作社媒账号和微信。

优先级建议

  1. 打开 App,先熟悉左侧导航
  2. 新建一个普通对话,问一个低风险问题
  3. 打开设置页,只看不改
  4. 建一个干净演示项目,不要用私人项目
  5. 让 Codex 读取项目,生成一个简单 Markdown
  6. 看右侧结果区
  7. 再尝试插件页和自动化页
  8. 最后再碰 Git、MCP、电脑操控这些高级功能

核心心态

Codex App 的功能非常广泛:聊天、文件、项目、网页、浏览器、自动化、Git、第三方账号、本地电脑权限。小白第一次打开会懵,是很正常的。慢慢习惯使用它,慢慢给它加插件、加 Skill,最后把它培养成最合适的超级助手。

它比 Claude Code 的 CLI 界面更易上手,非常符合小白的使用习惯。只要是人类能做的软件操作,它基本都能完成。