Codex 完整入门到部署课程(2026 终极指南)

频道:@DavidOndrej · 时长:1:24:14

📺 @DavidOndrej ⏱ 1:24:14 🗓 2026-05-19

视频信息

项目 内容
视频标题 CODEX FULL COURSE: From Zero to Deployed App (2026)
视频ID hoCWD1aI60Y
频道 @DavidOndrej
时长 1:24:14
主题 从安装到部署的完整 Codex 系统化教程,包含 CLI、IDE 扩展、Codex App、子代理、技能、自动化等全部主题
视频链接 https://www.youtube.com/watch?v=hoCWD1aI60Y

引言

“这是为零基础准备的终极 Codex 指南。我叫 David Andre,已经在 AI 编程上投入了超过一千个小时。我用 Codex 构建了 Vectal,我的 AI 创业项目,去年以七位数被收购。”

David 自称是 YouTube 上最早系统化教 Codex 的人之一,帮助过几十万人入门。这期 1 小时 24 分钟的视频,是他迄今为止最完整、最系统的 Codex 教学。

视频覆盖:基础安装与登录、CLI 的所有命令、AGENTS.md 系统提示文件、图像输入、Web 搜索、Plan 模式、模型与推理深度选择、Sandbox 与权限策略、Cursor IDE 集成、Codex 扩展、Git 与 GitHub、Vercel 部署、Codex App(多代理并行编排)、Skills(技能)、Automations(自动化)、Sub-agents(子代理)。

这篇教程会把全部 1 小时 24 分钟的内容浓缩成可直接执行的步骤,但保留所有关键命令、Pro 技巧和心智模型。这是 2026 年开始用 Codex 的最完整中文指南


第一阶段:理解 Codex 的四种使用方式

Codex 现在共有 4 种使用方式:

  1. Codex CLI(命令行)——任何电脑都能跑,门槛最低
  2. IDE 扩展(VS Code / Cursor 内的官方插件)——拥有 GUI,最适合不喜欢终端的人
  3. Codex 桌面 App(独立应用,目前 macOS 和 Windows 可用,Linux 暂无)——最强的多代理编排能力
  4. Codex Cloud Agents(云端代理,视频末尾仅简略提及)

David 强调:这 4 种方式共享同一个账号、同一个会话历史、同一套 skills。你可以在 CLI 起一个会话,到 Codex App 里用 /resume 继续。

1.1 为什么 2026 年还在用 Codex

“Codex 是目前最持久、最稳定、运行时间最长还少出错的 AI 编程代理。它在构建复杂应用、深度 debug 和长时间运行不犯错这几方面,比 Cloud Code 更强。”

David 的精确说法:“如果你 2026 年还没用 Codex,你真的在错过很多东西。Cloud Code 不错,但它在很多用例上不如 Codex 强。”


第二阶段:安装 Codex CLI

2.1 一行命令安装

打开终端(Mac 用 Spotlight 搜 terminal;Windows 按 Win+R 输入 cmd),粘贴 OpenAI 官方文档里的一行 install 命令,回车。

完成后在终端输入:

codex

第一次启动会提示有更新,让它自动更新(通常 2~3 秒)。

2.2 Node.js 依赖

如果安装失败:检查是否装了 Node.js。命令:

node -v

没有就去 nodejs.org 装最新版。

2.3 三种登录方式

  1. ChatGPT 订阅登录(推荐)——Go 计划 $8/月就够用;Plus 或 Pro 更佳
  2. Device Code(只有在另一台已登录设备上才好用)
  3. API Key(适合无 ChatGPT 订阅或开发集成场景)

关于 Pro 计划的重要变化

2026 年 OpenAI 把 Pro 分成了两档:$100/月$200/月(前者是新增的)。

“这是 Codex 历史上最划算的时刻。Pro 现在从 $100/月起步。”

如果你有多个 ChatGPT 账号(比如个人 + 团队),登录时选用量额度最大的那个


第三阶段:Codex CLI 的关键命令与配置

3.1 选择模型:/model

启动 Codex 后第一件事是确认模型。命令:

/model

规则: - 永远选最新 GPT 模型(视频录制时是 GPT-5.4) - 永远不要用 mini 模型——David 原话:“god forbid” - 不要用 GPT-5.2、GPT-5.3 Spark、GPT-5.3 Codex 这些老版本

3.2 选择推理深度(Reasoning Effort)

四个档位: - Low——永远不要用,推理量太少,表现差 - Medium——默认,多数任务足够,省额度 - High——David 自己的默认值。简单任务 5 秒搞定,复杂任务可以跑 2~4 分钟 - Extra High——仅用于极复杂 bug、大型重构(如把整个后端改成 Rust)

3.3 切换工作目录:cdls

永远不要在你 Mac 的根目录跑 Codex。Codex 默认会从你启动它的目录开始工作。

两个必学的终端命令: - ls —— 列出当前目录的所有文件和文件夹 - cd <folder> —— 进入文件夹;按 Tab 自动补全 - cd .. —— 上一级目录 - pwd —— 显示当前所在路径

正确做法:每个项目独立放一个文件夹,先 cd 进去再启动 codex

“不要做那种把所有东西都堆在 Desktop 上的人。每个项目独立一个文件夹,这是绝对的基本功。”

3.4 倍速模式:/fast

/fast

切换 fast mode 后推理速度翻倍。代价是额度消耗也更快。 - $8 / $20 订阅:谨慎使用 - $100 / $200 Pro:永远开着 fast mode,没有理由不开

3.5 会话管理


第四阶段:AGENTS.md ——所有代理的系统提示文件

4.1 为什么必须先创建 AGENTS.md

启动 Codex 后第一件事就是让它创建 AGENTS.md:

“create an AGENTS.md file in this project and keep it empty for now. Just put a header.”

4.2 AGENTS.md 是事实标准

4.3 David 的免费 AGENTS.md 预设

David 把他自己的 AGENTS.md 预设放在了 GitHub Gist(视频描述里有链接)。直接复制 raw 内容,粘贴到 Codex 里:

“tagged with XML”——任何大段粘贴都用 XML 标签包起来:

<context>
... 你粘贴的内容 ...
</context>

这是 Pro 级别的 context engineering 技巧:让模型清楚地知道哪里是开始、哪里是结束。

4.4 必须自定义的字段

拿来用之前必须改掉的字段: - 项目名 - 目标用户 - 你的技能水平 - 项目目的

否则 Agent 会按通用模板行事,效果打折扣。


第五阶段:用 Codex 构建第一个真实应用

5.1 项目选题——避开”程序员陷阱”

David 在视频里特意花了 3 分钟讲选题哲学:

“我的观众 98% 是男性。本能是做自己会用的工具,结果都涌进了高度竞争的赛道。”

他举例:有个女生用一个 manifestation app(显化 app)做到了 300K MRR——“我都不知道 manifestation 是什么意思,但我知道 300K MRR 是什么意思。”

最大的机会在女性用户、轻量工具、品牌驱动的产品,不需要复杂 AI,关键是产品定位精准。

5.2 本期项目:Beauty Mirror

让用户上传自己的脸部照片,看自己做了鼻整形 / 唇填 / 狐狸眼提升 / 拉皮 / 注射肉毒 / 不同肤色等不同医美项目后的样子。

“这是技术上有趣的项目,因为它能让我们用到 AI 图像编辑能力。”

5.3 关键 Prompt 模板

I want to build an app where you can upload an image of yourself
and see how you would look like with different facial changes.
Smaller nose, lip filler, foxy eye lift, facelift, Botox,
different skin tone, and at least 10 plus other things that
women often do or would like to see how they would look on them
before doing anything.

The target audience is women 18 to 55 years old.
Update AGENTS.md accordingly and also create README.md file.

注意要点: - 明确目标用户 - 列出至少 10 个具体功能(不要含糊地说”各种功能”) - 同时要求更新 AGENTS.md 和 README.md

5.4 图像输入(被严重低估的能力)

Mac 截图:Cmd+Shift+3(全屏)或 Cmd+Shift+4(区域) Windows 截图:Print Screen 或 Win+Print Screen 粘贴到 CodexCtrl+V(不是 Cmd+V!即使在 Mac 上也用 Ctrl+V,这是 Codex CLI 的限制)

David 的原话: > “When I code with AI, I attach screenshots all the time. Every other prompt includes at least one attached image.”

应用场景: - 截图一个你喜欢的网站设计,让 Codex 模仿 - 截图错误界面,让 Codex 调试 - 截图布局参考图,让 Codex 复制风格

5.5 Web 搜索(被严重低估的内置工具)

Use the web search tool to find the 20 plus most common facial
cosmetic surgeries women do and save them into a single bullet
list into README.md file.

为什么这很强: - 模型训练数据有截止日期,最新文档或市场数据不在内 - Codex 内置的 web search 接近 perplexity 标准搜索的水平(不是深度研究) - 用来做竞品调研、用户调研、文案灵感、最新 API 文档查询

5.6 让 Codex 一次性构建整个 App

“build this whole app fully and completely like a professional developer would. Make it a web app and keep building until the full app has been finished.”

关键修饰词: - “fully and completely” - “like a professional developer would” - “keep building until … has been finished”

David 切到 /fast + High reasoning + YOLO mode,让它跑 8 分钟。结果一次构建出几百行代码。


第六阶段:Plan 模式与 Sandbox 权限策略

6.1 /plan 模式

/plan

进入 Plan 模式后: - Codex 不会改任何文件(只读权限) - 它会反向采访你:你想要什么、为什么、风格如何、用什么技术栈 - 然后产出一份详细的实施计划

什么时候用 Plan 模式: - 项目刚起步,你自己也没完全想清楚 - 大型重构前 - 新功能涉及多个模块的影响

6.2 Sandbox 三层权限(Layer 1)

  1. Workspace Write(默认)——只能写当前项目目录,不能联网,不能动其他文件夹
  2. Read Only——只能读,不能写(Plan 模式自动启用)
  3. Danger Full Access——可以写任何地方、访问网络、跑高风险命令、无需任何审批

6.3 Approval Policy 四种策略(Layer 2)

  1. Untrusted——每个操作都要你点同意(最安全,最烦人)
  2. On Request——在 sandbox 内自由,越界时才询问(平衡,常用默认)
  3. Never——从不询问(危险但快)
  4. Granular——按操作类别精细控制

6.4 三个最常用的组合

6.5 关于 YOLO 模式的真相

“I’m going to give you a secret of the industry. All of the people who achieve stuff with AI agents use them in YOLO mode.”


第七阶段:在 Cursor IDE 中使用 Codex

7.1 为什么用 IDE

7.2 VS Code vs Cursor

学一个,其他都能上手——它们底层都是 VS Code。

7.3 安装 Cursor

7.4 Cursor 中的工作流

  1. 打开项目目录
  2. 侧栏放右边:右键侧栏标题 → Move Primary Sidebar to the Right(David 个人偏好)
  3. Cmd+J(Mac)或 Ctrl+J(Windows)——打开集成终端
  4. 终端里直接 codex --yolo
  5. 把终端拖到顶部——这样它占主窗口,方便并行运行多个 Codex 实例

7.5 启动多个 Codex

7.6 Codex IDE 扩展(4 种方式之二)

7.7 David 的标配组合


第八阶段:处理失败 ——一个真实 Debug 案例

8.1 开发服务器与 localhost

8.2 真实失败场景

David 让 Codex 调用 OpenRouter 的 Nano Banana 2(Gemini 3.1 Flash Image Preview)来生成变脸图——结果所有 generation 都失败,“All generations failed. Provider returned error.”

8.3 调试流程(David 的真实操作)

  1. F12 / Cmd+Option+I 打开浏览器 Console,看前端错误(没找到)

  2. 截屏失败界面,粘贴给 Codex:

    investigate why I'm getting this error and fix it
  3. 让 Codex 看 terminal logs:

    Do you see any errors in the terminal logs?
  4. 关键转折:让 Perplexity Deep Research 去研究 Nano Banana 2 的正确调用方式

  5. 创建 /docs/openrouter-nano-banana-2-syntax.md,把 Perplexity 的输出粘贴进去

  6. 让 Codex 读这个 doc,对比代码库找差异并修复

8.4 Cmd+P 跳转文件

Cmd+P(Mac)/ Ctrl+P(Windows):直接打开任意文件,无需在文件树里翻找。

8.5 关键 Prompt

Read @openrouter-nano-banana-2-syntax.md and analyze our
codebase to see what is different and fix it. This contains
520 lines of official documentation from OpenRouter on how
to use this specific model and how to attach images.

这个例子完整展示了 prompt engineering 的核心: 1. Tag relevant files@ 引用文件 2. 提供足够的上下文(520 行官方文档) 3. 明确指令:“analyze … see what is different … fix it” 4. 保持简洁但清晰


第九阶段:Prompt Engineering 的”中等智商曲线”

9.1 三类人的对比

David 引用经典的”midwit curve”meme:

类型 行为 结果
初学者(左侧) 提示词太短、太模糊,Agent 不知道你要什么 失败
中等智商(中间) 用各种模板、买他人提示词、每个 prompt 花 5 分钟 过度工程,效率低
顶级(右侧) 简洁但极清晰,1 分钟写完,边做边优化 最优

9.2 顶级提示工程的核心原则

9.3 上下文工程关键技巧


第十阶段:Git 与 GitHub 集成

10.1 Git ≠ GitHub

即使你不打算发布到 GitHub,每个项目都应该用 Git。

10.2 让 Codex 处理 Git

start a new Git repo in this project and do the first commit

后续:

stage all changes and do a Git commit

Codex 会自己跑 git status、查看变更、写 commit message。

10.3 提交频率

“你应该平均每 10~15 分钟提交一次。”

这是大多数初学者犯的错误——隔几小时才提交,一旦出问题就回不到稳定状态。

10.4 创建 .gitignore

create a detailed gitignore for this project

Codex 会根据你的技术栈(Next.js、Python、Node 等)生成完整的 .gitignore。

10.5 推送到 GitHub

  1. 去 github.com 创建新 repo(选 Private,除非你想完全公开)

  2. 复制 repo URL

  3. 在 Codex 里:

    here is a new GitHub repo: <URL>. Please push everything in there.

第十一阶段:部署到 Vercel

11.1 让 Codex 帮你选平台

I want to deploy my app somewhere so that it is accessible on
the internet for others. What are the best hosting platforms
for our app specifically? Analyze the tech stack. Think harder.
Give me top 3 options. Be very concise.

关键技巧:在 Cursor 里同时问 Opus 4.6 和 GPT-5.4,两个都推荐 Vercel——决策置信度自动 +1。

11.2 为什么 Next.js 应用首选 Vercel

11.3 部署流程

  1. 去 vercel.com,用 GitHub 登录(这样能直接看到你的 repos)
  2. Add New → Project
  3. 找到你的 GitHub repo,点击 Import
  4. 在 Environment Variables 里添加 API key(复制 .env.local 里的 key 和值)
  5. 点击 Deploy

11.4 部署时间

“It was like 20 seconds and we now have our project deployed.”

Vercel 会给你一个自定义域名(<project>.vercel.app),直接可访问。

11.5 部署常见平台对比

平台 最适合
Vercel Next.js 应用、前端
Netlify 静态站点、Jamstack
Railway 全栈应用、数据库
Render 后端服务、cron 任务
Supabase 数据库 + 后端服务

第十二阶段:Codex 桌面 App(最强模式)

12.1 下载

去 OpenAI 官方文档下载,拖到 Applications。

12.2 多代理并行

实际用法举例

12.3 Diff Editor

但 David 也明确说:Codex App 不是完整 IDE——所以它保留了 “Open in VS Code / Cursor” 按钮。


第十三阶段:Skills(技能系统)

13.1 什么是 Skill

Skill 是一组项目专用的指令集——比 AGENTS.md 更细粒度、按需调用。

13.2 内置 Skills

13.3 强烈推荐安装的 Skill

13.4 调用 Skill:$ 符号

$

输入 $ 后会列出所有可用 skills,选择即可调用。例如:

$image-gen create a potential logo for this project

13.5 安装新 Skill 的三种方式

  1. Skill Installer Skill —— $ skill-installer,让它帮你装别的 skill
  2. GitHub Repo —— 把 skill installer 指向任意 GitHub repo
  3. 手动创建 —— 在 plugins → skills → Create

第十四阶段:Automations(自动化)

14.1 本质是高级 Cron

14.2 创建 Automation

  1. 点击 + New Automation
  2. 填写标题
  3. 描述 prompt
  4. 选择 worktree 或 local
  5. 选择项目
  6. 设置运行频率(每天 / 每周 / 自定义 cron)

14.3 不止用于代码

“Think beyond coding. This could be used to find new leads for your business.”

实用案例: - 每天早上自动总结昨天的 commits - 每周自动生成 PR 摘要 - 每周扫一遍最新文档,更新内部知识库 - 定时抓取竞品价格、最新 LinkedIn lead


第十五阶段:Sub-agents(子代理)

15.1 触发子代理

launch a sub agent to add header comments to every file in our
codebase. Just briefly explaining what that file does.

Codex 会调用一个 GPT-5.4 mini 的 worker 在后台跑。

15.2 关键优势

15.3 适合 Sub-agent 的任务


第十六阶段:David 的全流程实战示例(端到端)

把整个视频的流程拼起来,看看一个完整的 App 是怎么从想法到上线的:

阶段 A:项目初始化(10 分钟)

  1. 在终端 cd 进入新项目文件夹
  2. codex --yolo 启动
  3. 选 GPT-5.4 + High reasoning + /fast
  4. 让它创建 AGENTS.md(粘贴 David 的预设作为模板)
  5. 让它创建 README.md

阶段 B:需求与设计(10 分钟)

  1. 描述应用功能,附上参考图(用 Ctrl+V 粘贴截图)
  2. 用 web search 调研用户需求
  3. 让 Codex 提议 10 个项目名,选一个

阶段 C:一次性构建(5~10 分钟)

  1. build this MVP as a web app. ask me 4 concise questions...
  2. 回答 4 个问题(关键决策:API、账号、存储、关注点)
  3. 让它”build this entire app fully and completely like a professional developer would”

阶段 D:调试与迭代(20~40 分钟)

  1. 启动 dev server,看效果
  2. 出错时截屏 → Ctrl+V 粘贴 → “investigate and fix”
  3. 复杂错误用 Perplexity Deep Research → 保存到 /docs/ → 让 Codex 参考修复
  4. 每 10~15 分钟让 Codex stage all and commit

阶段 E:版本控制与部署(10 分钟)

  1. 创建 GitHub repo(Private)
  2. here is a new GitHub repo: <URL>. push everything in there
  3. 去 vercel.com,用 GitHub 登录
  4. Add New → Project → Import → 设置环境变量 → Deploy
  5. 20 秒后拿到上线 URL

阶段 F:持续运营(持续)

  1. 用 Codex App 的 Automation 做每日 summary
  2. 用 Sub-agents 处理重复性工作
  3. 用 Skills(Playwright)做自动化测试

核心要点速查表

概念 解释
Codex CLI 终端中的 Codex,最基础
Codex IDE 扩展 VS Code / Cursor 内的 OpenAI 官方插件
Codex App 独立桌面应用,最强多代理编排
AGENTS.md 60k+ 项目共用的系统提示文件
/model 选择模型,永远用最新的
/fast 开启倍速模式
/plan 进入 Plan 模式,只读 + 反向采访
/resume 恢复之前的会话
/new、/clear 开始新会话
–yolo 启动 Codex 时进入 YOLO 模式(最强权限)
–full-auto 启动 Codex 时半自动模式
Ctrl+V 在 Codex CLI 里粘贴图片(不是 Cmd+V)
Cmd+J Cursor 中打开集成终端
Cmd+I Cursor 中打开 AI 侧栏
Cmd+P Cursor 中按文件名跳转
Sandbox Mode 三层:Workspace Write / Read Only / Danger Full
Approval Policy 四档:Untrusted / On Request / Never / Granular
Git Worktree Codex App 多代理并行的核心机制
Skills 项目专用指令集,用 $ 调用
Automations 高级 cron 任务
Sub-agents 后台 GPT-5.4 mini worker
Vercel Next.js 应用的首选部署平台

8 个实用启示

  1. 永远先建 AGENTS.md——这是所有后续高质量交互的基础
  2. YOLO 模式 + Git 是最优组合——前者解放生产力,后者兜底防灾
  3. 图像输入是被低估 10 倍的能力——任何 prompt 都应该考虑能不能配截图
  4. /docs/ 文件夹是 Codex 的长期记忆——把 deep research 结果、API 文档、设计参考都放这里
  5. 同时跑多个 Codex——一个写代码、一个当顾问、一个跑测试,效率指数级提升
  6. 每 10~15 分钟 Git Commit 一次——这是不会被 AI 替代的纪律
  7. 选最新模型 + High reasoning + Fast mode——这三个开关组合就是 Codex 的最强形态
  8. 不要做面向程序员的工具——98% 的开发者都在卷这条赛道,机会在女性 / 老年 / 文化圈层

10 个常见误区

  1. “Codex 是只能写代码的工具”——错。它能做营销调研、招聘、个人生产力、商业策略
  2. “Plan 模式只适合初学者”——错。资深开发者做大重构时也应该先 /plan
  3. “Mini 模型省钱”——错。它们便宜但表现糟糕,最后你浪费的时间比省的钱多得多
  4. “Low reasoning 用来跑简单任务”——错。Low 永远不要用,Medium 才是真正的默认
  5. “YOLO 模式太危险”——只要你用 Git,根本没风险
  6. “复制粘贴时按 Cmd+V”——在 Codex CLI 里必须用 Ctrl+V,即使在 Mac 上
  7. “Cursor 太贵了,VS Code 就够”——Cursor 的 Cursor Agent 内置免费额度,且能调用多家模型
  8. “Codex CLI 和 Codex App 是两个独立产品”——错。它们共享会话、技能、账号
  9. “必须把所有 prompt 都写得很长”——错。Midwit 曲线,简洁但清晰才是顶级
  10. “AGENTS.md 写一次就完事”——错。每次项目重大变化时都应该更新

12 个关键要点

  1. Codex 现在有 4 种使用方式:CLI、IDE 扩展、Codex App、Cloud Agents
  2. 安装 CLI 只需一行命令;CLI 依赖 Node.js
  3. /model 选最新模型,永远不用 mini
  4. 推理深度:High 是 David 的默认值,Medium 是省额度方案,Extra High 仅用于极复杂场景
  5. /fast 倍速模式,Pro 计划用户永远开着
  6. AGENTS.md 是必须先建的文件,是 60k+ 项目的事实标准
  7. <context>...</context> XML 标签包裹大段粘贴
  8. Ctrl+V 粘贴图片,Cmd+V 不行(Codex CLI 限制)
  9. Sandbox 三层:Workspace Write / Read Only / Danger Full Access
  10. Approval Policy 四档:Untrusted / On Request / Never / Granular
  11. --yolo = Danger Full Access + Never,是高生产力的标配
  12. 每 10~15 分钟做一次 Git Commit,这是基本纪律

额外资源

资源 说明
OpenAI Codex 官方文档 platform.openai.com/docs/codex
Node.js 官网 nodejs.org,运行 Codex CLI 的前置依赖
Cursor IDE cursor.com,AI 优化的 VS Code fork
VS Code 官网 code.visualstudio.com,开源 IDE 基石
OpenRouter openrouter.ai,统一调用各家 LLM 与图像模型
Vercel vercel.com,Next.js 部署首选
GitHub github.com,代码托管
Perplexity perplexity.ai,Deep Research 功能强大
David 的 AGENTS.md 预设 GitHub Gist(视频描述链接)
Nano Banana 2 模型 Gemini 3.1 Flash Image Preview
The New Society David 的 AI 编程付费社区

结论

“If you watched until the end, then I want to congratulate you. You probably know Codex better than 99% of people.”

David 这期 1 小时 24 分钟的视频,本质上是把一个完整的现代 AI 编程工作流摊开来给你看:从安装、配置、第一个 prompt,到调试、版本控制、部署、运营。

Codex 不只是”另一个 AI 编程工具”。它是 OpenAI 对未来软件开发到底应该长什么样的当前答案。在 2026 年,掌握 Codex(连同 Cloud Code、Cursor、Gemini CLI 等)的人和不掌握的人之间,生产力差距会以数量级呈现。

如果你看完这篇教程,请今晚就: 1. 装好 Codex CLI 2. 选一个真实想法(不是 hello world) 3. 跑完从 AGENTS.md 到 Vercel 部署的完整流程

这一晚的时间投入,会改变你接下来 5 年的工作方式。