✍️ 公众号文章

经/管/金融人

学生

OpenAI Codex App：从「写代码的 AI」到「用代码完成工作的 AI」

OpenAI 发布 Codex 桌面应用，Agent 从写代码升级为用代码完成工作；支持多 Agent 并行、Skills 扩展工具能力、后台自动化与默认隔离的安全模型，重新定义软件构建门槛。

李学恒2026年2月3日4 分钟阅读#openai-codex#ai-agent#multi-agent#skills#automation

目录展开 ↓

从 Copilot 到 Agent：范式转移已经发生
核心能力：多 Agent 协调作战
Skills：让 Agent 学会使用工具
700 万 Tokens 的赛车游戏
Automations：让 Agent 在后台持续工作
安全机制：默认隔离，可控放权
定价与可用性
这意味着什么
写在最后

摘要：OpenAI 发布 Codex 桌面应用，将 Agent 从「代码生成器」升级为「工作执行器」；Skills 系统让 AI 可以操作 Figma、Linear、云服务等工具；700 万 tokens 构建一个完整赛车游戏。本文解读 Agent 工作方式的根本性转变，以及 Codex App 如何重新定义**「谁能构建软件」**。

封面图

从 Copilot 到 Agent：范式转移已经发生

2025 年 4 月，OpenAI 发布了 Codex。2026 年 2 月，他们发布了 Codex 桌面应用。

这不是一个普通的版本更新。

如果说之前的 Codex 是一个「会写代码的助手」，那么现在的 Codex App 更像是一个「能独立工作的员工」。区别在哪里？助手等你下指令，员工能自己跑完整个流程。

OpenAI 在官方博客中说得很直接：

Codex is evolving from an agent that writes code into one that uses code to get work done on your computer.

这句话的深层含义是：代码不再是目的，而是手段。 Agent 写代码不是为了让你看代码，而是为了用代码完成你真正想做的事——设计、部署、测试、运维，甚至写文档。

核心能力：多 Agent 协调作战

Codex App 最显眼的变化是它的定位——Agent 指挥中心（Command Center for Agents）。

这里的「多 Agent」不是营销话术。在实际使用中，你可以：

同时运行多个 Agent，每个处理不同任务
按项目组织线程，随时切换上下文而不丢失进度
并行探索多个方案，比较不同路径的效果

技术上，这依赖一个关键特性：内置 worktrees 支持。

Git worktrees 是什么？简单说，它允许你在同一个仓库中同时拥有多个工作目录，每个目录可以处于不同的分支状态。Codex App 利用这个机制，让每个 Agent 在隔离的代码副本上工作，互不干扰。

这解决了一个实际问题：以前让 AI 改代码，你得小心翼翼，因为它的修改直接影响你的本地状态。现在，Agent 在自己的空间里折腾，你可以在它工作时继续做自己的事，等它完成了再决定是否合并。

Skills：让 Agent 学会使用工具

如果说多 Agent 协调是「量」的变化，Skills 系统就是**「质」的飞跃**。

Skills 是什么？

Skills 是打包好的指令、资源和脚本，让 Codex 能够连接工具、运行工作流、按照团队偏好完成任务。

目前开源的 Skills 库涵盖：

类别	Skills	能力
设计实现	Figma	获取设计稿并转换为 1:1 还原的 UI 代码
项目管理	Linear	分类 bug、跟踪发布、管理团队工作量
云部署	Cloudflare, Vercel, Netlify, Render	将 Web 应用部署到主流云平台
图像生成	GPT Image	创建和编辑网站、UI 原型、产品素材
文档处理	PDF, Spreadsheet, Docx	读取、创建和编辑专业文档

关键的不是这些具体功能，而是这个架构的含义：Agent 的能力边界从此变成可扩展的。

以前，一个 AI 工具能做什么，取决于开发者写了什么功能。现在，你可以通过添加 Skills 让 Agent 学会新技能，就像给员工做培训。

而且 Skills 可以检入代码仓库，整个团队共享。团队 A 开发了一个好用的 Skill，团队 B 可以直接用。

700 万 Tokens 的赛车游戏

OpenAI 在发布会上展示了一个案例：用一个 prompt 让 Codex 构建了一个完整的赛车游戏。

这个游戏包含：

不同的赛车手角色
8 张地图
可使用道具（空格键触发）

整个过程中，Codex 消耗了超过 700 万 tokens。它同时扮演了三个角色：设计师、游戏开发者、QA 测试员——最后这个角色意味着它真的玩了自己做的游戏来验证功能。

这个案例说明几件事：

长任务执行能力成熟了。700 万 tokens 不是一个小数字，这意味着 Agent 可以在一个复杂项目上持续工作数小时甚至数天
自主决策链条变长了。不是「你告诉我做什么我就做什么」，而是**「你告诉我目标，我自己规划、执行、验证」**
技术门槛的变化。理论上，任何能清晰描述需求的人，都可以「构建」一个游戏

Automations：让 Agent 在后台持续工作

Codex App 引入了一个新概念：Automations（自动化）。

你可以设置定时任务，让 Agent 在后台自动执行重复性工作：

每日问题分类
CI 失败监控和摘要
每日发布简报
Bug 检测巡查

工作完成后，结果进入审阅队列。你可以选择直接采纳，也可以接手继续处理。

这让 Agent 从「调用型工具」变成了「常驻型助手」。不是你需要它时才启动，而是它一直在工作，你只需要定期检查结果。

安全机制：默认隔离，可控放权

Agent 能力越大，安全问题就越重要。

Codex App 的安全模型是：默认隔离，显式授权。

具体来说：

Agent 默认只能编辑它所在的文件夹或分支
只能使用缓存的网络搜索
需要网络访问等高级权限时，会请求用户授权
团队可以配置规则，让某些命令自动获得权限

这个设计平衡了安全性和便利性。对于敏感操作，Agent 会主动确认；对于日常操作，可以通过规则自动化。

定价与可用性

Codex App 目前支持 macOS（Windows 版本即将推出）。

订阅类型	使用方式
Plus, Pro, Business, Enterprise, Edu	正式使用，限时双倍配额
Free, Go	限时开放试用

一个细节：Codex 的使用包含在 ChatGPT 订阅中，但可以额外购买积分。这说明 OpenAI 预期用户对 Agent 的使用量会远超普通聊天。

这意味着什么

Codex App 的发布标志着一个转变：AI 开发工具从「辅助编程」进入「工作执行」阶段。

对开发者来说，这意味着：

工作方式从**「写代码」变成「指挥 Agent 写代码」**
能够同时推进多个任务，而不是串行处理
重复性工作可以完全自动化

对非开发者来说，这意味着：

技术门槛降低，会描述需求就能构建软件
但这不意味着「人人都是程序员」——你仍然需要理解需求、评估结果、做出决策

对整个行业来说，这意味着：

软件开发的效率边界正在被重新定义
「能写代码」不再是稀缺技能，「能指挥 Agent」成为新的能力要求

写在最后

OpenAI 博客中有一句话值得记住：

Codex is built on a simple premise: everything is controlled by code.

如果一切都可以用代码控制，而 Agent 越来越擅长生成和执行代码，那么 Agent 的能力边界就等同于代码的能力边界——理论上，这是无限的。

当然，从理论可能到实际可用还有距离。目前的 Codex 仍然需要人类监督、确认和纠错。但方向已经明确：Agent 不是替代人类写代码，而是替代人类做那些可以用代码完成的事。

这才是 Codex App 真正的意义。

参考来源：