跳到主内容
✍️ 公众号文章
经/管/金融人
学生

OpenAI Codex App:从「写代码的 AI」到「用代码完成工作的 AI」

OpenAI 发布 Codex 桌面应用,Agent 从写代码升级为用代码完成工作;支持多 Agent 并行、Skills 扩展工具能力、后台自动化与默认隔离的安全模型,重新定义软件构建门槛。

李学恒4 分钟阅读#openai-codex#ai-agent#multi-agent#skills#automation

摘要:OpenAI 发布 Codex 桌面应用,将 Agent 从「代码生成器」升级为「工作执行器」;Skills 系统让 AI 可以操作 Figma、Linear、云服务等工具;700 万 tokens 构建一个完整赛车游戏。本文解读 Agent 工作方式的根本性转变,以及 Codex App 如何重新定义**「谁能构建软件」**。

封面图

从 Copilot 到 Agent:范式转移已经发生

2025 年 4 月,OpenAI 发布了 Codex。2026 年 2 月,他们发布了 Codex 桌面应用。

这不是一个普通的版本更新。

如果说之前的 Codex 是一个「会写代码的助手」,那么现在的 Codex App 更像是一个「能独立工作的员工」。区别在哪里?助手等你下指令,员工能自己跑完整个流程。

OpenAI 在官方博客中说得很直接:

Codex is evolving from an agent that writes code into one that uses code to get work done on your computer.

这句话的深层含义是:代码不再是目的,而是手段。 Agent 写代码不是为了让你看代码,而是为了用代码完成你真正想做的事——设计、部署、测试、运维,甚至写文档。

核心能力:多 Agent 协调作战

Codex App 最显眼的变化是它的定位——Agent 指挥中心(Command Center for Agents)

这里的「多 Agent」不是营销话术。在实际使用中,你可以:

  1. 同时运行多个 Agent,每个处理不同任务
  2. 按项目组织线程,随时切换上下文而不丢失进度
  3. 并行探索多个方案,比较不同路径的效果

技术上,这依赖一个关键特性:内置 worktrees 支持

Git worktrees 是什么?简单说,它允许你在同一个仓库中同时拥有多个工作目录,每个目录可以处于不同的分支状态。Codex App 利用这个机制,让每个 Agent 在隔离的代码副本上工作,互不干扰。

这解决了一个实际问题:以前让 AI 改代码,你得小心翼翼,因为它的修改直接影响你的本地状态。现在,Agent 在自己的空间里折腾,你可以在它工作时继续做自己的事,等它完成了再决定是否合并。

Skills:让 Agent 学会使用工具

如果说多 Agent 协调是「量」的变化,Skills 系统就是**「质」的飞跃**。

Skills 是什么?

Skills 是打包好的指令、资源和脚本,让 Codex 能够连接工具、运行工作流、按照团队偏好完成任务。

目前开源的 Skills 库涵盖:

类别Skills能力
设计实现Figma获取设计稿并转换为 1:1 还原的 UI 代码
项目管理Linear分类 bug、跟踪发布、管理团队工作量
云部署Cloudflare, Vercel, Netlify, Render将 Web 应用部署到主流云平台
图像生成GPT Image创建和编辑网站、UI 原型、产品素材
文档处理PDF, Spreadsheet, Docx读取、创建和编辑专业文档

关键的不是这些具体功能,而是这个架构的含义:Agent 的能力边界从此变成可扩展的。

以前,一个 AI 工具能做什么,取决于开发者写了什么功能。现在,你可以通过添加 Skills 让 Agent 学会新技能,就像给员工做培训

而且 Skills 可以检入代码仓库,整个团队共享。团队 A 开发了一个好用的 Skill,团队 B 可以直接用。

700 万 Tokens 的赛车游戏

OpenAI 在发布会上展示了一个案例:用一个 prompt 让 Codex 构建了一个完整的赛车游戏。

这个游戏包含:

  • 不同的赛车手角色
  • 8 张地图
  • 可使用道具(空格键触发)

整个过程中,Codex 消耗了超过 700 万 tokens。它同时扮演了三个角色:设计师、游戏开发者、QA 测试员——最后这个角色意味着它真的玩了自己做的游戏来验证功能

这个案例说明几件事:

  1. 长任务执行能力成熟了。700 万 tokens 不是一个小数字,这意味着 Agent 可以在一个复杂项目上持续工作数小时甚至数天
  2. 自主决策链条变长了。不是「你告诉我做什么我就做什么」,而是**「你告诉我目标,我自己规划、执行、验证」**
  3. 技术门槛的变化。理论上,任何能清晰描述需求的人,都可以「构建」一个游戏

Automations:让 Agent 在后台持续工作

Codex App 引入了一个新概念:Automations(自动化)

你可以设置定时任务,让 Agent 在后台自动执行重复性工作:

  • 每日问题分类
  • CI 失败监控和摘要
  • 每日发布简报
  • Bug 检测巡查

工作完成后,结果进入审阅队列。你可以选择直接采纳,也可以接手继续处理。

这让 Agent 从「调用型工具」变成了「常驻型助手」。不是你需要它时才启动,而是它一直在工作,你只需要定期检查结果。

安全机制:默认隔离,可控放权

Agent 能力越大,安全问题就越重要。

Codex App 的安全模型是:默认隔离,显式授权

具体来说:

  • Agent 默认只能编辑它所在的文件夹或分支
  • 只能使用缓存的网络搜索
  • 需要网络访问等高级权限时,会请求用户授权
  • 团队可以配置规则,让某些命令自动获得权限

这个设计平衡了安全性和便利性。对于敏感操作,Agent 会主动确认;对于日常操作,可以通过规则自动化。

定价与可用性

Codex App 目前支持 macOS(Windows 版本即将推出)。

订阅类型使用方式
Plus, Pro, Business, Enterprise, Edu正式使用,限时双倍配额
Free, Go限时开放试用

一个细节:Codex 的使用包含在 ChatGPT 订阅中,但可以额外购买积分。这说明 OpenAI 预期用户对 Agent 的使用量会远超普通聊天。

这意味着什么

Codex App 的发布标志着一个转变:AI 开发工具从「辅助编程」进入「工作执行」阶段。

对开发者来说,这意味着:

  • 工作方式从**「写代码」变成「指挥 Agent 写代码」**
  • 能够同时推进多个任务,而不是串行处理
  • 重复性工作可以完全自动化

对非开发者来说,这意味着:

  • 技术门槛降低,会描述需求就能构建软件
  • 但这不意味着「人人都是程序员」——你仍然需要理解需求、评估结果、做出决策

对整个行业来说,这意味着:

  • 软件开发的效率边界正在被重新定义
  • 「能写代码」不再是稀缺技能,「能指挥 Agent」成为新的能力要求

写在最后

OpenAI 博客中有一句话值得记住:

Codex is built on a simple premise: everything is controlled by code.

如果一切都可以用代码控制,而 Agent 越来越擅长生成和执行代码,那么 Agent 的能力边界就等同于代码的能力边界——理论上,这是无限的。

当然,从理论可能到实际可用还有距离。目前的 Codex 仍然需要人类监督、确认和纠错。但方向已经明确:Agent 不是替代人类写代码,而是替代人类做那些可以用代码完成的事。

这才是 Codex App 真正的意义。


参考来源:

related