浏览器与 Computer Use
22.1 从编程工具到超级 App
Section titled “22.1 从编程工具到超级 App”头条《Codex 保姆级项目实战教程》指出:
OpenAI 的 Codex 桌面端这段时间更新很猛,已经从一个纯 AI 编程工具进化成了支持 Computer Use、插件市场、内置浏览器的「超级 App」。
桌面 App 不再只是写代码,而是能操控电脑、跑浏览器、装插件。
22.2 内置浏览器(In-app browser)
Section titled “22.2 内置浏览器(In-app browser)”Codex 桌面 App 内置浏览器,可以:
- 打开网页做测试
- 验证前端改动效果
- 抓取网页内容
- 自动化浏览器操作
官方 best practices 提到 work trees、in-app browser 是 App 的特色功能。
- 前端开发:改完代码让 Codex 在浏览器里验证效果
- 测试:自动化点击、填表、截图
- 网页抓取:提取数据
22.3 Computer Use
Section titled “22.3 Computer Use”Computer Use 让 Codex 能操控你的电脑:
- 移动鼠标、点击
- 输入键盘
- 截屏识别
- 启动应用
这是从“写代码”到“执行任务”的跃迁——你可以让 Codex 完成需要 GUI 操作的任务。
- 涉及隐私与安全,Codex 会请求权限
- 建议在隔离环境(如单独的桌面、worktree)使用
- 敏感操作前会有审批(见第 9 章安全模型)
22.4 插件市场
Section titled “22.4 插件市场”Codex 桌面 App 提供插件市场,可安装扩展能力:
- 官方插件(如 codex-plugin-cc,与 Claude Code 互操作)
- 社区插件
- 自建插件(基于 Plugin 标准)
插件打包与发布见官方 Plugin build 文档。
22.5 实战场景
Section titled “22.5 实战场景”来自头条《Codex 零基础实战教程》15 种玩法:
- 文件清理:让 Codex 帮你整理混乱的下载目录
- 网站开发:从需求到代码到浏览器验证一条龙
- 浏览器操控:自动化网页任务
- 电脑控制:用自然语言指挥电脑做事
- 技能封装:把常用操作做成 Skill
- 定时任务:用 Automation 定期执行
22.6 桌面 App vs CLI
Section titled “22.6 桌面 App vs CLI”| 维度 | 桌面 App | CLI |
|---|---|---|
| 形态 | 图形界面 | 终端 |
| 浏览器 | ✅ 内置 | ❌ |
| Computer Use | ✅ | ❌ |
| 插件市场 | ✅ | 部分 |
| Automation | ✅ 可视化 | ❌ |
| 适合 | 综合任务、非纯代码 | 命令行用户、CI |
| 配置 | 共用 ~/.codex/config.toml | 同左 |
22.7 与 ChatGPT apps 集成
Section titled “22.7 与 ChatGPT apps 集成”CLI 下的 /apps 命令可以在 Codex 中直接使用 ChatGPT apps,把 ChatGPT 的能力引入 Codex 工作流。
- 头条《Codex 保姆级项目实战教程》——桌面 App 进化为超级 App
- 头条《Codex 零基础实战教程,带你速通 15 种玩法》——实战场景
- CSDN《Codex 零基础实战教程》——Computer Use、插件市场、内置浏览器
- 官方 best practices——in-app browser、work trees
- 官方 Plugin build 文档