现在,你等咖啡的时候,也能用来处理电脑上的工作了。
最近一个月,OpenAI 持续给 Codex 增加新的能力,先是桌面后台自主运行,实时展示状态、情绪价值拉满的桌面宠物,再是 Chrome 扩展进入浏览器实时对话。今天,Codex 又能连接上手机了。
OpenAI 宣布把 Codex 带到手机端,已集成进 ChatGPT App,iOS 和 Android 全量计划用户都可预览使用。
那些原本在电脑的 Codex 应用中才能进行的工作流,查看实时运行环境、审阅输出、批准命令、切换模型、发起新任务等,都可以在手机上就搞定。
我不是只能用来写代码
很多人听到 Codex 的第一印象,大概是一个专门面向开发者的应用,甚至可能是像 VS Code 那种单纯的本地开发环境,点开就是一脸懵的代码。
但其实现在的 Codex 可以说是 OpenAI 的一个 Agent 产品,它不仅能满足开发者的需求,即便是 ChatGPT 里的那些日常任务,简单的问答、使用 GPT Image 2 生图、初步的深度研究,用 Codex 也能做。
从 ChatGPT 官网顶部的左侧边栏,点击 Codex 进入介绍页面,不用被「连接到 GitHub」给吓到,还有上面的 CLI、什么 IDE 扩展程序,以及底部的终端之类的词语。
我们只需要下载应用,点击下载 macOS 版,像正常的应用安装程序一样。
打开 Codex,和网页版的 ChatGPT 布局基本一样,左边是不同的项目和单独的对话,右边是一个举重的对话框,我们可以输入问题或请求,选择不同的模型,直接发送给它。
例如直接要求它生成一张微信公众号的封面图片,然后在对话中进行修改。
或者对一份英文的播客文档,翻译成中英双语逐字稿,并且总结对应的播客内容。
这些原本通过 ChatGPT 完成的工作,在 Codex 上的使用体验一样不赖。
而 Skill、Computer Use、定时任务,这些其他 Agent 常见的功能,也可以通过斜线直接唤起不同的指令或使用对应的技能。
Codex 的插件页面,还提供了点开即用的方式,针对一些常用的技能,像前段时间刚刚更新的 Chrome 插件,以及几乎是所有本地 Agent 产品都在主打的 Computer Use。
切换到技能界面,Codex 会将本地安装的 Skill 都放在一个管理界面,我们能搜索、创建不同的技能。
一般情况下,如果要求 AI 处理的内容,以及有一个本地的文件夹,Codex 的做法是可以直接使用现有文件夹作为项目的上下文。
如果一个问题不足以构成一个项目,直接开启一个「新对话」,也不会影响 Codex 的表现。
也就是说,早期的 ChatGPT 交互更像是一个问答机,一问一答,几秒钟出结果。但现在 Agent 和 AI 工作流的发展,我们越来越多的任务变成了「长线任务」,此时 Codex 和各类 Agent 会是更好的选择。
不用连接到飞书微信,手机上就用 ChatGPT
年初龙虾刚爆火的时候,它能接入到各种各样的聊天软件里,企业微信、飞书、QQ,甚至微信都在推进,通过手机 APP 就能控制电脑上的龙虾。
远程控制成了电脑本地 Agent 一项必不可少的功能。尽管能接入到微信、飞书,但这些聊天软件还是有一个硬伤,它们没办法开启多线程,永远只有一个机器人的对话窗口。
Codex 的解决办法是在 ChatGPT 的 APP 内放下了完整的 Codex,但所有关于 Codex 的项目都不在手机上运行。
它跑在我们的电脑或者远程服务器上。手机是一个「控制面板」,我们可以用它查看进度、给指令、审批操作,但实际的代码读取、测试执行、文件修改,全都发生在本地的电脑上。
我们可以在手机上查看并进入不同的 Codex 项目/对话,在手机上进行的对话会自动同步到电脑 Codex 应用上,不会丢失任何项目的上下文。
开启 Codex 移动版也非常简单,桌面端的 Codex 应用和手机端的 ChatGPT 用同一个账号登录,打开 Codex 一般会有首页弹窗提醒我们配置,按照电脑上的提示,认证设备之后,就能连接上。
我们在桌面上开的任务线程,手机上现在都能直接看到,并且实时更新。
最简单的就是让它读取一下电脑上的文件,前提是已经让 Codex 获取了本地电脑里对应文件夹的权限。
能直接读取电脑上的文件
我们直接要他看看下载文件夹里,有些什么内容,并显示其中一张截图。
手机上也能让 Codex 使用 FFmpeg 库来处理多媒体文件
接着让他把视频加速处理转成只有 30s 的版本,它都能利用本地电脑的能力来进行处理。
对电脑上的本地文件处理是基本操作了,在 Agent 任务上,有了这项功能,我们可以随时查看任务进度。
和第三方聊天工具只发一个「状态:运行中」不同,在手机上,我们能看到真实的执行内容,终端输出、截图、测试结果、文件差异对比,电脑上能看到的那些,手机上都有。
之前我们说 Agent 能执行长任务很好,但是过一会儿就要去点一个「同意」、「继续」,现在通过手机端 ChatGPT,我们也能在关键节点给出指令,不需要用电脑响应。
如果这个弹窗未来可以上灵动岛,那就更方便了。收到通知的时候,ChatGPT App 直接在灵动岛显示 ✅ 或者 ❌。
处理响应这些需要我们决定的节点,我们还可以主动发起新任务。
在手机的 Codex 界面里,可以开新的线程,就像在桌面上一样。描述你想做什么,任务就开始在你的电脑上跑了。
不过,如果要创建一个新项目,使用新的文件夹,这里需要注意,不单是输入文件夹目录名,而是需要将完整的文件夹路径都写上去。
当项目新建之后,Codex 也会在我们的本地电脑上创建一个同名文件夹。
对个人用户来说,随时查看任务进度、在关键节点给出指令、以及主动发起这三项功能,基本上已经把桌面端 Codex 的能力搬到了手机上。
我们不需要等回到电脑面前,也不需要重开任务,直接在手机上的 Codex 对话里说,它就能同步调整并执行。
桌面端会同步对应的项目,同时快速实现了一个桌面小宠物的 APP
而针对更专业的开发者,OpenAI 还更新了远程控制的 Remote SSH,即 Codex 现在可以直接连到公司的远程开发环境。
很多公司的开发不是在本地做的,而是在一台配好了所有依赖、权限、凭证的远程服务器上。
以前 Codex 要在这种环境里工作,需要一些绕路的办法。现在 Remote SSH 正式可用,Codex 可以直接以 SSH 连接的方式在远程机器工作。
这段时间以来,OpenAI 在奋力追赶 Anthropic 在 Claude Code 方面的工作,而 Anthropic 则是不断从社区去找到灵感,把开发者社区里一些有意思的小功能不断变成自己的产品卖点。
随着功能和形态都越来越成熟,身边已经没有几个人在说要装龙虾了。
OpenAI 的 Codedx 和 Anthropic 的 Claude Code,就这样一点一点慢慢把「龙虾」有的能力复制过来,接下来就是看谁做出的产品体验更好了。
对我们来说,这确实是一件好事。开源项目有自己的优点,但商业化运营的产品始终要更稳定和易用。而在 Claude Code 和 Codex 之间的选择,大概率又会是 Claude Code 号被封,Codex 胜。
本文来自微信公众号“APPSO”,作者:发现明日产品的,36氪经授权发布。



