400万周活Codex进手机:程序员出门喝咖啡,AI监工随时批代码

400万周活Codex进手机:程序员出门喝咖啡,AI监工随时批代码

OpenAI官方预告称,用户对这一功能期待已久。奥特曼也亲自发帖推荐:这就是ChatGPT移动应用中的Codex

400万周活Codex进手机:程序员出门喝咖啡,AI监工随时批代码

从此,开发者化身24小时AI监工:离开电脑,仍可通过手机查看进度、审查代码变更对比(diff)、批准命令,而智能体则在电脑、开发环境(devbox)或远程环境中持续运行。

400万周活Codex进手机:程序员出门喝咖啡,AI监工随时批代码

https://openai.com/index/work-with-codex-from-anywhere/

正如OpenAI官方博客所言,“你可以随时随地与Codex协作”:移动端Codex的推出,正是为了应对AI编程长时任务带来的新需求。

过去,编程是人坐在机器前输入指令的过程。如今,Codex每周有超过400万开发者使用,它处理的任务已长达数小时甚至数天。

智能体在运行,人在别处,异步审批正逐渐成为常态。当智能体遇到决策岔路口,需要人工判断时,你或许正在咖啡馆、通勤路上或开会中。这正是Codex移动端要解决的问题:让你在任何地方都能给智能体下达指令,使其继续推进任务。

手机是遥控器,开发环境始终在电脑中

许多人看到“Codex进手机”的第一反应是:以后能在手机上写代码了?

并非如此。

OpenAI的产品逻辑是这样的:Codex继续在你的电脑、Mac mini、公司开发环境(devbox)或远程开发环境中运行。文件、凭证、权限、本地配置等,并不会迁移到手机上。

400万周活Codex进手机:程序员出门喝咖啡,AI监工随时批代码

ChatGPT手机端菜单已出现Codex入口

手机端能做的,是作为控制面板:查看所有活跃线程、审查智能体的输出、批准它申请执行的命令、切换使用的模型、开启新任务。

同时,智能体的实时状态会推送到手机上,包括截图、终端输出、diff、测试结果以及需要人工介入的审批请求。

底层是一套安全中继层(secure relay layer),它让你的主机可以跨设备访问,但不直接暴露在公网上。

设置流程也相对直接:在macOS Codex App中开启远程访问,扫描二维码,ChatGPT手机App完成连接。

咖啡店、地铁、午餐桌、多任务监督:四个正在被改写的场景

场景一:咖啡店里审diff。

早上派下几个任务,到点检查进度,diff一目了然。某段改动方向不对,在手机上敲两句注释回复,智能体收到后立即调整。

开发者人不在工位,代码却未停下。一杯咖啡的时间,三个PR的进展全部回顾完毕,必要的反馈已发出。

场景二:通勤路上改方向。

智能体运行到一半卡在某个不熟悉的API上,主动向开发者发送问询。地铁里看一眼,回复“用X库的Y方法”,智能体拿到答案继续运行。

决策的颗粒度变细了:开发者不再亲自写代码,但持续校准方向。一段30分钟的通勤,原本是无法转化为产出的纯消耗时间,现在能消化两到三个智能体的关键决策点。

场景三:午餐时塞个新想法。

吃饭刷动态时冒出一个产品想法,掏出手机派给智能体“先做个原型出来”。等下午回工位,已有可看的提交记录在等待。从想法到代码的转化路径被压缩,原来需要一个晚上,现在缩短到一顿饭。

场景四:多任务并行监督。

同时有三四个智能体在不同任务上运行,开发者用手机切换审阅。工作方式从“一次写一个项目”转变为“一次监督一组工程”。一个人手里同时挂着四五条线,每条线都在推进。每个智能体独立工作,开发者只在关键节点出现。

四个场景指向同一件事:开发者的输入从“代码”变成了“判断”。

手机够用,是因为输入的内容本身就不需要键盘和大屏。两句注释、一个方法名、一个“继续”或“重做”,这些是手机最擅长的输入形态。

手机批代码,风险也需知晓

在手机上审批智能体任务,也可能带来更高的错误风险。

小屏幕、多任务场景下,注意力质量很难匹配开发决策的要求。

这并非小题大做。Codex在手机上等待批准的,往往不是普通操作:shell命令是否执行、两条重构路径走哪一条、一个权限申请是否批准。

这些判断在桌面IDE前可以放大窗口、对照上下文、反复确认。而在通勤途中,很可能只是瞥一眼、划一下。

OpenAI在安全设计上做了一些应对:Hooks支持扫描提示词中的敏感信息、运行命令验证器;企业用户有权限管理和审计日志;Codex默认沙箱运行,需要更高权限时会主动申请。

但工具的设计再完善,移动端审批本质上也是在把关键决策点搬进碎片化注意力的场景。

如何平衡便利性与严谨性之间的矛盾,仍是一个有待解决的问题。

开发者从踢球的人变成了场边教练

手机审批只是表象。

OpenAI在2月的Codex App发布中写过一句话:核心挑战已经从“智能体能做什么”,转变为“人如何在更大规模上指挥和监督智能体”。

手机端是这句话的一个落地,背后是整套工作流的重塑,有三层东西同时在被解构。

第一层:时间。

过去,开发者的产出很大程度上受限于在场时间:人离开键盘,代码推进也往往随之暂停。现在,Codex可以在主机、devbox或远程开发环境中持续运行,开发者不必始终守在屏幕前,只需在关键节点介入判断、审批和纠偏。

当一个开发者手里同时挂着多个智能体任务时,工作流的瓶颈会从“亲自敲代码”转向“拆解任务、判断方向、审查质量”。

这并不等于线性获得数倍人工编码时长,但确实会把原本容易空转的等待时间利用起来,也让单个开发者能够管理更多并行任务。

产能的天花板,正在被重新定义。

第二层:空间。

决策可以发生在任何有4G信号的地方。但空间被解构并不等于“程序员变自由了”,决策密度反而在上升:原来一天写6小时代码,现在每隔半小时就要回应一次智能体的问询。

开发者不被工位绑住,却被智能体的进度条绑住。智能体越能干、跑得越快,开发者需要做出判断的频次就越高。

第三层:注意力结构。

过去写代码要进入flow状态,连续输出几十分钟甚至几小时。现在的模式是碎片化决策:给智能体一段方向,等结果,再校准,再派下一步。

开发者从“亲自下场踢球的球员”变成了“场边的教练”。球员靠训练量堆能力,教练靠判断、经验、阅读比赛。两件事的核心能力并不相同。

这套新工作流中,受益最大的是三类人。

独立开发者:一个人也能并行四五个项目,资源杠杆被发挥到极致。精力上限的瓶颈被智能体打开,新的瓶颈转移到判断力和方向感。

小团队:将智能体当作低成本的“虚拟工程师”,三五个人加上一组智能体,能支撑起的业务量级在过去需要约20人的团队。

大厂工程师:从重复编码中抽出的精力,转而投入架构设计、跨团队对齐、代码审查等智能体尚不擅长的事务。资深工程师的价值被放大,初级工程师面临的挑战将更为现实。

开发者的能力门槛并未降低,只是技能权重发生了变化。

“写代码”在工作占比中的权重在下降,“定义任务、监督质量、判断方向”的权重在上升。

能够利用这套工作流跑出5倍产能的人,会比只会埋头写代码的人更有价值。

这一步棋,OpenAI已布局三个月

Codex的移动端并非突发动作。回顾来看,这是一条清晰的产品线。

2026年2月,OpenAI推出了Codex macOS App。官方当时的定位是“agent command center(智能体指挥中心)”,设计目标是管理多个智能体并行运行、处理长任务、支持diff审查和工作树隔离(worktree isolation),让不同智能体可以在同一个代码库的不同副本上工作而不互相干扰。

400万周活Codex进手机:程序员出门喝咖啡,AI监工随时批代码

2026年2月2日,OpenAI正式发布了Codex的macOS桌面应用。https://openai.com/zh-Hans-CN/index/introducing-the-codex-app/

同年3月,Codex应用推出了Windows版本。

到了4月,智能体获得了在桌面后台持续运行的能力。

5月初,OpenAI又推出了Codex Chrome扩展,使其能够在真实的浏览器会话中执行任务。

5月14日,移动端版本终于上线。

每一步都在不断扩展其控制范围:桌面应用是起点,跨系统支持是纵深,移动端是延伸的触角,而Chrome扩展则成为了感知能力。

此次发布也同步带来了企业级功能。

Remote SSH(远程SSH连接)正式进入通用可用状态(GA),Codex能够直接连接到企业的受管远程环境,访问其中的依赖库、凭证和安全策略。

Hooks功能也进入了GA阶段,支持扫描提示词中的敏感信息、运行验证器、记录会话日志,或针对特定代码仓库定制Codex的行为。

此外,还引入了程序化访问令牌(programmatic access token),可以从ChatGPT工作区设置中签发,用于CI流水线、发布工作流和内部自动化。同时,针对医疗机构,提供了HIPAA合规的本地环境支持。

目标用户群体已不再局限于个人开发者,Codex正朝着团队级和企业级工作流的方向迈进。

Anthropic先行,OpenAI追赶

Anthropic早在2月就完成了类似的功能,OpenAI这次是在快速补课。

2026年2月,也就是OpenAI推出Codex macOS应用的同一个月,Anthropic已经发布了Claude Code的Remote Control功能,允许用户从远程位置监控和介入Claude Code正在执行的任务。

据TechCrunch报道,这与OpenAI此次的Codex移动端方向高度相似。

这场竞争的焦点,已经从“谁的模型更擅长写代码”,转移到了“谁能锁定开发者的工作流入口”。

GitHub Copilot式的代码补全仅仅是一个功能,用完即走。

而Claude Code和Codex争夺的是另一个层面:开发者日常工作的调度中心。谁的工具能深入开发者的项目、线程、凭证和任务队列,谁就能在工作流中扎根。

5月13日,也就是Codex手机端发布的前一天,奥特曼宣布:任何切换到Codex的公司,可以获得两个月的免费使用,攻势直指Anthropic。

400万周活Codex进手机:程序员出门喝咖啡,AI监工随时批代码

时间点并非巧合。

更早之前,有报道指出Anthropic因需求持续攀升而上调了部分定价。OpenAI顺势打出补贴牌,攻势明显。

这是两家公司之间的一种惯常模式:Anthropic涨价,OpenAI降价。每一次都像是在问同一个问题:开发者,你最终会选择谁的工具?

这次Codex进入手机,是OpenAI与Claude Code Remote Control的一次正面对决。

AI编程的战场,已经从开发者的工位,燃烧到了口袋里。

参考资料:
https://x.com/OpenAI/status/2055016850849993072%20https://openai.com/index/work-with-codex-from-anywhere/%20https://openai.com/index/introducing-the-codex-app/%20https://www.axios.com/2026/05/14/openai-brings-codex-to-your-phone


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/34968

(0)
上一篇 7小时前
下一篇 7小时前

相关推荐

  • AI桌面革命!阿里QoderWork杀入Windows,19页PPT一键生成,告别文件整理地狱

    全球科技领域正被OpenClaw这类AI智能体(Agent)所改变。其核心能力在于能够直接读写本地文件、自主操控桌面应用,并将复杂任务拆解后自动执行。 短短4个月内,其在GitHub上的星标数飙升至25万以上,热度非凡。 与此同时,Anthropic也在同一赛道持续发力。上线仅两个月的Claude Cowork,近期推出了全行业插件与“定时任务”功能,旨在实…

    2026年3月4日
    1.6K00
  • 特斯拉FSD v14通过物理图灵测试:英伟达机器人主管亲测认证,自动驾驶迎来新里程碑

    特斯拉FSD v14,首个通过「物理图灵测试」的AI。 为特斯拉「颁发」这一殊荣的并非别人,而是英伟达大名鼎鼎的机器人主管——Jim Fan。 平安夜前夕,这位英伟达Project GR00T的领军人物,在亲眼看到自家特斯拉的一路自主护送自己回家后,大受震撼: 我入手特斯拉比较晚,但却是最早体验FSD v14的用户之一。这可能是我第一次真正感受到通过物理图灵…

    2025年12月26日
    43500
  • Claude Code 2.1.0重磅发布:1096次提交引爆AI编程革命,会话传送与多语言响应引领新浪潮

    如果你是 Claude Code 的用户,你可能会注意到,它最近有个重要的版本更新,从节前的 2.0.76 更新到了 2.1.0。 这次的更新日志,你得往下翻好几屏才能看完。 翻完这个日志,网友不淡定了,有的纳闷「是有个超级智能体在帮他们写代码吗」? 还有人调侃说「求求了,谁去跟他们说一下什么叫 rolling release(滚动更新)吧」「照这个速度,我…

    2026年1月9日
    43400
  • 2025年AI编码工具全景解析:从Cursor到Cline,八大助手如何重塑开发流程

    本指南深入解析当前最优秀的AI编码助手,并探讨一项正在解决AI访问实时数据局限性的关键技术:模型上下文协议(Model Context Protocol, MCP)。 总览 Cursor – 以AI为核心的代码编辑器,具备先进的上下文感知能力 GitHub Copilot – 行业领先的结对编程工具,与GitHub深度集成 Winds…

    2025年12月1日
    68000
  • OpenAI前CTO创企发布实时交互模型:200ms微回合,让AI边听边说边想

    AI交互告别“回合制”:200ms微回合,让模型边听边说边思考 AI的交互方式终于突破了“回合制”的桎梏。 Thinking Machines Lab(以下简称 TML)近日发布了其首个模型,将实时交互能力直接嵌入模型的原生架构中。 联合创始人翁荔亲自出镜演示,展示了这一颠覆性的变化:从传统的“人说完→AI答→人再说→AI再答”,进化为“人和AI可以随时插话…

    4天前
    35800