OpenAI最新报告：Codex取代ChatGPT，大神让「Agent团队」干活|投资界

Agent到底有没有真的改变工作？

OpenAI最新发布的一份报告《The Shift to Agentic AI: Evidence from Codex》，给出了目前最直接的一组数据。

这份报告由OpenAI、哥伦比亚商学院、沃顿商学院、杜克大学Fuqua商学院的研究者共同完成。

报告分析了OpenAI Codex的真实使用数据，比较了三类人群：个人账户用户、组织账户用户，以及OpenAI内部员工。

它不仅展示了OpenAI内部是如何*化使用Codex的，还会让人产生一种感受：

AI的使用方式正在经历一次静默的范式转移。

从和AI对话到让AI干活，从自己动手到管理一群AI员工，这个过程已经在发生，但大多数人还没意识到这件事已经在发生了。

01、Codex用户半年增长五倍，但采用不均衡

报告显示，2026年上半年，Codex的周活跃用户数增长超过5倍。

但在个人用户、组织用户、OpenAI内部员工之间，Codex的使用强度差异很大。

报告数据表明，过去28天内使用过Codex的活跃用户，个人用户中的比例只有0.7%，组织用户中的比例达到17.3%，OpenAI内部员工中达到97.9%。

也就是说，在普通个人用户中，Codex仍然是早期产品；在企业组织中，Codex已经开始扩散；但在OpenAI内部，它已经接近全面普及。

报告特别指出，在OpenAI内部，Codex已经基本替代ChatGPT，成为主要的工作AI界面。

因为OpenAI是一个异常有利的环境，员工熟悉前沿模型、使用成本低、组织支持度高、培训和非正式知识分享普遍。

尽管OpenAI的使用不代表今天的典型企业，但它展示了一个信号：

当所有的采用障碍都被移除后，Agent的使用会是什么样子。

02、Agent任务越来越难，输出越来越多

报告还分析了用户交给Codex任务的复杂度，并为测试设置了一个巧妙的问题：

如果没有AI，一个有经验的人类完成同样任务，需要多长时间？

结果很惊人。

2025年12月，只有35.4%的活跃个人用户，发送过至少一个需要1小时以上人工完成的任务。

到了2026年5月，这个比例翻倍到了70.2%。

更夸张的是需要8小时以上人工完成的任务，发送过这类任务的用户比例从2.1%，飙升到了25.6%，增长了10倍还多。

与此同时，产出也在暴涨。

2026年6月，OpenAI法律岗位的普通员工通过Codex和ChatGPT生成的月输出Token，比2025年11月增长了13倍，普通研究人员的增长更是超过了50倍。

报告还发现一个有趣的现象：

在Agent时代，用户从一开始就在委派最复杂的工作。用户先提出最宏大、最复杂的需求，后续的对话只是不断地细化和修正。

这跟传统的“先问简单问题、再逐步深入”的交互模式完全相反。

03、Codex早就不只是写代码了

虽然Codex最初是为软件开发设计的，但它的使用早已超出这个范围。

在Codex所有用户群体中，最常见的仍然是工程运维、代码实现、代码理解等软件相关任务。

但Codex也被广泛用于文档编写、数据分析、研究、协作沟通等非编码工作。

在OpenAI内部，Codex还被用于研究、规划、沟通、招聘、销售、产品工作和数据分析。

使用范围越广的组织，Agent的渗透越深，这似乎是一个自我强化的循环。

报告还比较了不同职能的使用差异。

在组织中，工程运维占大多数资历组输出Token的*份额，但知识工件类任务在管理人员和高管中占比更高。

在OpenAI内部，个体贡献者更偏向工程运维，而管理层更偏向协作类任务。

不同角色用Agent做不同的事，但所有人都在用。

04、最深度用户在“管理一群AI员工”

如果说普通用户还在用AI干活，那最前沿的用户已经在管一群AI员工干活了。

在OpenAI内部，只有10.7%的员工在同一时间只运行一个Agent，近30%的员工在某个时间点同时管理5个或以上的并发Agent。

报告描述这是一种“人类监督一支Agent团队”的工作方式，同时把任务分配给多个Agent，监控进度，选择性介入。

在外部，这种并行工作流还不普遍。

约67%的组织用户和64%的个人用户，完全不使用并发Agent。

但在OpenAI内部，这批最重度用户每天平均会让Codex累计运行约71小时。

比如，一个员工同时让3个Codex agents分别修bug、写测试、整理文档。如果这3个任务各自运行1小时，报告就会记为累计运行3小时。

报告显示，从2026年4月7日以来，OpenAI内部这批前1%重度用户的Codex累计每日运行时长，增长了近88%。

外部用户也在增长，但强度明显低得多。

在组织用户中，使用强度排在前1%的用户，每日运行时长增长约25%。

在个人用户中，前1%重度用户的每日运行时长增长约50%。

05、用户开始把工作流封装起来反复使用

一次性使用AI完成某个任务，跟把一套工作流封装好让AI反复执行，是两种完全不同的深度。

Codex通过“技能”（Skills）和“插件”来实现工作流的系统化，即把指令、软件和外部工具集成打包，可以反复调用，甚至跨用户、跨组织共享。

2026年3月1日，只有5.4%的活跃Codex用户调用过技能。到6月11日，这个比例达到了26.6%。

分群体看差距更明显：

25.7%的个人用户和30.4%的组织用户调用了技能，而在OpenAI内部，96.2%的活跃用户调用了至少一个技能。

报告特别提到，自定义技能的增长尤其快，就是那些用户或组织自己编写的、针对特定团队标准或工作流程的技能。

这是一次更深层的工作方式变革。

06、一旦组织下定决心，AI转型可以非常快

很多人以为，新技术总是从顶层先普及，但Codex的数据给出了相反的答案。

从职位来看，工程师是最早、最深地使用Codex的群体。

在组织用户中，普通工程师有26.8%的Token是在Codex上生成的，这一份额自年初以来增长了5倍。

数据和数据分析从业者紧随其后，达到15.2%。

但从资历来看，Codex的采用横跨了整个层级，从初级员工到高管都在用。

报告认为，高级用户用Codex不只是为了写代码，更多是为了规划、审查和委派任务。

有意思的是，在OpenAI内部，后来采用Codex的部门如：法务、招聘的转型速度，反而比早期采用的工程部门更快。

2026年1月时，这些部门的Codex使用率接近于零，到4月初达到约20%，一个月内就飙升至75%。

这表明，一旦组织下定决心，转型可以非常快。

07、最会造AI的人，也是把AI用得最狠的人

这份报告最核心的一个洞见是：

Agent的采用，不取决于模型有多强，而取决于组织环境有多支持。

同样的Codex，在个人、组织和OpenAI内部，呈现出完全不同的使用模式。

报告认为，决定因素包括：相关文件和系统的访问权限、管理层的期望、员工的技能水平、以及是否有配套的审查流程。

这跟历史上所有通用技术的扩散规律一致。

技术本身只是催化剂，真正的变革发生在组织如何围绕技术重新设计工作流程。

报告用了一个经典的类比：

19世纪末从蒸汽动力转向电力的过程中，早期工厂只是把蒸汽机换成电动机，工厂布局和工作流基本没变。

真正的生产力爆发，发生在几十年后工厂被重新设计、生产流程被彻底重构的时候。

Agent可能正在经历同样的过程。

当下的使用情况或许只是冰山一角，真正的变革还在后面。

资讯

7×24快讯

数据

会议

OpenAI最新报告：Codex取代ChatGPT，大神让「Agent团队」干活

世界模型工场

相关作者

世界模型工场

相关资讯

关于湖南省金芙蓉产业引导基金人工智能产业子基金管理机构的公示

杭州城投产业基金人工智能子基金招GP

中科创星张思申——人工智能时代的基础设施：光子产业的投资机遇

AI数据总览

最新资讯

创新药「站在猴子里」

专注于新能源汽车智能充放电，「领充新能源」完成数亿元C轮融资

良性合作凝聚服务力量，泰到位助力按摩技师释放专业价值

热门TOP5热门机构 | VC情报局