Agent到底有没有真的改变工作?
OpenAI最新发布的一份报告《The Shift to Agentic AI: Evidence from Codex》,给出了目前最直接的一组数据。
这份报告由OpenAI、哥伦比亚商学院、沃顿商学院、杜克大学Fuqua商学院的研究者共同完成。
报告分析了OpenAI Codex的真实使用数据,比较了三类人群:个人账户用户、组织账户用户,以及OpenAI内部员工。
它不仅展示了OpenAI内部是如何*化使用Codex的,还会让人产生一种感受:
AI的使用方式正在经历一次静默的范式转移。
从和AI对话到让AI干活,从自己动手到管理一群AI员工,这个过程已经在发生,但大多数人还没意识到这件事已经在发生了。
01、Codex用户半年增长五倍,但采用不均衡
报告显示,2026年上半年,Codex的周活跃用户数增长超过5倍。
但在个人用户、组织用户、OpenAI内部员工之间,Codex的使用强度差异很大。
报告数据表明,过去28天内使用过Codex的活跃用户,个人用户中的比例只有0.7%,组织用户中的比例达到17.3%,OpenAI内部员工中达到97.9%。
也就是说,在普通个人用户中,Codex仍然是早期产品;在企业组织中,Codex已经开始扩散;但在OpenAI内部,它已经接近全面普及。
报告特别指出,在OpenAI内部,Codex已经基本替代ChatGPT,成为主要的工作AI界面。
因为OpenAI是一个异常有利的环境,员工熟悉前沿模型、使用成本低、组织支持度高、培训和非正式知识分享普遍。
尽管OpenAI的使用不代表今天的典型企业,但它展示了一个信号:
当所有的采用障碍都被移除后,Agent的使用会是什么样子。
02、Agent任务越来越难,输出越来越多
报告还分析了用户交给Codex任务的复杂度,并为测试设置了一个巧妙的问题:
如果没有AI,一个有经验的人类完成同样任务,需要多长时间?
结果很惊人。
2025年12月,只有35.4%的活跃个人用户,发送过至少一个需要1小时以上人工完成的任务。
到了2026年5月,这个比例翻倍到了70.2%。
更夸张的是需要8小时以上人工完成的任务,发送过这类任务的用户比例从2.1%,飙升到了25.6%,增长了10倍还多。
与此同时,产出也在暴涨。
2026年6月,OpenAI法律岗位的普通员工通过Codex和ChatGPT生成的月输出Token,比2025年11月增长了13倍,普通研究人员的增长更是超过了50倍。
报告还发现一个有趣的现象:
在Agent时代,用户从一开始就在委派最复杂的工作。用户先提出最宏大、最复杂的需求,后续的对话只是不断地细化和修正。
这跟传统的“先问简单问题、再逐步深入”的交互模式完全相反。
03、Codex早就不只是写代码了
虽然Codex最初是为软件开发设计的,但它的使用早已超出这个范围。
在Codex所有用户群体中,最常见的仍然是工程运维、代码实现、代码理解等软件相关任务。
但Codex也被广泛用于文档编写、数据分析、研究、协作沟通等非编码工作。
在OpenAI内部,Codex还被用于研究、规划、沟通、招聘、销售、产品工作和数据分析。
使用范围越广的组织,Agent的渗透越深,这似乎是一个自我强化的循环。
报告还比较了不同职能的使用差异。
在组织中,工程运维占大多数资历组输出Token的*份额,但知识工件类任务在管理人员和高管中占比更高。
在OpenAI内部,个体贡献者更偏向工程运维,而管理层更偏向协作类任务。
不同角色用Agent做不同的事,但所有人都在用。
04、最深度用户在“管理一群AI员工”
如果说普通用户还在用AI干活,那最前沿的用户已经在管一群AI员工干活了。
在OpenAI内部,只有10.7%的员工在同一时间只运行一个Agent,近30%的员工在某个时间点同时管理5个或以上的并发Agent。
报告描述这是一种“人类监督一支Agent团队”的工作方式,同时把任务分配给多个Agent,监控进度,选择性介入。
在外部,这种并行工作流还不普遍。
约67%的组织用户和64%的个人用户,完全不使用并发Agent。
但在OpenAI内部,这批最重度用户每天平均会让Codex累计运行约71小时。
比如,一个员工同时让3个Codex agents分别修bug、写测试、整理文档。如果这3个任务各自运行1小时,报告就会记为累计运行3小时。
报告显示,从2026年4月7日以来,OpenAI内部这批前1%重度用户的Codex累计每日运行时长,增长了近88%。
外部用户也在增长,但强度明显低得多。
在组织用户中,使用强度排在前1%的用户,每日运行时长增长约25%。
在个人用户中,前1%重度用户的每日运行时长增长约50%。
05、用户开始把工作流封装起来反复使用
一次性使用AI完成某个任务,跟把一套工作流封装好让AI反复执行,是两种完全不同的深度。
Codex通过“技能”(Skills)和“插件”来实现工作流的系统化,即把指令、软件和外部工具集成打包,可以反复调用,甚至跨用户、跨组织共享。
2026年3月1日,只有5.4%的活跃Codex用户调用过技能。到6月11日,这个比例达到了26.6%。
分群体看差距更明显:
25.7%的个人用户和30.4%的组织用户调用了技能,而在OpenAI内部,96.2%的活跃用户调用了至少一个技能。
报告特别提到,自定义技能的增长尤其快,就是那些用户或组织自己编写的、针对特定团队标准或工作流程的技能。
这是一次更深层的工作方式变革。
06、一旦组织下定决心,AI转型可以非常快
很多人以为,新技术总是从顶层先普及,但Codex的数据给出了相反的答案。
从职位来看,工程师是最早、最深地使用Codex的群体。
在组织用户中,普通工程师有26.8%的Token是在Codex上生成的,这一份额自年初以来增长了5倍。
数据和数据分析从业者紧随其后,达到15.2%。
但从资历来看,Codex的采用横跨了整个层级,从初级员工到高管都在用。
报告认为,高级用户用Codex不只是为了写代码,更多是为了规划、审查和委派任务。
有意思的是,在OpenAI内部,后来采用Codex的部门如:法务、招聘的转型速度,反而比早期采用的工程部门更快。
2026年1月时,这些部门的Codex使用率接近于零,到4月初达到约20%,一个月内就飙升至75%。
这表明,一旦组织下定决心,转型可以非常快。
07、最会造AI的人,也是把AI用得最狠的人
这份报告最核心的一个洞见是:
Agent的采用,不取决于模型有多强,而取决于组织环境有多支持。
同样的Codex,在个人、组织和OpenAI内部,呈现出完全不同的使用模式。
报告认为,决定因素包括:相关文件和系统的访问权限、管理层的期望、员工的技能水平、以及是否有配套的审查流程。
这跟历史上所有通用技术的扩散规律一致。
技术本身只是催化剂,真正的变革发生在组织如何围绕技术重新设计工作流程。
报告用了一个经典的类比:
19世纪末从蒸汽动力转向电力的过程中,早期工厂只是把蒸汽机换成电动机,工厂布局和 工作流基本没变。
真正的生产力爆发,发生在几十年后工厂被重新设计、生产流程被彻底重构的时候。
Agent可能正在经历同样的过程。
当下的使用情况或许只是冰山一角,真正的变革还在后面。
【免责声明】:本文不构成任何投资建议。市场有风险,投资需谨慎。
如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。










