‌OpenAI发布最强编程模型GPT-5.1-Codex-Max：性能反超谷歌，支持“通宵”工作

AI • 2025年11月20日 10:54:00 • AI

近日，OpenAI正式推出新一代智能体编程模型‌GPT-5.1-Codex-Max‌，取代原有GPT-5.1-Codex成为Codex集成界面的默认模型。此次升级显著提升了长远推理能力、交互效率及实时性，并在多项基准测试中超越谷歌Gemini 3 Pro，引发AI开发领域广泛关注。

性能表现上，Codex-Max在关键编程测试中全面领先：‌SWE-Bench Verified‌（解决实际软件问题）准确率达77.9%，略高于Gemini的76.2%；‌Terminal-Bench 2.0‌测试中以58.1%对54.2%胜出；而在竞争激烈的‌LiveCodeBench Pro‌编码Elo测试中，两者得分持平（2439分）。这一成绩标志着OpenAI在AI编程领域的持续领先优势。

技术层面，Codex-Max引入了名为“‌压缩‌”（Compaction）的创新机制，可智能保留关键上下文并丢弃冗余细节，支持数百万token的连续工作而无性能衰减。得益于该技术，模型在内部测试中成功完成超过24小时的复杂任务（如多步骤代码重构），同时提升30%的token效率，降低延迟与成本。目前，该模型已集成至OpenAI的‌Codex CLI‌、内部代码审查工具等开发环境，支持强化学习训练等实时交互场景。

尽管能力强大，OpenAI仍强调Codex-Max是编码“助手”而非替代品。模型默认运行于沙盒环境，禁用网络访问，并生成详细日志供开发者验证。值得注意的是，普通用户需订阅‌ChatGPT Plus/Pro或企业版‌才能使用，公共API暂未开放。OpenAI透露，内部95%的工程师每周使用Codex，其采用后拉取请求量平均增加70%。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.co/article/739072.html

GPT-5.1-Codex-Max‌OpenAI

AI认证作者

0 0

商业

惠普与OpenAI达成战略合作，全面部署AI智能体平台Frontier加速企业转型

当地时间6月28日，惠普公司宣布与OpenAI达成战略合作，将在其全球业务中全面部署OpenAI Frontier平台，以推动惠普的转型与增长计划。根据双方协议，Frontier平…

商业头条
1天前
商业

OpenAI被曝或推迟IPO至明年，奥尔特曼坚守万亿美元估值底线

据《纽约时报》昨日援引三位内部人士消息，人工智能领域的领军企业OpenAI正考虑将首次公开募股（IPO）的时间表推迟至明年，这一动向引发市场广泛关注。此前曾有传闻称，OpenAI…

商业头条
4天前
AI

OpenAI 再次升级 GPT-5.5 Instant AI：更具洞察力，购物推荐更实用

6月25日，OpenAI 在 X 平台发布公告，宣布升级 GPT-5.5 Instant 模型，更能洞察用户表达意图，并在处理复杂任务时更可靠。 OpenAI 公司于 5 月 5 …

校草
5天前
AI

OpenAI发布首款AI芯片，号称媲美英伟达 Blackwell

6月25日，OpenAI 首次对外展示与博通联合设计的定制 AI 芯片 Jalapeño，希望通过自研芯片加快算力基础设施建设，并降低对英伟达 GPU 的依赖。 OpenAI、An…

科技观察者
5天前
AI

OpenAI ChatGPT 语音最大规模升级：双向 AI 语音模型 Bidi 1 已上线测试

6月25日，有报道称部分用户反馈在网页版、App 版 ChatGPT 应用中，发现了双向 AI 语音模型 Bidi 1 踪迹。在发布日期方面，OpenAI 官方暂未官宣，不过该媒体…

潮玩君
5天前
AI

OpenAI拿下三星超12万员工大单，创企业级AI部署规模纪录

OpenAI近日宣布与三星电子达成重磅合作，将向三星全球超过12万名员工提供ChatGPT企业版及Codex开发平台。这是OpenAI迄今为止签署的最大规模企业级部署合同，标志着A…

AI
2026年6月23日
AI

亚马逊在ChatGPT打广告引流，却严防AI爬虫抓取自家数据

美国电商巨头亚马逊近日被曝已开始在ChatGPT平台投放广告，成为入驻OpenAI新兴广告业务中最具分量的零售企业。用户在使用ChatGPT搜索商品时，对话列表下方会直接出现亚马逊…

李森
2026年6月23日
AI

OpenAI发布新路线图：人人拥有专属AGI助手

6月22日，据媒体报道，OpenAI公布了一项面向未来的长期蓝图，核心目标是将先进人工智能的便利带给全球数十亿用户。OpenAI明确表示，下一阶段研发重心将放在打造”个…

科技观察者
2026年6月22日
AI

Getty Images牵手OpenAI：图库内容将融入ChatGPT搜索体验

全球视觉内容巨头Getty Images日前宣布与OpenAI达成一项展示合作协议，标志着AI对话工具与正版视觉素材的融合再进一步。根据协议，Getty Images获得授权的海量…

AI
2026年6月22日
AI

谷歌Gemini联席负责人诺姆·沙泽尔离职加入OpenAI

当地时间6月18日，谷歌前工程副总裁、Gemini技术联席负责人诺姆·沙泽尔在社交媒体X上宣布离职，并将加入OpenAI。沙泽尔表示，离开谷歌是一个艰难决定，他为谷歌团队及共同取得…

Google
2026年6月21日
AI

OpenAI为ChatGPT推出全新定时任务功能，今日起逐步推送

OpenAI正为ChatGPT推出一项全新的定时任务功能，该功能从今日起面向Plus、Pro、商业版与企业版用户逐步推送。OpenAI表示，借助定时任务功能，用户可以让ChatGP…

野游栗
2026年6月18日
AI

OpenAI筹备推出GPT-Bidi-1双向音频模型，ChatGPT语音迎重大升级

据科技媒体testingcatalog报道，OpenAI正在筹备推出名为“GPT-Bidi-1”的下一代双向音频模型，这将成为ChatGPT语音模式自推出以来最大规模的升级。该模…

net
2026年6月18日
新闻

马斯克再遇挫：美法官驳回xAI指控OpenAI窃取商业机密诉讼

据路透社报道，美国联邦法官于当地时间周一驳回了埃隆·马斯克旗下人工智能企业xAI针对竞争对手OpenAI提起的诉讼。xAI指控OpenAI窃取其聊天机器人Grok相关的商业机密，但…

李小白
2026年6月16日
商业

OpenAI收购云环境初创公司Ona，为编程助手Codex打造安全部署基石

OpenAI昨日宣布收购初创公司Ona，后者专注于为AI智能体提供安全、预配置的云环境。双方未披露交易金额，Ona团队将整体加入OpenAI并参与Codex项目研发。这项收购旨在帮…

野游栗
2026年6月12日
AI

OpenAI预计明年内上市，奥尔特曼称技术发展速度或影响IPO时机

据科技媒体The Information报道，萨姆·奥尔特曼在本周致员工的内部邮件中透露，OpenAI公司预计将在“明年内”上市，但具体时间表仍具有灵活性。此前，OpenAI已于6…

好奇宝宝
2026年6月11日
新闻

OpenAI进入第三发展阶段：让AI普及、易用且安全

自ChatGPT将人工智能带入大众视野至今已有三年半，OpenAI首席执行官山姆·奥尔特曼日前宣布，企业已正式迈入第三发展阶段——让人工智能普及化、易用化且安全可靠。奥尔特曼与首…

泡沫大盗
2026年6月9日
商业

OpenAI提交S-1草案，为潜在IPO释放强烈信号

今日，OpenAI在其官方博客中宣布，已向美国证券交易委员会秘密递交了保密版S-1注册草案，这一举动被外界普遍解读为该公司正在为未来登陆公开资本市场做积极准备。 S-1文件是企业申…

秋秋
2026年6月9日
AI

OpenAI 被曝将对 ChatGPT 进行大升级，将其打造为超级应用

6月8日，据英国《金融时报》周日报道，OpenAI 计划对 ChatGPT 开展迄今为止规模最大的一次升级改造，打算将其打造为超级应用，新增代码开发工具与 AI 智能体功能，以期在…

潮玩君
2026年6月8日
AI

OpenAI升级ChatGPT记忆系统：算力降至五分之一，瞄准过时与错误两大痛点

OpenAI公司昨日（6月4日）宣布对ChatGPT的记忆功能进行重大升级，新系统基于Dreaming V3机制，重点解决了记忆过时、内容准确性不足以及大规模服务时的扩展压力问题，…

AI
2026年6月5日
AI

OpenAI发布Codex工作插件，六大岗位技能AI正式“上岗”

北京时间周三凌晨，人工智能巨头OpenAI举行了以“AI上岗”为主题的发布会，正式推出面向股票投资、创意设计等岗位的Codex工作流插件，让AI深度介入企业日常任务。面对竞争对手在…

好奇宝宝
2026年6月4日

发表回复

登录后才能评论

‌OpenAI发布最强编程模型GPT-5.1-Codex-Max：性能反超谷歌，支持“通宵”工作

相关推荐

发表回复