‌OpenAI GPT-5.2被曝作弊：算力堆砌下的虚假胜利？

AI • 2025年12月14日 12:27:00 • AI

‌OpenAI GPT-5.2被曝作弊：算力堆砌下的虚假胜利？

科技圈的戏剧性反转来得猝不及防。近日还在为OpenAI发布GPT-5.2的”碾压性表现”欢呼的AI社区，却被一则爆料推入争议漩涡——有用户指出，OpenAI在基准测试中可能通过大幅增加模型”推理力度”参数（即token消耗量），为GPT-5.2创造了不公平的算力优势。

问题的核心在于对比数据：在ARC AGI 2测试中，GPT-5.2 xhigh版以13.5万token/任务的消耗（成本约1.9美元）获得52.9%的得分，而Gemini 3.0 Pro仅用6.7万token便达到相近成绩。这种差异被比作”棋手对弈时一方获一小时思考，另一方仅十分钟”的荒谬竞赛。更值得注意的是，当算力投入标准化后，两者在HLE、MMMU-Pro等多项测试中表现趋同，仅在OpenAI自建的GDPVal测试集中存在显著差异——这一”既当裁判又当运动员”的行为，进一步削弱了结果的公信力。

这场风波暴露出AI评测领域的深层矛盾：性能提升究竟源于技术突破，还是资源堆砌？GPT-5.2在Frontier Math Tier 3中仅领先Gemini 3 Pro 2.7%的成绩，却消耗了双倍算力，其”高效”标签已然存疑。随着质疑发酵，OpenAI尚未回应，但这场争议已为行业敲响警钟：若放任算力竞赛扭曲评测标准，AI发展的天平或将滑向资本而非创新。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.co/article/740962.html

0 0

AI

OpenAI升级计费系统，用“信用点数”为AI服务续跑

人工智能领域的领军企业OpenAI日前宣布，已为其Codex和Sora等产品引入了一套全新的计费引擎。这套系统最大的亮点在于引入了“信用点数”机制，当用户触达传统的速率限制时，系统…

AI
22小时前
AI

OpenAI与Cerebras联合发布实时编程模型Codex-Spark 每秒千token即时反馈

当地时间2月12日，OpenAI与算力硬件公司Cerebras共同宣布推出GPT-5.3-Codex-Spark模型，主打实时编程场景。这是双方合作以来首个公开发布成果，模型由Ce…

AI
2天前
AI

OpenAI升级ChatGPT研究工具，新增全屏浏览与精准溯源功能

今日，OpenAI宣布为其AI助手ChatGPT的深度研究工具推出重要更新，该功能现由更强大的GPT-5.2模型驱动，并新增了全屏查看器等实用特性，旨在提升用户进行深度信息检索与报…

AI
4天前
AI

OpenAI在美测试广告功能，免费及低价用户将看到广告

当地时间周一，OpenAI正式宣布开始在美国面向免费用户及新推出的低价Go订阅用户测试广告功能。Go套餐定价为每月8美元，已于今年1月在全球上线。公司强调，所有付费订阅用户，包括P…

AI
5天前
AI

OpenAI否认在超级碗泄露硬件产品视频

随着美国“超级碗”赛事结束，科技圈却因一则关于OpenAI的传言泛起涟漪。近日，一位自称OpenAI员工的网友在Reddit平台发帖称，公司原计划在赛事期间投放广告却未能播出，并随…

小丸子
5天前
AI

OpenAI发布GPT-5.3-Codex，称其为迄今最强AI编程模型

2月6日，OpenAI宣布推出新一代AI编程模型GPT-5.3-Codex，公司宣称这是其迄今为止最强大的智能体编程模型。该模型在多项基准测试中表现突出，不仅在编程任务上刷新纪录，…

科技探索者
2026年2月6日
新闻

AI巨头公开互怼超级碗广告引发行业争执

当地时间周三，OpenAI首席执行官萨姆·奥尔特曼在社交平台公开抨击竞争对手Anthropic的超级碗广告“包含明显不实信息”，称其使用“含糊其辞的双面话术”。此次争议源于Ant…

聆听
2026年2月5日
AI

OpenAI组建新团队为ChatGPT广告业务铺路

据外媒报道，OpenAI正在组建专门的广告诚信团队，以保障其即将推出的ChatGPT广告功能的用户体验与品牌安全。招聘信息显示，该团队将从零起步，负责设计相关系统，在拓展广告业务的…

AI
2026年2月5日
AI

OpenAI高薪挖角竞争对手安全专家

人工智能领域的顶尖公司正不惜重金争夺关键人才。当地时间本周二，OpenAI首席执行官萨姆·奥尔特曼在社交平台X上宣布，其公司已正式任命迪伦·斯堪的纳罗为安全防范负责人。值得注意的是…

happy
2026年2月4日
AI

消息称OpenAI指控xAI故意销毁诉讼证据

在xAI起诉OpenAI涉嫌垄断的案件中，OpenAI发起强力反击，于当地时间周一提交法庭文件，指控埃隆·马斯克旗下的人工智能公司“系统性、故意销毁案件证据”。OpenAI指出，x…

李小白
2026年2月3日
AI

OpenAI发布macOS版Codex应用加速智能体化编程竞争

人工智能正深刻改变软件开发。当地时间本周一，OpenAI正式推出了适配macOS系统的Codex桌面应用，旨在整合当前流行的智能体化开发逻辑，直接与Claude Code等竞争对手…

AI
2026年2月3日
AI

英伟达否认千亿美元投资承诺与OpenAI合作前景生变

近日，英伟达CEO黄仁勋明确表态，公司对OpenAI高达1000亿美元的投资“从未是一项正式承诺”。他澄清，英伟达更倾向于采取“循序渐进”的投入方式，而非一次性巨额注资。此前，Op…

校草
2026年2月2日
AI

OpenAI揭秘内部GPT-5.2分析工具，支持自然语言处理超600PB数据

OpenAI日前通过官方博文，首次向外界详细揭秘了其内部使用的AI数据分析工具。这款完全定制化的系统基于GPT-5.2构建，能够解析超过600PB的庞大数据，并允许员工使用直观的自…

AI
2026年2月1日
商业

黄仁勋确认投资OpenAI，金额远低于千亿美元预期

英伟达公司首席执行官黄仁勋昨日证实，他将参与人工智能公司OpenAI当前的融资轮。尽管他未透露具体投资数额，但明确表示金额“远不及”此前市场传闻的1000亿美元。这一表态澄清了近期…

商业头条
2026年2月1日
商业

重磅！亚马逊拟投500亿美元押注OpenAI

据《华尔街日报》报道，亚马逊正与OpenAI进行深入谈判，考虑向其投资高达500亿美元。若交易达成，这将成为亚马逊在人工智能领域规模空前的押注，也有望使其成为OpenAI本轮高达1…

商业头条
2026年1月30日
商业

消息称OpenAI最快四季度启动IPO，估值或达5000亿美元

据《华尔街日报》援引知情人士消息，OpenAI正加速推进上市进程，计划最早于今年第四季度启动首次公开募股。目前估值约5000亿美元的OpenAI已开始与华尔街投行进行非正式接触，并…

聆听
2026年1月30日
AI

OpenAI宣布将正式停用GPT-4o等多款旧模型

OpenAI于周四宣布，将从下个月起在ChatGPT中停用包括GPT-4o在内的多款旧模型。此举标志着曾以亲切对话风格备受部分付费用户喜爱的GPT-4o，将正式结束其服务周期。此…

AI
2026年1月30日
新闻

OpenAI首席信息安全官马特·奈特宣布离职

人工智能巨头OpenAI的关键安全岗位发生人事变动。北京时间1月27日，公司副总裁兼首席信息安全官（CISO）马特·奈特通过社交平台宣布，他将辞去已任职超过五年的职务。奈特在告别…

柠萌
2026年1月28日
AI

OpenAI与思科深度合作，AI编码助手落地企业开发

OpenAI近日宣布与全球网络巨头思科达成深度合作，将其先进的编码AI模型Codex深度融入思科的企业软件开发流程，旨在显著提升开发与维护效率。Codex能够理解自然语言指令、生成…

AI
2026年1月22日
AI

OpenAI为ChatGPT上线“年龄预测”功能，强化青少年保护

近日，OpenAI官方宣布，将在消费级ChatGPT中部署全新的“年龄预测”模型，旨在自动识别未成年人用户并施以针对性保护，以确保其在安全范围内探索AI技术。该模型并非简单依赖用…

AI
2026年1月21日

发表回复

登录后才能评论