Claude 4系列怎么样？七小时连续编程创纪录‌

AI • 2025年5月23日 13:48:00 • AI

昨日，人工智能企业Anthropic正式发布Claude 4系列大模型，包含Opus 4与Sonnet 4双版本。那么Claude 4怎么样呢？下面就为大家详细介绍下。

据了解，Claude 4系列中Opus 4以连续7小时自主编程能力打破行业纪录，成为全球首个通过Rakuten高强度开源重构测试的AI模型。两款模型即日起通过Anthropic API、亚马逊Bedrock及谷歌Vertex AI开放商用，定价维持Opus系列百万tokens 15/75美元、Sonnet系列3/15美元标准。

作为性能旗舰，Opus 4在SWE-bench真实工程任务测试中准确率达72.5%，TerminalBench多步骤终端代码生成任务中实现43.2%准确率。该模型采用动态内存管理技术，可创建本地文件存储关键信息——实测运行《宝可梦红》时自动生成导航指南，使AI在长期任务中保持连贯性。GitHub已宣布采用Sonnet 4作为Copilot新版编码代理底层模型，其代码导航错误率从20%降至接近零，成为软件开发自动化的重要推手。

技术革新方面，Claude 4引入工具并行执行机制，允许AI在推理与网络搜索、API调用间自由切换，任务效率提升30%。开发者现可通过VS Code、JetBrains插件实现代码编辑内联显示，借助GitHub Actions执行后台任务，打造无缝编程体验。内存系统升级使模型”走捷径”行为减少65%，配合思维摘要功能压缩冗长推理链，保障复杂任务稳定性。

行业反响显示，Cursor评价Opus 4实现代码库理解能力质的飞跃，Replit验证其跨文件修改精度提升40%。Block开发者证实该模型在保持性能前提下提升代码质量，Cognition实验室则解决其他模型无法处理的53项关键操作遗漏。随着Claude Code SDK全面开放，这场AI生产力革命正从代码领域向科学研究、多模态应用加速渗透。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.co/article/720562.html

AI认证作者

0 0

新闻

Android安全负责人辞职，控诉谷歌“丧失道德底线”

据Business Insider周四报道，谷歌Android平台安全负责人、高级工程师René Mayrhofer已从公司离职。他在一封落款5月18日的内部告别信中直言，谷歌管理…

Android
5分钟前
商业

OpenAI收购云环境初创公司Ona，为编程助手Codex打造安全部署基石

OpenAI昨日宣布收购初创公司Ona，后者专注于为AI智能体提供安全、预配置的云环境。双方未披露交易金额，Ona团队将整体加入OpenAI并参与Codex项目研发。这项收购旨在帮…

野游栗
1天前
AI

阿里云发布Meoo CLI开源工具，一键打通本地AI编程到云端部署

针对本地AI编程项目上线繁琐的长期痛点，阿里云今日正式推出了一款名为Meoo（秒悟）的开源命令行工具Meoo CLI，旨在打通本地开发与云端部署之间的壁垒，帮助开发者快速将本地原型…

net
1天前
AI

塔塔咨询为5万员工部署Claude模型，加速企业级AI规模化落地

在人工智能深度赋能企业转型的浪潮中，科技咨询巨头塔塔咨询服务公司（TCS）日前宣布，已与AI厂商Anthropic达成全球战略合作伙伴关系，计划通过全面引入Claude大模型，加速…

AI
2天前
新闻

数据留存新规引发顾虑，微软限制内部员工使用Anthropic最强AI模型Claude Fable 5

Anthropic昨日推出旗下首款Mythos级人工智能模型Claude Fable 5，然而这款号称能力最强的模型很快在微软内部引发担忧。据The Verge报道，由于Anthr…

Microsoft
2天前
AI

OpenAI预计明年内上市，奥尔特曼称技术发展速度或影响IPO时机

据科技媒体The Information报道，萨姆·奥尔特曼在本周致员工的内部邮件中透露，OpenAI公司预计将在“明年内”上市，但具体时间表仍具有灵活性。此前，OpenAI已于6…

好奇宝宝
2天前
AI

安全顾虑过头了？Anthropic最强AI模型连细胞膜是什么都不肯回答

昨日推出了Claude Fable 5，宣称这是该公司面向大众开放的最强人工智能模型，并着重夸赞其在生物学等领域的能力。然而外媒测试发现，这款模型竟无法解答高中生应掌握的基础生物问…

小丸子
2天前
新闻

亚马逊升级购物搜索体验：AI图像生成器与按风格购物功能上线

随着人工智能技术在电商领域的渗透愈发深入，亚马逊近期通过一系列技术更新，进一步强化了其购物应用在视觉搜索和智能交互方面的能力，帮助消费者更高效地在海量商品中锁定心仪之选。回顾202…

校草
3天前
新闻

三星电子拟在韩国光州新建先进封装工厂，加码AI芯片产业链布局

据韩国经济日报援引业内消息人士报道，随着AI相关芯片需求持续爆发，三星电子正进一步强化自身产业链布局，计划在韩国光州建设一座先进半导体封装工厂。该投资计划有望于6月29日总统会谈期…

三星
4天前
AI

Anthropic推出两款Claude新模型，最强版本向公众开放

昨日（6月9日），人工智能公司Anthropic发布博文，宣布推出Claude Fable 5与Claude Mythos 5两款AI模型。其中，Claude Fable 5面向普…

AI
4天前
新闻

苹果WWDC26一文汇总：库克“最后一舞”，iOS 27携AI Siri登场

北京时间6月9日凌晨1点，苹果WWDC26全球开发者大会主题演讲如期举行。这不仅是苹果一年一度的系统盛宴，更是蒂姆·库克作为CEO主讲“最后一舞”——今年9月1日起，他将出任董事会…

NEWS
5天前
商业

日韩股市遭遇黑色星期一 AI板块重挫引泡沫担忧

6月8日，亚太市场迎来黑色星期一，日韩两大股指双双大幅收跌，其中日经225指数跌幅超过3%，韩国综合股价指数（KOSPI）则重挫近4%，而领跌的正是此前持续火爆的AI与半导体板块。…

商业头条
5天前
AI

国家安全部发布AI中转站风险提示：用户隐私泄露与数据倒卖问题频发

国家安全部今日发布安全提示指出，随着人工智能应用需求迅猛增长，批量提供海内外大模型访问服务的“AI中转站”在国内迅速走红，但当前市场鱼龙混杂，部分站点运营资质缺失、安全防护薄弱，用…

若安丶
5天前
AI

Anthropic 被曝雇 1000 名人类工程师训练 Claude Code，每项任务 280 美元

近日，据 Business Insider 消息，Anthropic 正通过一个由约 1000 名人类软件工程师参与的项目，提升 Claude Code 的性能。该项目在数据标注公…

校草
6天前
AI

苹果批准首个iMessage AI智能体，Poke可回邮件也能设提醒

据外媒Appleinsider昨日报道，苹果已批准Poke成为首个接入Apple Messages for Business平台的第三方AI智能体。Apple Messages f…

Apple
2026年6月5日
AI

Meta商务智能体全球上线，WhatsApp变身商家生产力工具

当地时间6月3日，Meta正式宣布旗下专为商家打造的客户支持AI机器人——现更名为“Meta商务智能体（Meta Business Agent）”，已在全球范围内的WhatsApp…

野游栗
2026年6月5日
AI

OpenAI发布Codex工作插件，六大岗位技能AI正式“上岗”

北京时间周三凌晨，人工智能巨头OpenAI举行了以“AI上岗”为主题的发布会，正式推出面向股票投资、创意设计等岗位的Codex工作流插件，让AI深度介入企业日常任务。面对竞争对手在…

好奇宝宝
2026年6月4日
AI

Anthropic 扩展最强“AI 抓虫”Claude Mythos 模型，三星等获准使用

6月3日，Anthropic发布公告，宣布扩展 Project Glasswing 安全计划，向全球 15 个国家和地区、约 200 家组织开放 Claude Mythos 模型。…

李森
2026年6月3日
AI

OpenAI扩展Codex使用场景，新增六款岗位插件覆盖62个应用

今日，OpenAI发布公告，宣布进一步拓展AI智能体助手Codex的使用场景，新增6个岗位插件，总计覆盖62个应用和110项技能。Codex最初服务于软件开发，如今周活跃用户已超过…

AI
2026年6月3日
AI

微软发布全天候AI助理Scout，深度整合365生态

在今日举行的Build 2026开发者大会上，微软正式推出名为“Microsoft Scout”的全天候AI助理产品。这款代号为“龙虾（OpenClaw）”的新工具与Outlook…

小科同学
2026年6月3日

发表回复

登录后才能评论

Claude 4系列怎么样？ 七小时连续编程创纪录‌

相关推荐

发表回复

Claude 4系列怎么样？七小时连续编程创纪录‌