美团开源高效AI大模型LongCat-Flash-Chat 性能与算力平衡再突破

聆听 • 2025年9月2日 09:35:00 • AI

近日，美团正式发布并开源其最新AI大模型LongCat-Flash-Chat，该模型以5600亿总参数和186亿至313亿激活参数的动态范围，实现了计算效率与性能的卓越平衡。其核心创新在于采用混合专家模型（MoE）架构，通过“零计算专家”机制，确保每个token仅激活必要参数，显著提升算力利用率。

在架构设计上，LongCat-Flash引入跨层通道技术，将训练和推理并行性最大化。仅用30天训练周期，该模型便在H800硬件上达到单用户每秒处理100个token的推理速度。训练过程中，PID控制器实时调整专家偏置，将激活参数稳定控制在270亿左右，进一步优化算力消耗。

智能体能力方面，模型通过自研Agentic评测集和多智能体数据生成策略，在复杂任务中表现突出。VitaBench基准测试中，其得分超越参数规模更大的竞品，位列第一。通用知识领域同样亮眼：ArenaHard-V2测试中排名第二（86.50分），MMLU和CEval分别取得89.71与90.44高分，彰显语言理解与中文处理的竞争力。

此次开源不仅为开发者提供研究与应用新工具，更以高效推理速度（如100 token/秒）和智能体性能树立技术标杆，推动AI生态的进一步发展。

原创文章，作者：聆听，如若转载，请注明出处：https://www.kejixun.co/article/732689.html

聆听认证作者

0 0

AI

OpenRouter推出Fusion API复合模型服务多模型协同兼顾性能与成本

近日，知名AI模型聚合平台OpenRouter推出一项名为Fusion API的复合型模型服务，通过多模型协同的方式为用户提供兼具性能表现与成本效益的解决方案。该服务并非依赖单一模…

小丸子
22小时前
商业

DeepSeek完成逾70亿美元融资创始人梁文锋以特殊架构保持绝对控制权

据国外媒体报道，AI大模型独角兽DeepSeek（深度求索）日前以非常规交易架构顺利完成首轮逾70亿美元（约合500亿元人民币）融资，投后估值突破500亿美元大关。本轮融资的最大创…

商业头条
1天前
AI

豆包上线“任务模式”，从聊天助手向AI智能体进化

字节跳动旗下AI对话助手豆包近日正式推出“任务模式”入口，标志着这款产品正从单一的文本交互工具向具备复杂工作流处理能力的AI智能体演进。作为豆包功能拓展的重要一步，“任务模式”主打…

AI
2天前
AI

苹果或推AI智能体让Siri自主操作用户设备，古尔曼预测对标“OpenClaw”

彭博社知名记者马克·古尔曼近日预测，苹果公司最终可能推出一套能够代用户自主操作各类软件的智能体AI系统，直接对标业界关注的“OpenClaw”项目。古尔曼在其专栏《Power On…

Apple
2天前
AI

讯飞医疗发布星火大模型V3.5，AI医疗赛道迎来实用化转折

AI医疗行业的竞争逻辑正发生深刻变化。6月9日，讯飞医疗正式发布基于全国产算力底座训练的星火医疗大模型V3.5。与以往单纯追求参数规模的行业风向不同，这款新模型将目光锁定在临床诊疗…

AI
2天前
AI

高盛研报：市场低估AI需求，资本支出将远超预期

知名投行高盛近日发布行业研报指出，当前市场普遍低估了人工智能领域的发展需求，超大规模数据中心运营商的AI相关资本支出将大幅超出行业预期。数据显示，华尔街目前预估2027年相关资本支…

秋秋
3天前
新闻

谷歌CEO皮查伊斯坦福毕业演讲避谈AI，鼓励毕业生“选择乐观”

当地时间周日，谷歌首席执行官桑达尔·皮查伊在斯坦福大学毕业典礼上发表演讲。与近期其他科技领袖的毕业致辞不同，皮查伊对人工智能几乎只字未提，而是转而鼓励毕业生“选择乐观”。这一回避…

Google
3天前
新闻

Android安全负责人辞职，控诉谷歌“丧失道德底线”

据Business Insider周四报道，谷歌Android平台安全负责人、高级工程师René Mayrhofer已从公司离职。他在一封落款5月18日的内部告别信中直言，谷歌管理…

Android
3天前
商业

OpenAI收购云环境初创公司Ona，为编程助手Codex打造安全部署基石

OpenAI昨日宣布收购初创公司Ona，后者专注于为AI智能体提供安全、预配置的云环境。双方未披露交易金额，Ona团队将整体加入OpenAI并参与Codex项目研发。这项收购旨在帮…

野游栗
5天前
AI

阿里云发布Meoo CLI开源工具，一键打通本地AI编程到云端部署

针对本地AI编程项目上线繁琐的长期痛点，阿里云今日正式推出了一款名为Meoo（秒悟）的开源命令行工具Meoo CLI，旨在打通本地开发与云端部署之间的壁垒，帮助开发者快速将本地原型…

net
5天前
AI

塔塔咨询为5万员工部署Claude模型，加速企业级AI规模化落地

在人工智能深度赋能企业转型的浪潮中，科技咨询巨头塔塔咨询服务公司（TCS）日前宣布，已与AI厂商Anthropic达成全球战略合作伙伴关系，计划通过全面引入Claude大模型，加速…

AI
6天前
AI

OpenAI预计明年内上市，奥尔特曼称技术发展速度或影响IPO时机

据科技媒体The Information报道，萨姆·奥尔特曼在本周致员工的内部邮件中透露，OpenAI公司预计将在“明年内”上市，但具体时间表仍具有灵活性。此前，OpenAI已于6…

好奇宝宝
6天前
新闻

亚马逊升级购物搜索体验：AI图像生成器与按风格购物功能上线

随着人工智能技术在电商领域的渗透愈发深入，亚马逊近期通过一系列技术更新，进一步强化了其购物应用在视觉搜索和智能交互方面的能力，帮助消费者更高效地在海量商品中锁定心仪之选。回顾202…

校草
2026年6月10日
新闻

三星电子拟在韩国光州新建先进封装工厂，加码AI芯片产业链布局

据韩国经济日报援引业内消息人士报道，随着AI相关芯片需求持续爆发，三星电子正进一步强化自身产业链布局，计划在韩国光州建设一座先进半导体封装工厂。该投资计划有望于6月29日总统会谈期…

三星
2026年6月10日
AI

Anthropic推出两款Claude新模型，最强版本向公众开放

昨日（6月9日），人工智能公司Anthropic发布博文，宣布推出Claude Fable 5与Claude Mythos 5两款AI模型。其中，Claude Fable 5面向普…

AI
2026年6月10日
新闻

苹果WWDC26一文汇总：库克“最后一舞”，iOS 27携AI Siri登场

北京时间6月9日凌晨1点，苹果WWDC26全球开发者大会主题演讲如期举行。这不仅是苹果一年一度的系统盛宴，更是蒂姆·库克作为CEO主讲“最后一舞”——今年9月1日起，他将出任董事会…

NEWS
2026年6月9日
商业

日韩股市遭遇黑色星期一 AI板块重挫引泡沫担忧

6月8日，亚太市场迎来黑色星期一，日韩两大股指双双大幅收跌，其中日经225指数跌幅超过3%，韩国综合股价指数（KOSPI）则重挫近4%，而领跌的正是此前持续火爆的AI与半导体板块。…

商业头条
2026年6月9日
AI

国家安全部发布AI中转站风险提示：用户隐私泄露与数据倒卖问题频发

国家安全部今日发布安全提示指出，随着人工智能应用需求迅猛增长，批量提供海内外大模型访问服务的“AI中转站”在国内迅速走红，但当前市场鱼龙混杂，部分站点运营资质缺失、安全防护薄弱，用…

若安丶
2026年6月8日
AI

苹果批准首个iMessage AI智能体，Poke可回邮件也能设提醒

据外媒Appleinsider昨日报道，苹果已批准Poke成为首个接入Apple Messages for Business平台的第三方AI智能体。Apple Messages f…

Apple
2026年6月5日
AI

Meta商务智能体全球上线，WhatsApp变身商家生产力工具

当地时间6月3日，Meta正式宣布旗下专为商家打造的客户支持AI机器人——现更名为“Meta商务智能体（Meta Business Agent）”，已在全球范围内的WhatsApp…

野游栗
2026年6月5日

发表回复

登录后才能评论

美团开源高效AI大模型LongCat-Flash-Chat 性能与算力平衡再突破

相关推荐

发表回复