
近日,美团正式发布并开源其最新AI大模型LongCat-Flash-Chat,该模型以5600亿总参数和186亿至313亿激活参数的动态范围,实现了计算效率与性能的卓越平衡。其核心创新在于采用混合专家模型(MoE)架构,通过“零计算专家”机制,确保每个token仅激活必要参数,显著提升算力利用率。
在架构设计上,LongCat-Flash引入跨层通道技术,将训练和推理并行性最大化。仅用30天训练周期,该模型便在H800硬件上达到单用户每秒处理100个token的推理速度。训练过程中,PID控制器实时调整专家偏置,将激活参数稳定控制在270亿左右,进一步优化算力消耗。
智能体能力方面,模型通过自研Agentic评测集和多智能体数据生成策略,在复杂任务中表现突出。VitaBench基准测试中,其得分超越参数规模更大的竞品,位列第一。通用知识领域同样亮眼:ArenaHard-V2测试中排名第二(86.50分),MMLU和CEval分别取得89.71与90.44高分,彰显语言理解与中文处理的竞争力。
此次开源不仅为开发者提供研究与应用新工具,更以高效推理速度(如100 token/秒)和智能体性能树立技术标杆,推动AI生态的进一步发展。
原创文章,作者:聆听,如若转载,请注明出处:https://www.kejixun.co/article/732689.html