美团发布新AI模型,以“嵌入扩展”打破传统技术瓶颈

美团发布新AI模型,以“嵌入扩展”打破传统技术瓶颈

美团旗下LongCat团队今日发布全新大语言模型LongCat-Flash-Lite,其采用的“嵌入扩展”新范式,成功解决了传统混合专家模型在能力扩展时面临的边际收益递减与通信开销高昂的长期难题。

研究表明,相较于单纯增加专家数量,扩展模型嵌入层能在特定条件下实现更优的性能与效率平衡。基于此,LongCat-Flash-Lite虽拥有6850亿总参数,但通过创新的N-gram嵌入层设计,每次推理仅激活290亿至450亿参数。其中超过3000亿参数被高效分配至嵌入层,专注于捕获局部语义与细分场景知识,显著提升理解精度。

为实现理论优势,团队在系统层面进行了全链路优化,包括智能参数分配、定制专用缓存与融合计算内核,并应用推测解码技术。在典型负载下,其API能提供每秒500至700个token的极速生成能力,并支持长达256K的上下文。

在性能表现上,该模型在智能体任务、代码生成与通用能力多项基准测试中均展现出领先竞争力。例如,在终端命令执行基准测试中分数大幅超越同类模型。目前,美团已全面开源模型权重及相关技术,并通过开放平台为开发者提供每日5000万token的免费试用额度。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/745053.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论