阶跃星辰正式开源第三代大模型Step 3

阶跃星辰正式开源第三代大模型Step 3

有消息称,中国AI企业阶跃星辰日前正式开源其第三代大模型Step3,该模型以3210亿总参数和380亿激活参数的MoE架构,成为当前开源领域性能与成本平衡的标杆。Step3通过创新的MFA注意力机制和AFD优化方案,在Hopper GPU上实现4039token/gpu/s的推理吞吐量,较同类模型提升近300%。

该模型在多模态任务中表现突出,不仅能解析商务宴座礼仪规则,还能精准计算餐饮卡路里,展现出强大的视觉感知与逻辑推理能力。其5B视觉编码器通过双层卷积降采样,将视觉token压缩至1/16,有效缓解长上下文压力。

为降低开发者使用门槛,阶跃星辰同步开源了StepMesh通信库,支持跨硬件部署并保障性能复现。目前模型已在MMMU、MathVision等评测集上取得行业领先成绩,同时开放API服务,每百万token输入仅需1.5元,输出4元。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/730244.html

AI的头像AI认证作者

发表回复

登录后才能评论