
昨日,中科曙光国家先进计算产业创新中心有限公司发布消息,海光信息技术团队成功完成DeepSeek V3和R1模型与海光DCU(深度计算单元)的国产化适配工作,且相关模型已正式上线。
这一成果意义非凡。DeepSeek V3和R1模型基于Transformer架构,采用Multi – Head Latent Attention(MLA)和DeepSeek MoE两大核心技术。MLA能减少KV缓存,大幅降低内存占用,提升推理效率;DeepSeek MoE则借助辅助损失实现专家负载的智能平衡,优化模型性能。
对于广大用户而言,如今在“光合开发者社区”的“光源”板块,或者登录光源官网搜索“DeepSeek”,便可访问、下载相关模型,并基于DCU平台进行部署和使用。
值得一提的是,DCU是海光信息推出的高性能GPGPU架构AI加速卡,为行业客户提供自主可控的全精度通用AI加速计算方案,目前已在科教、金融等多领域实现规模化应用。此次DeepSeek V3和R1模型与海光DCU的适配上线,有望进一步推动相关领域的发展,为国产算力和人工智能应用注入新动力。
原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/704768.html