DeepSeek V3和R1模型完成海光DCU国产化适配并上线

AI • 2025年2月4日 16:14:00 • AI

DeepSeek V3和R1模型完成海光DCU国产化适配并上线

昨日，中科曙光国家先进计算产业创新中心有限公司发布消息，海光信息技术团队成功完成DeepSeek V3和R1模型与海光DCU（深度计算单元）的国产化适配工作，且相关模型已正式上线。

这一成果意义非凡。DeepSeek V3和R1模型基于Transformer架构，采用Multi – Head Latent Attention（MLA）和DeepSeek MoE两大核心技术。MLA能减少KV缓存，大幅降低内存占用，提升推理效率；DeepSeek MoE则借助辅助损失实现专家负载的智能平衡，优化模型性能。

对于广大用户而言，如今在“光合开发者社区”的“光源”板块，或者登录光源官网搜索“DeepSeek”，便可访问、下载相关模型，并基于DCU平台进行部署和使用。

值得一提的是，DCU是海光信息推出的高性能GPGPU架构AI加速卡，为行业客户提供自主可控的全精度通用AI加速计算方案，目前已在科教、金融等多领域实现规模化应用。此次DeepSeek V3和R1模型与海光DCU的适配上线，有望进一步推动相关领域的发展，为国产算力和人工智能应用注入新动力。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.co/article/704768.html

DeepSeek DeepSeek V3 海光DCU

0 0

商业

DeepSeek首轮外部融资510亿元到账估值近4000亿元

据报道，杭州深度求索人工智能基础技术研究有限公司于2026年6月16日完成首轮外部融资，整体规模约510亿元，投后估值逼近4000亿元。这家成立于2023年7月、总部位于杭州拱墅区…

商业头条
8小时前
商业

DeepSeek完成逾70亿美元融资创始人梁文锋以特殊架构保持绝对控制权

据国外媒体报道，AI大模型独角兽DeepSeek（深度求索）日前以非常规交易架构顺利完成首轮逾70亿美元（约合500亿元人民币）融资，投后估值突破500亿美元大关。本轮融资的最大创…

商业头条
1天前
AI

DeepSeek-V4-Pro永久降价75%，登顶全球AI性价比榜首

近日，中国人工智能企业DeepSeek正式更新API文档，宣布旗下旗舰大模型DeepSeek-V4-Pro将实施永久大降价。原本预计于5月31日结束的2.5折限时优惠活动，如今将直…

秋秋
2026年5月26日
AI

DeepSeek API完成输出提速与服务扩容，默认并发提升至500

DeepSeek 近日宣布，其 API 已完成输出提速与服务扩容，现已默认支持 500 并发同时在线，为企业用户带来更快的响应速度和更稳定的服务体验。对于需要更大并发量的企业用户，…

AI
2026年5月24日
商业

宁德时代拟参投DeepSeek融资，估值或突破3500亿元

据The Information援引两位知情人士报道，动力电池巨头宁德时代正计划参与人工智能公司DeepSeek的新一轮融资。该轮融资目标募资规模约500亿元人民币，最早可能于下月…

商业头条
2026年5月23日
AI

DeepSeek-V4-Pro API永久降价：原价四分之一，2.5折优惠延续

DeepSeek官方昨日宣布，其DeepSeek-V4-Pro模型API价格将进行永久性调整。原定于2026年5月31日结束的2.5折限时优惠活动，将转为永久生效——优惠期结束后，…

AI
2026年5月23日
AI

DeepSeek组建新团队Harness 开发代码智能体对标Claude Code

人工智能公司DeepSeek正在内部组建一个名为Harness的全新团队，目标开发一款针对代码智能体的产品，直接对标Anthropic旗下的Claude Code。这一消息已得到D…

野游栗
2026年5月21日
AI

DeepSeek 大范围开放“识图模式”，正式跨入图文交互时代

5月9日，上个月底，DeepSeek 开始灰度测试“识图模式”。该模式并非简单的文字 OCR，而是终于具备了图片识别理解能力。根据最新用户反馈，DeepSeek 已经大范围开放“…

科技观察者
2026年5月9日
AI

DeepSeek灰度测试“识图模式”，多模态识别能力引关注

人工智能公司DeepSeek近日宣布，正在灰度测试全新的“识图模式”。该模式将与现有的“快速模式”和“专家模式”并列，但其能力远不止于简单的OCR文字识别，而是具备了更为复杂的多模…

AI
2026年4月30日
商业

DeepSeek拟融资超200亿美元：不为缺钱，只为留住研究员

据英国《金融时报》4月23日报道，DeepSeek正与少数战略投资者接触，讨论一轮可能将估值推高至200亿美元以上的融资。知情人士透露，该公司自由现金流虽不如部分竞争对手充裕，但眼…

李森
2026年4月24日
商业

传腾讯阿里正洽谈投资DeepSeek，估值或超200亿美元

据科技媒体The Information报道，腾讯控股与阿里巴巴集团正就投资AI初创公司DeepSeek展开洽谈。若交易达成，DeepSeek的估值将超过200亿美元，约合1367…

商业头条
2026年4月23日
AI

DeepSeek上线专家模式：极速处理复杂问题

近日，DeepSeek悄然推出了一项名为“专家模式”的新功能，专门面向复杂问题的深度解答。该模式深度融合了深度思考与智能搜索能力，能够在处理高难度查询时显著提升推理效率和准确性。据…

AI
2026年4月8日
AI

DeepSeek服务突发双端瘫痪，用户登录失败引发全网热议

今日清晨，“DeepSeek崩了”迅速登上微博热搜榜，引发数万网友讨论。据媒体最新通报，DeepSeek官方服务平台于昨日21:35突发网页端与移动端App同时中断，系统响应异常，…

AI
2026年3月30日
新闻

英伟达投260亿美元转型，欲打造开源AI模型抗衡OpenAI

芯片巨头英伟达正酝酿一场重大战略转型。据外媒连线今日报道，英伟达宣布将在未来五年内投资260亿美元，用于开发开源AI模型，此举被解读为该公司正从纯粹的芯片制造商向顶尖AI前沿实验室…

NEWS
2026年3月12日
新闻

Sensor Tower发布2026年移动应用市场报告，非游戏支出首超游戏

Sensor Tower最新发布的2026年移动应用市场报告指出，2025年全球移动市场迎来标志性转折：消费者在非游戏应用上的支出首次超过游戏应用，显示移动经济正从娱乐主导向服务与…

秋秋
2026年1月22日
AI

DeepSeek新模型代码曝光，最快2月发布

据外媒The Information本月初爆料，国内AI公司DeepSeek有望在今年2月中旬农历新年期间推出新一代旗舰模型DeepSeek V4。最新迹象显示，这一发布计划正变得…

好奇宝宝
2026年1月21日
AI

DeepSeek发布突破性论文：为Transformer注入“条件记忆”

近日，深度求索公司（DeepSeek）发布了一篇由创始人梁文锋署名，并与北京大学王选计算机研究所团队合作的重要论文，提出为Transformer架构引入“条件记忆”模块，直接补全了…

net
2026年1月13日
AI

DeepSeek能否第二次震惊全世界？V4模型编程能力剑指全球第一

有消息称，中国人工智能领军企业深度求索（DeepSeek）计划于今年2月中旬正式发布其新一代旗舰模型DeepSeek-V4。内部测试数据显示，该模型在核心编程能力上已全面超越国际主…

AI
2026年1月11日
AI

【CES 2026】黄仁勋点赞开源AI，特别提及中国模型DeepSeek

当地时间1月5日，在拉斯维加斯举行的CES 2026英伟达发布会上，标志性皮衣加身的首席执行官黄仁勋登台亮相，发表了其2026年的首场重要演讲。他系统回顾了过去一年人工智能行业的演…

AI
2026年1月6日
AI

DeepSeek发布mHC新架构，破解大模型训练稳定性难题

昨日下午，人工智能企业DeepSeek正式发布一项突破性研究成果，推出名为“流形约束超连接”（manifold-constrained Hyperconnection, mHC）的…

若安丶
2026年1月2日

发表回复

登录后才能评论