北大与深度求索联合开源大模型推理加速框架DSpark，破解高并发算力浪费难题

AI • 1小时前 • AI

昨日，北京大学与深度求索（DeepSeek）正式宣布联合推出并开源大模型推理加速框架DSpark，旨在破解大语言模型在高并发推理场景下因频繁前向计算导致的响应延迟与算力浪费顽疾。在标准自回归生成中，每输出一个词元都需消耗完整算力，严重制约实时响应速度。虽然推测解码是主流提速手段，但传统方案存在明显短板——串行生成耗时较长，并行模型处理长序列时候选接受率常下滑，算力无效消耗严重。

针对上述痛点，DSpark创新引入双重优化机制。在候选生成阶段，采用半自回归架构，通过并行主干网络一次性输出高质量基础特征，并辅以轻量化模块优化文本逻辑，仅需两层Transformer结构即可优于五层并行模型表现，在速度与质量间取得巧妙平衡。在验证调度层面，引入置信度调度验证机制，由硬件感知前缀调度器实时判断算力负载，优先处理高可靠性文本片段，最大限度减少无效计算。经通义千问3、Gemma4等主流模型在代码编写、数学推理及日常对话等多场景下严格测试，DSpark单轮有效生成长度明显优于Eagle3和DFlash等基线模型，尤其在长序列任务中有效缓解了候选有效率衰减难题。

工程化方面，团队进行了深度系统级优化，包括序列打包降低内存消耗、异步调度模式消除GPU流水线卡顿，并确保对主流CUDA硬件生态的兼容。DSpark已率先落地于DeepSeek-V4-Flash与DeepSeek-V4-Pro预览版服务引擎，实测显示系统整体吞吐量实现跨越式增长。目前，深度求索已在GitHub DeepSpec项目中开源了DSpark、DFlash及Eagle3的全套训练代码、模型权重及评估工具，此举将大幅降低行业高性能推理服务部署成本，为大模型低成本普及提供切实可行的技术范式。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.co/article/756292.html

AI认证作者

0 0

AI

AI账单失控迫使美国企业转向DeepSeek等低成本方案

据CNBC近日报道称，随着人工智能账单持续飙升，越来越多的美国企业开始追求“Tokenminimizing”策略，即用更少的Token完成同等复杂度的任务，以控制成本。总部位于旧…

AI
1天前
AI

DeepSeek大规模招聘

6月26日，据报道，杭州深度求索人工智能基础技术研究有限公司（下称DeepSeek）发布招聘信息，表示正努力将所有部门的规模扩大至少一倍。DeepSeek此次招聘涵盖7个大类的33…

李森
3天前
商业

DeepSeek首轮外部融资510亿元到账估值近4000亿元

据报道，杭州深度求索人工智能基础技术研究有限公司于2026年6月16日完成首轮外部融资，整体规模约510亿元，投后估值逼近4000亿元。这家成立于2023年7月、总部位于杭州拱墅区…

商业头条
2026年6月18日
商业

DeepSeek完成逾70亿美元融资创始人梁文锋以特殊架构保持绝对控制权

据国外媒体报道，AI大模型独角兽DeepSeek（深度求索）日前以非常规交易架构顺利完成首轮逾70亿美元（约合500亿元人民币）融资，投后估值突破500亿美元大关。本轮融资的最大创…

商业头条
2026年6月17日
AI

DeepSeek-V4-Pro永久降价75%，登顶全球AI性价比榜首

近日，中国人工智能企业DeepSeek正式更新API文档，宣布旗下旗舰大模型DeepSeek-V4-Pro将实施永久大降价。原本预计于5月31日结束的2.5折限时优惠活动，如今将直…

秋秋
2026年5月26日
AI

DeepSeek API完成输出提速与服务扩容，默认并发提升至500

DeepSeek 近日宣布，其 API 已完成输出提速与服务扩容，现已默认支持 500 并发同时在线，为企业用户带来更快的响应速度和更稳定的服务体验。对于需要更大并发量的企业用户，…

AI
2026年5月24日
商业

宁德时代拟参投DeepSeek融资，估值或突破3500亿元

据The Information援引两位知情人士报道，动力电池巨头宁德时代正计划参与人工智能公司DeepSeek的新一轮融资。该轮融资目标募资规模约500亿元人民币，最早可能于下月…

商业头条
2026年5月23日
AI

DeepSeek-V4-Pro API永久降价：原价四分之一，2.5折优惠延续

DeepSeek官方昨日宣布，其DeepSeek-V4-Pro模型API价格将进行永久性调整。原定于2026年5月31日结束的2.5折限时优惠活动，将转为永久生效——优惠期结束后，…

AI
2026年5月23日
AI

DeepSeek组建新团队Harness 开发代码智能体对标Claude Code

人工智能公司DeepSeek正在内部组建一个名为Harness的全新团队，目标开发一款针对代码智能体的产品，直接对标Anthropic旗下的Claude Code。这一消息已得到D…

野游栗
2026年5月21日
AI

DeepSeek 大范围开放“识图模式”，正式跨入图文交互时代

5月9日，上个月底，DeepSeek 开始灰度测试“识图模式”。该模式并非简单的文字 OCR，而是终于具备了图片识别理解能力。根据最新用户反馈，DeepSeek 已经大范围开放“…

科技观察者
2026年5月9日
AI

DeepSeek灰度测试“识图模式”，多模态识别能力引关注

人工智能公司DeepSeek近日宣布，正在灰度测试全新的“识图模式”。该模式将与现有的“快速模式”和“专家模式”并列，但其能力远不止于简单的OCR文字识别，而是具备了更为复杂的多模…

AI
2026年4月30日
商业

DeepSeek拟融资超200亿美元：不为缺钱，只为留住研究员

据英国《金融时报》4月23日报道，DeepSeek正与少数战略投资者接触，讨论一轮可能将估值推高至200亿美元以上的融资。知情人士透露，该公司自由现金流虽不如部分竞争对手充裕，但眼…

李森
2026年4月24日
商业

传腾讯阿里正洽谈投资DeepSeek，估值或超200亿美元

据科技媒体The Information报道，腾讯控股与阿里巴巴集团正就投资AI初创公司DeepSeek展开洽谈。若交易达成，DeepSeek的估值将超过200亿美元，约合1367…

商业头条
2026年4月23日
AI

DeepSeek上线专家模式：极速处理复杂问题

近日，DeepSeek悄然推出了一项名为“专家模式”的新功能，专门面向复杂问题的深度解答。该模式深度融合了深度思考与智能搜索能力，能够在处理高难度查询时显著提升推理效率和准确性。据…

AI
2026年4月8日
AI

DeepSeek服务突发双端瘫痪，用户登录失败引发全网热议

今日清晨，“DeepSeek崩了”迅速登上微博热搜榜，引发数万网友讨论。据媒体最新通报，DeepSeek官方服务平台于昨日21:35突发网页端与移动端App同时中断，系统响应异常，…

AI
2026年3月30日
新闻

英伟达投260亿美元转型，欲打造开源AI模型抗衡OpenAI

芯片巨头英伟达正酝酿一场重大战略转型。据外媒连线今日报道，英伟达宣布将在未来五年内投资260亿美元，用于开发开源AI模型，此举被解读为该公司正从纯粹的芯片制造商向顶尖AI前沿实验室…

NEWS
2026年3月12日
新闻

Sensor Tower发布2026年移动应用市场报告，非游戏支出首超游戏

Sensor Tower最新发布的2026年移动应用市场报告指出，2025年全球移动市场迎来标志性转折：消费者在非游戏应用上的支出首次超过游戏应用，显示移动经济正从娱乐主导向服务与…

秋秋
2026年1月22日
AI

DeepSeek新模型代码曝光，最快2月发布

据外媒The Information本月初爆料，国内AI公司DeepSeek有望在今年2月中旬农历新年期间推出新一代旗舰模型DeepSeek V4。最新迹象显示，这一发布计划正变得…

好奇宝宝
2026年1月21日
AI

DeepSeek发布突破性论文：为Transformer注入“条件记忆”

近日，深度求索公司（DeepSeek）发布了一篇由创始人梁文锋署名，并与北京大学王选计算机研究所团队合作的重要论文，提出为Transformer架构引入“条件记忆”模块，直接补全了…

net
2026年1月13日
AI

DeepSeek能否第二次震惊全世界？V4模型编程能力剑指全球第一

有消息称，中国人工智能领军企业深度求索（DeepSeek）计划于今年2月中旬正式发布其新一代旗舰模型DeepSeek-V4。内部测试数据显示，该模型在核心编程能力上已全面超越国际主…

AI
2026年1月11日

发表回复

登录后才能评论

北大与深度求索联合开源大模型推理加速框架DSpark，破解高并发算力浪费难题

相关推荐

发表回复