
12月1日,中国AI企业深度求索(DeepSeek)正式推出两大模型——DeepSeek-V3.2与DeepSeek-V3.2-Speciale,覆盖日常使用与专业研究场景,进一步推动开源大模型的技术边界。
标准版V3.2:平衡推理与效率
DeepSeek-V3.2定位为通用型模型,通过创新的DSA稀疏注意力机制,在保持接近GPT-5的推理能力的同时,显著降低计算开销。官方数据显示,其输出长度较同类模型缩短40%,用户等待时间减少35%,API调用成本下降50%。该模型已全面开放网页端、App及API服务,适用于问答、智能体任务等场景,尤其在金融文本分析、法律文档处理等长文本应用中表现突出。技术报告显示,其动态注意力权重分配机制使中文财经新闻分类准确率提升8.2%。
Speciale版:极致推理与数学证明
V3.2-Speciale作为长思考增强版,深度融合DeepSeek-Math-V2的定理证明能力,在数学、编程等专业领域表现亮眼。该模型在2025年国际数学奥林匹克(IMO)、国际信息学奥林匹克(IOI)等四项顶级竞赛中斩获金牌,其中ICPC成绩达到人类选手第二名水平。目前,Speciale版本仅通过临时API开放,供研究机构评测,其严谨的逻辑验证能力适合学术研究和高复杂度任务。
行业评价与影响
行业分析指出,V3.2是首个将思考模式与工具调用融合的开源模型,在智能体评测中达到当前开源模型最高水平,大幅缩小与闭源模型的差距。而Speciale版本则被评价为“开源模型推理能力的巅峰”,其数学符号处理与形式化证明能力为科研领域提供了新工具。
此次发布延续了DeepSeek“技术驱动性价比”的策略,其母公司幻方量化的算力优势与架构创新(如MLA机制)成为关键支撑。
原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/740046.html