
近日,新浪开源的VibeThinker-3B模型在AI圈引发震动。这款仅拥有30亿参数的轻量级模型,却在数学、编程等高难度基准测试中展现出足以媲美主流百倍规模大模型的强悍性能,甚至在部分竞赛级任务中超越了多款行业顶尖产品。其优异表现并非偶然,而是得益于独特的训练策略——以阿里Qwen2.5-Coder-3B为基底,通过监督微调、强化学习、自蒸馏及指令微调等多阶段精细化“后训练”,将大模型的逻辑推理能力深度浓缩进轻量化架构之中。
测试显示,在LeetCode竞赛题目中,它能高效完成128道题中的123道,成绩超过了GPT-5.2等行业标杆。
此次发布最引人深思的是研发团队提出的“参数压缩-覆盖假说”。研究发现,AI能力并非“铁板一块”:逻辑推理、编程运算等结构清晰的任务可通过特定训练极高密度地压缩,而广泛的世界知识储备仍依赖庞大参数量支撑。这意味着未来推理任务未必总要调用成本昂贵的超大模型,精耕细作的后训练同样能以极低算力换取堪比“巨头”的推理体验。
目前,VibeThinker-3B已在Hugging Face和GitHub正式开源,不仅为开发者提供了轻量高效的工具选择,也为整个行业提供了一种全新优化范式——在特定任务领域,小模型同样可以迸发惊人能量。
原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/756391.html