
昨日晚间,月之暗面正式发布新一代开源思考模型Kimi K2 Thinking,该模型基于“模型即Agent”理念训练,原生具备“边思考边使用工具”的能力,在人类最后的考试(Humanity’s Last Exam)、自主网络浏览(BrowseComp)等多项基准测试中达到当前最优(SOTA)水平。
据官方介绍,Kimi K2 Thinking无需人类干预即可实现高达300轮的工具调用和稳定多轮思考,能自主完成复杂问题求解。在涵盖100多个专业领域的“人类最后的考试”中,其以44.9%的成绩刷新SOTA记录;在OpenAI发布的BrowseComp测试中,更以60.2%的准确率远超人类平均29.2%的表现,展现出极强的信息挖掘与推理能力。
该模型通过“思考→搜索→编程”动态循环,可分解模糊问题为可执行任务。例如,在股票回购案例中,它通过两轮搜索锁定目标公司并从SEC官网提取数据,最终给出准确结论。此外,其编码能力在多语言工程基准(SWE-Multilingual等)中亦有提升,终端操作和长文本处理表现更优。
通用能力方面,Kimi K2 Thinking在创意写作中能转化灵感为连贯叙述,学术研究中可深度分析复杂指令,情感回应则更具同理心。目前模型已登陆Hugging Face和ModelScope平台,开发者可免费部署使用。
原创文章,作者:若安丶,如若转载,请注明出处:https://www.kejixun.co/article/737961.html