阿里通义开源模型Qwen2.5进入大模型盲测全球前十

基准测试平台Chatbot Arena发布了最新的大模型盲测排名。10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其Qwen2.5-72B-Instruct大语言模型在榜单中位列第十,是前十名中唯一的中国模型。此外,通义千问的视觉语言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的开源大模型。

近日,基准测试平台Chatbot Arena发布了最新的大模型盲测排名。10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其Qwen2.5-72B-Instruct大语言模型在榜单中位列第十,是前十名中唯一的中国模型。此外,通义千问的视觉语言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的开源大模型。

阿里通义开源模型Qwen2.5进入大模型盲测全球前十

与此同时,基于Qwen系列的衍生模型在全球开源社区中的数量已突破7.43万,超过了Llama系列的7.28万,成为全球最大的生成式语言模型家族。在Hugging Face社区的开源模型排行榜Open LLM Leaderboard上,Qwen系列及其衍生模型包揽了前十全部座次。

Chatbot Arena由开放研究机构LMSYS Org推出,是目前全球顶尖的大模型测试平台。平台目前集成了全球70多个大模型,采用匿名方式将大模型两两组队,交给用户进行盲测,用户根据真实对话体验对模型能力进行投票。

原创文章,作者:潮玩君,如若转载,请注明出处:https://www.kejixun.co/article/684168.html

潮玩君的头像潮玩君管理团队

相关推荐

  • 超越GPT-4 Claude 3超大杯成新王

    Claude 3 Opus在Chatbot Arena的聊天机器人对战排行榜中反超GPT-4,成为新冠军,且Claude 3家族整体表现亮眼。Chatbot Arena榜单权威,基于真实人类用户体验打分。Claude 3因其勤奋和低成本受到好评,尤其Claude 3 Haiku能以低成本即时运行并提供高智能客户服务。相比之下,ChatGPT被指在过去一年中零增长,面临竞争压力,垂直化AI初创公司正满足用户需求。ChatGPT未来可能以平台专属模型为特色,成为新的增长点。

    2024年3月28日

发表回复

登录后才能评论