Chatbot Arena

新闻

阿里通义开源模型Qwen2.5进入大模型盲测全球前十

基准测试平台Chatbot Arena发布了最新的大模型盲测排名。10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强，其Qwen2.5-72B-Instruct大语言模型在榜单中位列第十，是前十名中唯一的中国模型。此外，通义千问的视觉语言模型Qwen2-VL-72B-Instruct排名第九，是得分最高的开源大模型。

潮玩君
2024年9月30日
AI

超越GPT-4 Claude 3超大杯成新王

Claude 3 Opus在Chatbot Arena的聊天机器人对战排行榜中反超GPT-4，成为新冠军，且Claude 3家族整体表现亮眼。Chatbot Arena榜单权威，基于真实人类用户体验打分。Claude 3因其勤奋和低成本受到好评，尤其Claude 3 Haiku能以低成本即时运行并提供高智能客户服务。相比之下，ChatGPT被指在过去一年中零增长，面临竞争压力，垂直化AI初创公司正满足用户需求。ChatGPT未来可能以平台专属模型为特色，成为新的增长点。

AI
2024年3月28日