Chatbot Arena

  • 阿里通义开源模型Qwen2.5进入大模型盲测全球前十

    基准测试平台Chatbot Arena发布了最新的大模型盲测排名。10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其Qwen2.5-72B-Instruct大语言模型在榜单中位列第十,是前十名中唯一的中国模型。此外,通义千问的视觉语言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的开源大模型。

    2024年9月30日
  • 超越GPT-4 Claude 3超大杯成新王

    Claude 3 Opus在Chatbot Arena的聊天机器人对战排行榜中反超GPT-4,成为新冠军,且Claude 3家族整体表现亮眼。Chatbot Arena榜单权威,基于真实人类用户体验打分。Claude 3因其勤奋和低成本受到好评,尤其Claude 3 Haiku能以低成本即时运行并提供高智能客户服务。相比之下,ChatGPT被指在过去一年中零增长,面临竞争压力,垂直化AI初创公司正满足用户需求。ChatGPT未来可能以平台专属模型为特色,成为新的增长点。

    2024年3月28日