马斯克 xAI 大模型 Grok 2 登场    能否撼动类 GPT-4 级别行业格局?

Grok-2系列包括两个版本:Grok-2和Grok-2 mini。其中,Grok-2是该公司推理能力最强的语言模型,而轻量化模型Grok-2mini则是Grok-2试图实现小参数体型下的强功能。

当地时间8月14日, 埃隆·马斯克旗下AI初创公司xAI发布了一款新的聊天机器人Grok-2,声称其性能与竞争对手OpenAI、谷歌和Anthropic的产品相当。此次发布的Grok-2系列包括两个版本:Grok-2和Grok-2 mini。其中,Grok-2是该公司推理能力最强的语言模型,而轻量化模型Grok-2mini则是Grok-2试图实现小参数体型下的强功能。

马斯克 xAI 大模型 Grok 2 登场    能否撼动类 GPT-4 级别行业格局?

Grok-2因何被称为理解能力最强?

Grok-2被描述为“类GPT-4级别”的大模型,具备强大的推理、编程和聊天功能,在xAI内部测试中表现出色。而Grok-2 mini则主打小巧精致,虽然在性能上不及Grok-2,但在响应速度方面有着明显优势,适合对速度要求较高的场景。

根据xAI的描述,Grok-2在模型推理能力上取得了显著进步,特别是在处理复杂任务时表现出色。与其前身Grok-1.5相比,Grok-2不仅在推理能力上有所提升,还在工具使用能力上展现出了更强的适应性。例如,它能够更准确地识别缺失信息,通过事件序列进行推理,并有效排除不相关的内容。这些特性使得Grok-2在面对各种复杂任务时,能够更加从容应对。

在基准测试方面,Grok-2的表现也相当亮眼。根据xAI披露的数据,Grok-2在LMSYS排行榜上的得分超过了GPT-4 Turbo和Claude 3 Opus,甚至在某些测试中与GPT-4o和Llama 3-405B平分秋色。不过,这些成绩也引发了外界的质疑。有分析指出,xAI在公布基准测试结果时,选择了与五月份的GPT-4o得分进行对比,存在利用时间差美化结果的嫌疑。这一做法无疑让外界对Grok-2的真实性能产生了更多疑问。

Grok-2跻身前五大AI聊天机器人之列!

根据独立AI基准机构的测试,这款模型已经跻身前五大AI聊天机器人之列,仅落后于谷歌的Gemini和OpenAI的ChatGPT等模型。沃顿商学院教授、AI专家Ethan Mollick在X上发帖称:“现在有五款GPT-4级别的AI模型:GPT-4o、Claude 3.5、Gemini 1.5、Llama 3.1和现在的Grok-2。” Mollick还称:“所有的测试实验室都表示,AI模型还有继续大幅改进的空间,但目前我们还没有看到任何模型真正超越GPT-4。”

xAI表示,Grok-2是AI模型向前迈出的重要一步,在广泛的任务中,无论是寻求答案、协同写作,还是解决编码任务,都更加直观、可控和通用。 根据AI模型评测机构LMSYS的排名,Grok-2的表现被认为优于Meta和Anthropic的最强模型。 xAI表示,在内部评估该模型的性能时,其重点是确保系统遵循用户指示,并提供准确、真实的信息。 在此之前,Grok-2的上一代产品被专家批评为“AI幻觉”,即将虚假信息陈述为事实,这也一直视为企业采用AI系统的障碍。

与前代模型相比,Grok-2最大的变化之一是具备了直接生成图像的能力。据xAI团队成员透露,Grok-2的图像生成功能是基于近期广受欢迎的FLUX.1模型开发的。这一功能的加入,使得Grok-2在X平台上的应用更加多样化,也为用户提供了更多的创作可能性。

马斯克特别强调了Grok-2的图像生成能力,并指出这一功能将在X平台上逐步开放给Premium和Premium+订阅用户。值得注意的是,Grok-2的图像生成功能没有任何限制,这使得用户可以利用这一功能创作各种类型的图像,包括政治人物的照片等。这一功能的开放性在社交媒体上引发了广泛讨论,部分用户对其潜在的滥用表示担忧,而另一些用户则对其创作自由度表示欢迎。

然而,Grok-2的图像生成功能也并非毫无限制。根据用户反馈,Premium用户每月可以生成约20-30张图像,而Premium+用户则可以生成更多的图像。尽管这一限制在一定程度上控制了资源的使用,但也引发了部分用户的不满,认为这一限制可能影响用户的创作体验。

写在最后:

在Grok-2发布的同时,马斯克也透露了xAI的未来计划。根据他此前的公开发言,xAI正在全力开发Grok-3模型,预计将于今年年底发布。Grok-3的开发规模和资源投入令人瞩目,据马斯克透露,xAI团队为Grok-3的训练调用了10万块英伟达H100芯片,目标是在今年年底前推出一款“按每项指标衡量都是世界上最强大的人工智能模型”。

对于xAI而言,Grok-3的发布将是一次至关重要的挑战。如果Grok-3能够成功实现其目标,xAI有望在AI行业中占据更为重要的地位。然而,考虑到目前AI行业的激烈竞争,以及OpenAI、Google等科技巨头的强大实力,xAI要想真正突围,仍需在技术创新和产品应用上取得更大突破。

原创文章,作者:科技探索者,如若转载,请注明出处:https://www.kejixun.co/article/674087.html

科技探索者的头像科技探索者管理团队

相关推荐

发表回复

登录后才能评论