科研AI新突破:OpenScholar大幅降低引用幻觉

科研AI新突破:OpenScholar大幅降低引用幻觉

针对现有AI模型在学术引用中频繁“捏造”信息的难题,一项最新研究带来了重要进展。由华盛顿大学与艾伦人工智能研究所联合研发的OpenScholar模型,成功将引用准确率提升至与人类专家相当的水平,相关成果已发表于《自然》期刊。

研究人员发现,GPT-4o等通用模型生成的研究引用中,高达78%至90%实为伪造。为破解此难题,团队专门构建了包含4500万篇论文的检索库,并运用检索增强生成技术,使OpenScholar能查找最新研究并规范引用。团队还创建了首个跨领域评测基准ScholarQABench进行评估。

测试结果显示,OpenScholar的表现超越了包括GPT-4o在内的多个顶尖模型。在16位科学家的盲评中,其生成的回答在51%的情况下比领域专家撰写的更受青睐。若将该模型的工作流程与GPT-4o结合,科学家对AI答案的偏好率更升至70%。

项目负责人表示,研究社区对此开源系统反响热烈,上线后访问量远超预期,充分证明了科研领域对此类透明工具的迫切需求。目前团队已在OpenScholar基础上开发新一代模型,致力于实现更复杂的多步骤检索与信息整合,以帮助科学家更高效地追踪海量前沿文献。

原创文章,作者:若安丶,如若转载,请注明出处:https://www.kejixun.co/article/744856.html

若安丶的头像若安丶管理团队

相关推荐

发表回复

登录后才能评论