
OpenAI于周四宣布推出GPT-Rosalind,一款专为生物学工作流训练的大语言模型。与谷歌、微软等巨头推出的通用科学模型不同,GPT-Rosalind走垂直路线,专注于生物学领域,旨在解决研究人员面临的两大核心障碍:数十年来基因组测序积累的海量数据,以及高度细分的专业术语壁垒。OpenAI生命科学产品负责人王昀昀在发布会上表示,一位专注于特定基因的遗传学家面对海量的神经生物学文献时往往束手无策,而GPT-Rosalind正是为此而生。
该模型在通用大模型基础上引入了50种常见生物工作流及主流公共数据库访问能力,通过专项训练让模型能够通过已知通路和调控机制连接基因型与表型,推断蛋白质结构功能并筛选潜在药物靶点。为了抑制大语言模型常见的“阿谀奉承”倾向,OpenAI针对性调整了模型,使其在面对低价值靶点时更倾向于直接否定而非盲目附和。不过,幻觉问题仍是悬而未决的挑战——模型在解释推理步骤时可能生成看似合理实则错误的内容,OpenAI坦言尚未完全解决这一顽疾,用户需保持审慎。
此外,出于生物安全风险考量,GPT-Rosalind目前仅限美国本土实体通过可信访问框架申请使用,功能受限的研究插件将面向更广泛用户开放。OpenAI联合创始人Greg Brockman表示,GPT-Rosalind是用于生命科学研究的前沿模型,朝着加速科学发展和改善人类福祉的目标迈进。
原创文章,作者:李小白,如若转载,请注明出处:https://www.kejixun.co/article/750198.html