SearchGPT 发布刚过两天,已有人灰度测试到了。今天,网友 Kesku 自制的 demo 全网刷屏,SearchGPT 结果输出如此神速,让所有人为之震惊。

但另一方面,OpenAI 当天放出的官方演示,被外媒《大西洋月刊》曝出其中的问题。在回答「8 月在北卡罗来纳 Boone 举办的音乐节」的问题时,SearchGPT 竟弄错时间,出现了幻觉。
OpenAI 发言人 Kayla Wood 已经向《大西洋月刊》承认了这个错误,并表示「这仅是初始的原型,我们将不断改进。」
这个错误让人不禁想起 Bard 曾经造成的惨剧。
2023 年 2 月,谷歌推出了这个聊天机器人产品以对抗 ChatGPT,但首次亮相就出现了事实性错误,导致 Alphabet 股价当天暴跌 9%,市值瞬间蒸发 1000 亿美元。
Bard 称 James Webb 太空望远镜拍摄了系外行星的第一张照片,但实际上这个功绩属于欧洲南部天文台的 VLT
但好在,OpenAI 没有股价可跌,而且仅开放内测的做法也是相当谨慎。毕竟有谷歌的前车之鉴,可以预料到,LLM 这种错误几乎是无法避免的。
即使 OpenAI 能够找到方法大幅减少 SearchGPT 的幻觉,但面对庞大的访问量也是「杯水车薪」。
假设幻觉率仅为 1%(这个比率很难达到),按照谷歌的规模,也会导致每天产生数千万个错误答案。
更何况,我们目前还没有发现足够可靠且有效的方法,来消除 LLM 的废话和幻觉。
而且,Andrej Karpathy 大佬曾经在推特上表达过这样的观点:「幻觉并不是 bug,而是 LLM 最大的特点。」
Karpathy 将 LLM 比喻为「梦想机器」:我们用 prompt 引导模型「做梦」,再加上对训练文档的模糊记忆,就得到了生成结果。
虽然大多数时候生成结果是有用的,但既然是「梦境」就有可能失控。当 LLM 做梦进入有事实错误的领域时,我们就会给它贴上「幻觉」的标签。
这看起来是个 bug,但 LLM 只是做了它一直在做的事情。
这种机制和传统的搜索引擎完全不同。后者接收提示后仅仅是逐字返回数据库中最相似的文档,因此你可以说它有「创造性问题」,因为搜索引擎永远不可能创造新的回应。
根据 Karpathy 的说法,我们就很难指望由当前 LLM 驱动的 AI 搜索能生成 100% 真实准确的结果。
那么这场搜索引擎的变革会怎样展开?LLM 的「梦境创意」和传统搜索引擎的真实可靠,究竟是共存下去,还是会「你死我亡」?
原创文章,作者:科技探索者,如若转载,请注明出处:https://www.kejixun.co/article/670198.html