OpenAI SearchGPT 官方演示大翻车，源代码竟暴露搜索机制

科技探索者 • 2024年7月29日 12:19:00 • AI

SearchGPT 发布刚过两天，已有人灰度测试到了。今天，网友 Kesku 自制的 demo 全网刷屏，SearchGPT 结果输出如此神速，让所有人为之震惊。

但另一方面，OpenAI 当天放出的官方演示，被外媒《大西洋月刊》曝出其中的问题。在回答「8 月在北卡罗来纳 Boone 举办的音乐节」的问题时，SearchGPT 竟弄错时间，出现了幻觉。

OpenAI 发言人 Kayla Wood 已经向《大西洋月刊》承认了这个错误，并表示「这仅是初始的原型，我们将不断改进。」

这个错误让人不禁想起 Bard 曾经造成的惨剧。

2023 年 2 月，谷歌推出了这个聊天机器人产品以对抗 ChatGPT，但首次亮相就出现了事实性错误，导致 Alphabet 股价当天暴跌 9%，市值瞬间蒸发 1000 亿美元。

Bard 称 James Webb 太空望远镜拍摄了系外行星的第一张照片，但实际上这个功绩属于欧洲南部天文台的 VLT

但好在，OpenAI 没有股价可跌，而且仅开放内测的做法也是相当谨慎。毕竟有谷歌的前车之鉴，可以预料到，LLM 这种错误几乎是无法避免的。

即使 OpenAI 能够找到方法大幅减少 SearchGPT 的幻觉，但面对庞大的访问量也是「杯水车薪」。

假设幻觉率仅为 1%（这个比率很难达到），按照谷歌的规模，也会导致每天产生数千万个错误答案。

更何况，我们目前还没有发现足够可靠且有效的方法，来消除 LLM 的废话和幻觉。

而且，Andrej Karpathy 大佬曾经在推特上表达过这样的观点：「幻觉并不是 bug，而是 LLM 最大的特点。」

Karpathy 将 LLM 比喻为「梦想机器」：我们用 prompt 引导模型「做梦」，再加上对训练文档的模糊记忆，就得到了生成结果。

虽然大多数时候生成结果是有用的，但既然是「梦境」就有可能失控。当 LLM 做梦进入有事实错误的领域时，我们就会给它贴上「幻觉」的标签。

这看起来是个 bug，但 LLM 只是做了它一直在做的事情。

这种机制和传统的搜索引擎完全不同。后者接收提示后仅仅是逐字返回数据库中最相似的文档，因此你可以说它有「创造性问题」，因为搜索引擎永远不可能创造新的回应。

根据 Karpathy 的说法，我们就很难指望由当前 LLM 驱动的 AI 搜索能生成 100% 真实准确的结果。

那么这场搜索引擎的变革会怎样展开？LLM 的「梦境创意」和传统搜索引擎的真实可靠，究竟是共存下去，还是会「你死我亡」？

原创文章，作者：科技探索者，如若转载，请注明出处：https://www.kejixun.co/article/670198.html

OpenAI SearchGPT

科技探索者管理团队

0 0

AI

‌OpenAI确认8月发布GPT-5 多版本开放API

据外媒The Verge报道，OpenAI将于8月初正式发布新一代GPT-5模型‌。公司CEO萨姆·奥尔特曼在社交媒体X上透露，GPT-5将推出mini和nano等不同版本，并通过…

AI
2天前
AI

OpenAI被曝研发Sora 2模型剑指谷歌Veo 3霸主地位

据外媒bleepingcomputer近日披露，OpenAI正秘密开发新一代视频生成模型Sora 2，旨在与谷歌近期发布的Veo 3展开直接竞争‌。消息源@btibor91在7月2…

AI
2天前
新闻

奥特曼:AI三大风险让我夜不能寐

在迪拜世界政府峰会上，OpenAI首席执行官山姆·奥特曼通过视频连线发出重磅警告，坦言AI发展中的”社会失衡”风险令其彻夜难眠。这位AI领域的领军人物指出，…

聆听
3天前
新闻

苹果 AI 团队动荡内幕曝光：模型开源提案被否，或转用第三方大模型

近日，有一些关于苹果人工智能团队重要人员离职的报道。7月23日，The Information 的一篇新报道深入探究了这一内部风波，其中包括苹果差点将其人工智能模型开源以及最终未这…

Apple
4天前
AI

OpenAI：ChatGPT日处理25亿指令，用户量8个月翻倍

OpenAI最新披露的数据显示，旗舰产品ChatGPT如今每日处理全球用户高达25亿条指令，其中美国用户贡献约3.3亿条。这一数字印证了生成式AI在全球范围内的爆发式普及，更揭示了…

AI
5天前
AI

‌OpenAI神秘新模型斩获IMO金牌，AI数学推理能力实现历史性突破

在2025年国际数学奥林匹克竞赛（IMO）的赛场上，OpenAI研发的未公开实验性模型以35/42的高分夺得金牌，成为首个达到人类顶尖数学竞赛水平的AI系统。这一突破不仅超越了Ge…

AI
2025年7月20日
AI

OpenAI发布最强AI智能体，办公生活全能自动化

今日凌晨，OpenAI正式推出革命性产品ChatGPT智能体，这款被誉为”史上最强”的AI工具能够执行浏览网站、编写代码、制作PPT等多样化计算机任务，彻底…

AI
2025年7月18日
AI

ChatGPT Plus 新权益：OpenAI 开放 Record 模式

OpenAI 允许 ChatGPT Plus 用户使用 macOS 版应用的 Record Mode 实现本地录音，支持结构化会议笔记，但需遵守法律并获得同意。

科技新闻
2025年7月17日
产品

OpenAI表示将采用谷歌云服务支持ChatGPT

7月17日，据报道，OpenAI 周三宣布，将采用谷歌的云基础设施为其广受欢迎的人工智能助手 ChatGPT 提供支持。寻求额外算力资源的举措，与 OpenAI 对更多计算能力的…

AI
2025年7月17日
商业

谷歌宣布以24亿美元获得AI初创公司Windsurf顶尖人才团队及核心技术授权

谷歌7月12日宣布以24亿美元代价获得AI初创公司Windsurf顶尖人才团队及核心技术授权，这场”反向收购”直接导致OpenAI此前30亿美元全资收购计划…

Google
2025年7月14日
AI

OpenAI开源模型发布无限期推迟，安全测试成焦点

OpenAI首席执行官山姆·奥尔特曼(Sam Altman)于7月12日在社交媒体平台X上发表声明，宣布无限期推迟其首个开源权重AI模型的发布计划，原定下周正式推出的时间表已被取消…

AI
2025年7月13日
商业

OpenAI：完成65亿美金收购苹果前设计师Jony Ive公司

OpenAI公司昨日（7月9日）正式宣布，已完成对前苹果首席设计师Jony Ive联合创立的AI设备初创公司io Products, Inc.的收购，交易金额达65亿美元（约469…

秋秋
2025年7月10日
新闻

OpenAI将推AI浏览器，直指谷歌Chrome市场地位

据路透社7月9日最新报道，OpenAI正在秘密开发一款AI驱动的网络浏览器，计划在未来数周内正式推出。该产品旨在通过人工智能技术彻底改变用户浏览网络的方式，直接挑战谷歌Chrome…

AI
2025年7月10日
AI

苹果被挖角：AI 模型最高主管“庞若鸣”跳槽 Meta，年薪数千万美元

苹果AI主管庞若鸣即将离职Meta。知情人士透露，Meta开出数千万美元薪酬挖走AI专家庞若鸣。MetaCEO马克·扎克伯格正招兵买马，将AI领袖纳入麾下。

潮玩君
2025年7月8日
AI

股权薪酬占营收119%：OpenAI为留住人才付出高昂代价

OpenAI因AI人才争夺战而大幅提升员工薪酬，目前股权激励成本已高达44亿美元，未来可能进一步加大。员工在公司重组为公益公司后可能拥有的股权规模巨大，这凸显了公司吸引和留住关键人才所付出的代价。

科技探索者
2025年7月8日
AI

OpenAI 招聘主管点名批评 Meta：挖角手段让人闻到一股“绝望的味道”

Meta挖角Meta主管质疑其挖角方式，称员工无沟通时间，不道德；Meta CEO转向新创公司，将加入Meta。OpenAI CEO不满Meta招聘方式，强调使命感和有意义的工作。扎克伯格亲自出面为Meta辩护，称其在AI领域成绩不如预期。

潮玩君
2025年7月7日
AI

马斯克 xAI 公司补充 100 亿美元“弹药”，火力聚焦打造地表最强 AI

马斯克筹集100亿美元，推进AI发展。摩根士丹利表示筹集资金将支持xAI开发前沿的人工智能解决方案。

野游栗
2025年7月2日
AI

放弃自研模型？苹果考虑GPT或Claude来支持新Siri

苹果与 Anthropic 和 OpenAI 探讨 Siri 中的模型整合，计划推进该计划。知情人士透露，苹果要求定制版本的模型以在自有云基础设施上运行和测试。此计划将推动AI功能的发展，并可能促使苹果发展自研技术。

潮玩君
2025年7月1日
新闻

古尔曼：苹果或放弃自研AI模型转向外部合作

据彭博社记者马克·古尔曼最新爆料，苹果正考虑放弃自研AI大语言模型计划，转而与Anthropic及OpenAI展开深度合作谈判。知情人士透露，该公司正评估将第三方技术整合至Siri…

Apple
2025年7月1日
新闻

OpenAI首席研究官怒斥Meta挖角：如同入室盗窃

今日，OpenAI首席研究官Mark Chen在公司内部Slack平台发布措辞激烈的备忘录，将Meta持续挖角行为比作“闯入家中偷窃”，并呼吁员工对猎头采取强硬态度。他透露正与CE…

NEWS
2025年6月30日

发表回复

登录后才能评论

OpenAI SearchGPT 官方演示大翻车，源代码竟暴露搜索机制

相关推荐

发表回复