‌OpenAI升级ChatGPT语音模式:主界面整合多模态交互,支持实时视觉内容展示

‌OpenAI升级ChatGPT语音模式:主界面整合多模态交互,支持实时视觉内容展示

近日,OpenAI发布官方博文,宣布将ChatGPT的“语音模式”(Voice Mode)全面整合至主聊天界面,标志着其多模态交互能力再进一步。此次更新后,用户无需切换独立模块,即可在主窗口直接启动语音对话,同时享受文本、图像、地图等视觉信息的实时呈现,显著提升了交互的无缝性与功能性。

新版语音模式的核心突破在于视觉与听觉的协同输出。根据演示,当用户通过语音提问时,ChatGPT不仅能以自然语音回应,还会在聊天界面同步显示相关图表、图片或地图等辅助内容,并自动生成文字转录稿供用户回溯。这一设计尤其适用于需要多维度信息支持的场景,例如旅行规划或数据分析。为兼顾不同用户习惯,OpenAI在设置中保留了“独立语音模式”的切换选项,允许偏好纯音频体验的用户一键还原旧版界面。

此次更新是OpenAI战略布局的最新一环。此前,该公司已陆续推出AI购物助手、Atlas浏览器功能(支持iCloud钥匙串)、群聊功能及GPT-5.1模型等创新。通过持续迭代产品边界,OpenAI正逐步构建更全面的AI生态,而语音与视觉的深度融合,无疑为其应用场景拓展提供了新的想象空间。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/739532.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论