
据外媒报道,人工智能巨头OpenAI正整合内部多个团队,全力推进音频人工智能技术的研发,旨在为其即将推出的语音优先智能设备铺平道路。这一战略调整显示出,OpenAI正积极向以语音为核心的自然交互未来迈进。
据悉,在过去两个月里,公司已将工程、产品和研究团队进行重组,集中资源攻坚音频交互技术。其核心目标是提升语音模型的对话质量和响应速度,以克服当前语音AI在准确性与流畅度上仍逊色于文本模型的短板。为此,OpenAI计划于2026年第一季度推出新一代音频模型。
值得注意的是,新一代模型将致力于实现更自然、富有情感的语音输出,并重点优化实时打断与连续对话能力。更引人瞩目的是,该模型将支持“边听边说”的先进交互,允许设备在用户发言过程中即开始响应,从而大幅提升对话的自然感。
与此同时,此次技术升级与OpenAI的硬件战略紧密相连。据报道,公司计划在未来一年左右推出一系列语音优先的个人设备,其形态可能涵盖无屏智能眼镜等,核心设计理念是减少对屏幕的依赖,通过无缝的语音交流重塑人机交互体验。
原创文章,作者:若安丶,如若转载,请注明出处:https://www.kejixun.co/article/742951.html