谷歌发布Gemini Live服务,开启AI语音聊天新纪元

谷歌发布Gemini Live服务,开启AI语音聊天新纪元

在今日举行的Pixel 9系列手机发布会上,谷歌正式推出了Gemini Live服务,该服务将首先面向使用英语的Gemini Advanced订阅用户开放,为用户带来前所未有的自然、流畅的对话交流体验。

Gemini Live是谷歌在AI语音技术领域的又一力作,旨在通过增强的语音引擎,实现更加连贯、富有情感表达力和逼真感的多轮对话。这一服务的推出,无疑是对标了OpenAI ChatGPT最新上线的Advanced Voice模式,进一步推动了AI语音聊天技术的发展。

据谷歌介绍,Gemini Live提供了一种全新的移动对话体验,让用户能够轻松与Gemini展开自由流畅的对话。用户不仅可以在聊天过程中打断Gemini的发言,提出后续问题,还能实时适应Gemini的说话模式,实现更加自然的交流。此外,Gemini Live还提供了10种新的自然声音供用户选择,让对话体验更加个性化。

在发布会上,谷歌还展示了Gemini Live在模拟面试场景中的应用。通过Gemini Live,用户可以与招聘经理(或人工智能)进行对话,获得演讲技巧推荐和优化建议。这一功能不仅有助于提升用户的面试表现,还展示了Gemini Live在实际应用中的广泛潜力。

值得注意的是,虽然Gemini Live在语音聊天方面取得了显著进展,但目前尚不支持多模态输入功能。谷歌在今年5月的I/O大会上曾展示过Gemini Live通过手机摄像头捕捉环境信息并做出反应的能力,但这一功能将推迟到“今年晚些时候”推出。谷歌方面表示,多模态输入的加入将进一步丰富Gemini Live的交互方式,为用户带来更加全面的智能体验。

随着Gemini Live服务的正式推出,谷歌在AI语音聊天领域的领先地位得到了进一步巩固。未来,随着技术的不断发展和完善,我们有理由相信Gemini Live将为用户带来更多惊喜和便利。

原创文章,作者:Google,如若转载,请注明出处:https://www.kejixun.co/article/673688.html

Google的头像Google认证作者

相关推荐

发表回复

登录后才能评论