OpenAI ChatGPT 整合语音模式,实现多模态无缝交互

OpenAI近日宣布,其旗下的ChatGPT已正式将“语音模式”整合进主聊天界面,标志着用户与AI的互动体验迈向全新的多模态阶段。此次更新使用户能够在进行语音对话时,不仅能通过语音提问和接收语音回答,还能实时查看与对话内容相关的视觉信息,例如地图、图片和图表,同时系统会自动生成完整的文字转录稿,极大地提升了信息传递的效率和用户交流的丰富性。

此前的语音对话功能是一个独立的模块,用户需要手动切换。而本次更新后,用户可以直接在主聊天窗口启动语音交互,实现了语音与文本的无缝融合,使得整体使用体验更为流畅和高效。 例如,在OpenAI的演示中,当用户通过语音提问时,ChatGPT能够自然流畅地进行语音回答,并在聊天界面中实时展示相关视觉内容,如列出热门面包店的地图和烘焙食品图片。

为满足不同用户的偏好,OpenAI在本次更新中还提供了一个“后悔药”选项。对于那些更喜欢沉浸式纯音频对话体验的用户,新的设置菜单中增加了一键切换至旧版独立语音模式的功能。 此次更新已面向所有ChatGPT移动应用和chatgpt.com的用户全球推出。

OpenAI表示,此次整合是其在AI产品领域持续探索和创新的体现。公司此前已推出多项新功能,包括用于商品比价的AI购物助手、支持iCloud钥匙串的Atlas AI浏览器功能,以及在部分地区上线的群聊功能等。 这些举措均反映出OpenAI在扩展AI应用边界方面的持续努力,致力于为用户提供更自然、更智能的交互方式。

上一篇:

下一篇:

发表回复

登录后才能评论