OpenAI ChatGPT 整合语音模式，实现多模态无缝交互

OpenAI近日宣布，其旗下的ChatGPT已正式将“语音模式”整合进主聊天界面，标志着用户与AI的互动体验迈向全新的多模态阶段。此次更新使用户能够在进行语音对话时，不仅能通过语音提问和接收语音回答，还能实时查看与对话内容相关的视觉信息，例如地图、图片和图表，同时系统会自动生成完整的文字转录稿，极大地提升了信息传递的效率和用户交流的丰富性。

此前的语音对话功能是一个独立的模块，用户需要手动切换。而本次更新后，用户可以直接在主聊天窗口启动语音交互，实现了语音与文本的无缝融合，使得整体使用体验更为流畅和高效。例如，在OpenAI的演示中，当用户通过语音提问时，ChatGPT能够自然流畅地进行语音回答，并在聊天界面中实时展示相关视觉内容，如列出热门面包店的地图和烘焙食品图片。

为满足不同用户的偏好，OpenAI在本次更新中还提供了一个“后悔药”选项。对于那些更喜欢沉浸式纯音频对话体验的用户，新的设置菜单中增加了一键切换至旧版独立语音模式的功能。此次更新已面向所有ChatGPT移动应用和chatgpt.com的用户全球推出。

OpenAI表示，此次整合是其在AI产品领域持续探索和创新的体现。公司此前已推出多项新功能，包括用于商品比价的AI购物助手、支持iCloud钥匙串的Atlas AI浏览器功能，以及在部分地区上线的群聊功能等。这些举措均反映出OpenAI在扩展AI应用边界方面的持续努力，致力于为用户提供更自然、更智能的交互方式。

OpenAI ChatGPT 整合语音模式，实现多模态无缝交互

发表回复