近日,OpenAI 为其备受欢迎的聊天机器人 ChatGPT 发布了名为“朗读”的全新功能。该功能允许 ChatGPT 使用五种不同的声音为其回复提供朗读服务,从而为用户带来更加直观和便捷的交互体验。目前,这一功能已在 ChatGPT 的网页版、iOS 以及 Android 应用中全面上线。
值得一提的是,“朗读”功能不仅支持 37 种语言,还能自动识别文本语言并进行朗读,确保了全球用户都能享受到这一便捷服务。此外,无论是 GPT-4 还是 GPT-3.5 版本的 ChatGPT,都能无缝集成这一新功能,展示了 OpenAI 在推动多模态交互(multimodal capabilities)方面的坚定决心。
有趣的是,就在近期,OpenAI 的主要竞争对手 Anthropic 也为其人工智能模型添加了类似的功能,这无疑加剧了两者在技术创新方面的竞争。
回顾历史,ChatGPT 在 2023 年 9 月率先推出了“语音聊天”功能,允许用户通过语音直接与聊天机器人交流,省去了繁琐的文本输入过程。如今,随着“朗读”功能的上线,用户还可以选择让 ChatGPT 将回复内容朗读出来,甚至可以将此设置为默认的回复方式。
在移动应用上,用户只需简单长按文本,即可启动“朗读”播放器,并轻松进行播放、暂停或快退等操作。而在网页端,用户只需点击文本下方的扬声器图标,即可立即享受朗读服务。这一系列的优化和更新,无疑为 ChatGPT 的用户带来了更加丰富的交互体验。