3 月 5 日消息,今日 OpenAI 为其广受欢迎的聊天机器人 ChatGPT 推出了名为“朗读”(Read Aloud) 的新功能。该功能可以让 ChatGPT 用五种不同的声音朗读其回复,旨在为用户提供更加便捷的交互体验。目前,“朗读”功能已上线 ChatGPT 的网页端、iOS 和安卓应用。
“朗读”功能不仅支持 37 种语言,还可以自动检测文本语言并进行朗读。值得注意的是,该功能同时适用于 GPT-4 和 GPT-3.5 版本的 ChatGPT。这一更新展示了 OpenAI 在“多模态交互”(multimodal capabilities) 方面所做的努力,即赋予人工智能模型通过多种媒介进行读取和响应的能力。有趣的是,就在不久前,OpenAI 的竞争对手 Anthropic 也在其人工智能模型中添加了类似的功能。
IT之家注意到,早在 2023 年 9 月,ChatGPT 就推出了“语音聊天”(voice chat) 功能,用户可以直接通过语音与聊天机器人对话,无需再进行文本输入。而此次推出的“朗读”功能可以让用户选择让 ChatGPT 将其文本回复朗读出来,甚至可以将其设置为默认的回复方式。
在移动应用上,用户只需长按文本即可打开“朗读”播放器,并进行播放、暂停或快退操作。网页端则会在文本下方显示一个扬声器图标,点击即可启动朗读功能。