据报道,据外电报道,OpenAI 刚刚宣布近期进行了小规模预演一个名为语音引擎的新工具的诞生。
这是一种声音克隆技术,可以通过分析 15 秒的音频样本来模仿任何说话者。该公司表示,它可以生成自然的语音和情感丰富且真实的声音。
该模型还可以执行语音克隆。它的工作原理是这样的:人类说话者通过手机或计算机麦克风录制 15 秒的语音片段,OpenAI 的语音引擎会生成与原始说话者非常相似的自然语音,并且可以在以后使用,大声说出人类用户输入的任何文本。
该技术基于本公司预先存在的文本转语音 API。自 2022 年以来,这项工作一直在进行中。OpenAI 已经在使用该工具集的一个版本来支持当前文本转语音 API 和 Read Aloud 功能中可用的预设语音。该公司的官方博客上有一堆样本,它们听起来非常接近真实的东西。(鞭牛士)