播客翻译可以听原声？Spotify测试新AI语音翻译，OpenAI提供技术支持

作者：智东西发布时间：2023-09-27

智东西

编译 | 陈佳慧

编辑 | 徐珊

智东西9月27日消息，据路透社报道，流媒体公司Spotify Technology（SPOT.US）正在测试一项AI功能，该功能可以把播客内容翻译成其它语言，并且能够复刻原始演讲者的声音，来呈现翻译成其它语言后的内容。

Spotify称，他们这个AI语音翻译功能，由OpenAI的语音识别模型Whisper提供技术支持，能够在翻译时模仿原始演讲者的风格，并且比传统配音更加自然。使用这个功能或许能让播客扩大受众群体面，用户也将获得无缝切换语言的听力体验。

▲Spotify公司的Logo（图源：The Verge）

据The Verge报道，Spotify将要推出的AI语音翻译功能，既能转录英语语音，也能将其他语言翻译成英语。并且据路透社报道，Spotify称，AI语音翻译将提供西班牙语、法语和德语等语言版本，播客或许可以通过这项功能扩大节目的观众群体。

同时，Spotify的AI语音翻译功能不仅能完成语音到文本的翻译，还能通过复刻技术，把翻译成其它语言的内容用播客们自己的声音呈现出来。Spotify的个性化副总裁Ziad Sultan在一份声明中说，“相较于以往的翻译文本，AI语音翻译功能通过匹配创作者自己的声音，能够让全球听众用更真实、亲切、生动的方式，来发现新的播客，并从中获得灵感。”

据The Verge报道，Spotify新的AI语音翻译功能的语音复制部分很可能也是由OpenAI负责的。OpenAI在9月25日上午发布了几项声明，其中包括推出一种工具。OpenAI推出的这个工具可以通过文本和几秒钟的语音样本创建类似人类声音的音频。

不过，OpenAI称，出于安全和隐私方面的考虑，他们有意限制了这个工具的使用范围。据The Verge报道，这可能也是Spotify目前只在部分特定的播客中，测试新的AI语音翻译功能的原因之一。

目前，Spotify没有详细说，计划把新的AI语音翻译工具推广至多大范围或何时进行扩展。

结语：因技术安全等问题，Spotify的新AI语音翻译推广受限

Spotify利用OpenAI的Whisper技术，将其新的AI语音翻译工具的翻译效果提升，不仅可以把语音翻译成文本，还能将翻译内容用原始演讲者的声音呈现，这或许能够帮助播客扩大节目受众面，也帮助听众获得更好的听力体验。

但因为要保护用户数据和防止用户数据被滥用，OpenAI将提供语音复制功能的工具限制了适用范围。据The Verge报道，Spotify目前只在部分特定的播客中测试新的AI语音翻译功能，可能部分原因是考虑到技术的安全问题和使用限制。或许，只有技术的安全得到保障并解开限制，Spotify的新AI语音翻译功能才能扩大推广范围。

来源：路透社、The Verge