OpenAI 在官方博客分享一个名为“Voice engine 语音引擎”模型的预览,该模型仅需使用单个 15 秒音频样本,然后通过文本输入来生成与原始说话者非常相似的自然语音,即,我们经常提到的“AI语音克隆”技术。
“Voice Engine”在音色、语音连贯性以及自然度、清晰度方面在目前的同类产品中“遥遥领先”。
企业如何合规、稳定使用微软语音服务及OpenAI?
出于合规角度,建议国内企业可以选择微软的Azure OpenAI服务来使用接口。
通过微软官方合作伙伴获取服务,企业用户可以合规、稳定地使用ChatGPT,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。
作为微软的合作伙伴,全云在线可为企业开通绿色申请通道!包括最新版本VALL-E 2、GPT-4o、Dalle-3等,只要企业有需求,全云在线都能协助快速开通!
参考链接:https://azureopenai.cloudallonline.com/?zxwsh80
企业微软 Azure OpenAI 免费试用申请
OpenAI于 2022 年底开始开发Voice Engine,并用它来支持text-to-speech文本转语音 API 以及 ChatGPT Voice and Read Aloud语音和朗读中可用的预设语音。与此同时,由于考虑到克隆合成语音滥用的可能性,采取谨慎和知情的方式来进行更广泛的发布。OpenAI希望就合成声音的负责任部署以及社会如何适应这些新功能展开对话。
早期应用
为了更好地了解这项技术的潜在用途,OpenAI开始与一小群值得信赖的合作伙伴私下测试它,该小组开发的应用程序留下了深刻的印象。这些小规模部署有助于为OpenAI提供方法、保障措施和思考如何将语音引擎用于各个行业的良好效果。一些早期的例子包括:
同期录音网LS
,赞3
构建安全语音引擎
OpenAI特别提到了AI语音的安全性问题,生成难以分辨的语音存在严重风险,这在“选举年”尤其值得关注,正在与来自政府、媒体、娱乐、教育、民间社会等领域的美国和国际合作伙伴合作,以确保在建设过程中吸收他们的反馈。
展望未来
“语音引擎 Voice Engine”是OpenAI致力于了解技术前沿并公开分享人工智能的承诺的延续。根据对人工智能安全的态度和自愿承诺,选择预览但目前不广泛发布这项技术。希望语音引擎的这次预览既能强调其潜力,又能激发增强社会抵御力的需求,以应对越来越令人信服的生成模型带来的挑战。具体来说,鼓励社会采取以下措施:
OpenAI还提到,重要的是世界各地的人们都了解这项技术的发展方向,无论最终是否广泛部署它。
这意味着未来很有可能人类都不再将语音作为识别其它人真实性的一个感知手段,这不仅对创作甚至对人类和社会发展都产生深远影响。
陈根谈科技 2024-12-29
222小2 2024-12-29