OpenAI藏了1年多的技术正式公开！15秒素材克隆声音，HeyGen也在用

作者：量子位发布时间：2024-03-30

克雷西发自凹非寺

量子位 | 公众号 QbitAI

OpenAI雪藏的新产品——语音合成引擎Voice Engine，终于被正式揭幕。

有了它，只需15秒的语音样本，就能克隆出一个人的声音，而且还能跨越语言！

APP版ChatGPT中的语音对话功能，也正是由这项技术所驱动。

效果如何？先来听段DEMO：

Salt also makes sure we stay hydrated which means there is enough water in our body for it to properly function.

盐分也可以保持人体内的水分，确保其满足正常功能的需要。

而OpenAI通告显示，他们在2022年底就已经开发出了这项技术，但出于安全考虑一直没有正式发布。

这次，OpenAI终于官宣了Voice Engine，并展示了小规模测试中的几个应用案例。

比如，一家非营利医疗机构就利用这项技术，为一名年轻的病人恢复了她的声音。

另外值得一提的是，去年爆火的视频翻译软件HeyGen，采用的语音引擎也正是Voice Engine。

那么，这次OpenAI还展现了哪些效果，下面就来一睹为快。

用AI帮助病患恢复声音

首先是利用基础的语音合成能力，为儿童等不具备文字阅读能力的群体提供阅读辅助。

比如一家儿童教育技术公司，就一直在使用Voice Engine来给编写好的画外音内容配音。

DEMO中生成的大段内容，都是基于这样一段15秒的样本：

然后，就可以合成相同音色的长段语音：

再来看看HeyGen中用到的的语音翻译技术，原始素材是一段英语的音频：

它被用原始的音色，翻译成了普通话、法语、德语等多种语言。

忽略译文的质量，只听声音，中文的效果是这样的：

音色保持的还算不错，不过腔调很明显一听就是外国人在说中文。

至于这到底是个bug还是个feature，就见仁见智了（手动狗头）。

此外，一款名为Livox的残障人士辅助应用，也利用Voice Engine为不能说话的残障人士“发出声音”——

在有了Voice Engine之后，TA们可以选择专属的真人音色，而不再是机械感明显的合成音，并且在各种语言之间都能保持音色的一致性。

不只是帮助残障人士拥有自己的声音，Voice Engine还可以为因疾病导致声音发生在重大改变的人群，恢复患病之前声音，只要有以前的声音样本就能实现。

一名年轻的患者因罹患血管性脑肿瘤，失去了流利讲话的能力，说话变成了这样：

医生从她所在学校录制的视频中提取到了她患病前的声音作为样本，在Voice Engine的帮助下为她恢复了此前的音色。

此次发布的案例，特别是为不便人士提供帮助的场景受到了不少好评，但也有网友对这项技术的滥用表达了担忧。

安全问题需要全社会共同关注

实际上，安全问题也是OpenAI迟迟未将这项技术公之于众的主要考量。

出于安全考虑，前面案例的开发者都经过了OpenAI的严格筛选，并且需要承诺遵守使用协议。

这些开发者被要求必须明确说明声音是合成的，并且设定了黑名单以防止克隆公众人物声音。

此外，OpenAI还向合成的声音中添加了水印，以便出现问题时可以进行检测监控，同时呼吁人们采取措施共同应对这一问题：

在银行等敏感信息的安全验证措施中逐步淘汰语音验证方式
探索AI时代下个人声音的保护措施
教育公众理解AI的局限性，并了解其被用于欺诈的可能
加速开发跟踪溯源技术，让人们能够清晰辨别出真人和AI

参考链接：

https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

— 完—

评选报名即将截止！

2024年值得关注的AIGC企业&产品

量子位正在评选 2024年最值得关注的AIGC企业、 2024年最值得期待的AIGC产品两类奖项，欢迎报名评选！评选报名 截至2024年3月31日

中国AIGC产业峰会「你好，新应用！」已开启报名！点击报名参会同时，峰会将进行线上直播 ⬇️

点这里👇关注我，记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

近期资讯

什么值得买上线“微信送礼”专题：强化礼遇场景，服务送礼需求

12月26日，“什么值得买”上线“微信送礼贴心小助手”专题（以下简称“送礼专题”），旨在梳理好礼清单，结合近期爆火的微信小店灰度测试的“送礼物”功能，在“双旦”礼遇季来临之际，帮助更多网络消费者解决送礼决策难题。

砍柴网 2024-12-26

常润股份获得实用新型专利授权：“一种卧式千斤顶多功能手柄装置”

证券之星消息，根据天眼查APP数据显示常润股份（603201）新获得一项实用新型专利授权，专利名为“一种卧式千斤顶多功能手柄装置”，专利申请号为CN202421145236.X，授权日为2024年12月27日。

证券之星 2024-12-27

吾空推出“寻梦西游”迷你电脑主机：R7-7840HS准系统 3099 元

在此基础上，16GB内存+512GB固态硬盘版本加价300元，16GB内存+1TB固态硬盘版本加价500元。这款主机最特别的地方在于支持“顶盖DIY”，用户可以在相框内随意更换插画、照片。

IT之家 2024-12-26

微信小窗口聊天功能：提升沟通效率与多任务处理体验

在如今这个信息爆炸的时代，聊天工具已经成为我们日常生活中不可或缺的一部分。而微信作为最受欢迎的社交软件之一，凭借其简洁的界面和丰富的功能，吸引了大量用户。今天，我们就来聊聊微信的小窗口聊天功能，这个小巧而实用的功能，能让你的聊天体验更加顺畅。说到小窗口聊天，很多人可能会觉得这个功能有点陌生。

新报观察 2024-12-27

精测电子获得实用新型专利授权：“一种自动开关门结构及其生产设备”

证券之星消息，根据天眼查APP数据显示精测电子（300567）新获得一项实用新型专利授权，专利名为“一种自动开关门结构及其生产设备”，专利申请号为CN202420748416.0，授权日为2024年12月27日。专利摘要：本申请涉及一种自动开关门结构及其生产设备，属于光学检测生产设备技术领域。

证券之星 2024-12-27

三星预感可折叠手机不好卖？拟增加Galaxy S出货量削减折叠屏手机

智通财经APP获悉，据韩国新闻网站ETNews最新报道，由于可折叠消费电子设备销售额增速缓慢，且担忧销量可能不及预期而影响利润，韩国科技巨头三星电子(SamsungElectronics)计划在2025年增加其GalaxyS系列产品的出货量，同时下调可折叠屏手机GalaxyZ系列的销售目标，并将更多注意力放在旗舰智能手机机型上。

金融界 2024-12-26

京东方独供一加 Ace 5 系列手机屏幕

IT之家12月26日消息，一加Ace5系列手机今日正式发布，系列新机分别搭载高通骁龙8Gen3/至尊版处理器，配备旗舰同款索尼IMX906主摄，售价2299/3399元起（12GB+256GB）。京东方官方今日发文认领了一加Ace5系列手机屏幕，称系列新机搭载由京东方独供的6.78英寸1.5K120Hz高刷OLED屏幕。

IT之家 2024-12-26

美国联邦航空管理局对部分波音777飞机发布适航指令

据美国政府联邦公报，美国联邦航空管理局（FAA）12月26日建议对波音公司的部分777-200、-200LR、-300、-300ER和777F系列飞机采用新的适航指令（AD）。美国联邦航空管理局称，报告显示一架飞机在仪表着陆系统进近过程中出现滑行道波束异常。

每日经济新闻 2024-12-26

掌握Photoshop去除图片背景的实用技巧与步骤指南

在数字化时代，处理图片已经成为我们日常生活中的一部分。无论是为了社交媒体的美化，还是为了工作上的需要，去除图片背景的技能都是非常实用的。虽然初看起来可能有点复杂，但只要掌握了几个关键步骤，你会发现这其实并没有想象中那么难。

新报观察 2024-12-27

小i机器人(AIXI.US)盘前涨超27% 公司专注于认知智能的自主研发和产业化应用

周四，小i机器人(AIXI.US)盘前涨超27%，报6.70美元。据了解，小i机器人是一家主要通过其境内实体子公司上海智臻智能网络科技股份有限公司运营。

金融界 2024-12-26

OpenAI藏了1年多的技术正式公开！15秒素材克隆声音，HeyGen也在用

推荐体验

相关资讯