新火种AI|OpenAI再发大招推出Voice Engine！

作者：新火种发布时间：2024-04-01

作者：小岩

编辑：彩云

许久没有新动作的OpenAI最近显得颇为低调。但事实上，对于这些卷的不能再卷的AI头部公司而言，没有人是敢躺平的。大家不是在发布新品，就是在研发新品的路上。

3月30日，OpenAI宣布推出全新的人工智能模型——Voice Engine。这并非是一个全新的模型，事实上，自2022年开始，OpenAI便默默布局，开展了对于该模型的研发工作。

工作原理简单而高效！能够驾驭合成声音所带来的挑战和机遇。

对于这款最新发布的模型，OpenAI官方推特的措辞异常小心而谨慎，它表示，“我们正在分享从 Voice Engine模型的小规模预览中获得的经验体会”。事实上，Voice Eengine所呈现出来的工作效率的确是简单而高效的。

Voive Engine最大的特点在于语音克隆。其中的工作原理很简单：用户仅需通过电话或电脑麦克风录制一段15秒的声音片段，OpenAI的语音引擎便能生成“与其声音高度相似的自然语音”。在此之后，无论是面对什么样的文本，它都能以近乎完美的克隆声音进行朗读。

这项技术的问世，显然会对那些经常录制自己语音的人，诸如播客，配音艺术家，口语表演者，有声书和广告解说员，游戏玩家，流媒体主播，客户服务代理，销售人员等众多职业产生重大影响。

除此之外，OpenAI还特别强调了语音引擎在支持非语言个体方面的独特能力。它能为这些个体提供个性化的，非机械化的声音，为那些有语言障碍或学习需求的人提供治疗和教育方面的帮助。

一旦技术得以成行，Voice Engine不仅能实现更真实的人声复刻，更重要的是，它还能适用于各种场景的应用，诸如为孩童朗读故事，企业产品介绍，医疗咨询服务，为语言障碍者提供帮助等。它不仅支持多种语言，更能模仿出不同的语调和情感，应用不可谓不广泛。

Voice Engine由来已久，相关应用早已有之。

正如我们前文所提到的那样，早在 2022 年底，OpenAI 便开发了 Voice Engine 并将其用于支持文本到语音 API 中的预设语音以及 ChatGPT 语音和朗读。所以，在展望Voice Engine未来可能产生的广泛应用场景之前，我们不妨看看它曾经有过哪些实用案例。

首先，Voice Engine可以通过自然，富有感情的声音为非阅读者和儿童提供阅读帮助。这些声音不是呆板的预设声音，它代表了更广泛的说话者。譬如一家名为Age of Learning 的教育技术公司就一直在使用 Voice Engine 生成预设的画外音（voice-over）内容。他们还利用 Voice Engine 和 GPT-4 创建实时且个性化的回应，从而与学生进行互动。

其次，Voice Engine可以翻译视频和播客等方面的内容。通过使用Voice Engine，创作者和企业可以用自己的声音流利地向世界各地更多的人进行传播。据悉，HeyGen便是这方面的早期应用者之一。HeyGen是一个人工智能视觉故事平台，通过使用 Voice Engine 进行视频翻译，将演讲者的声音翻译成多种语言，从而覆盖全球受众。值得一提的是，即便是翻译，Voice Engine也会保留原说话者的母语口音，譬如带有法语口音的英语等。

此外，Voice Engine可以为不会说话的人群提供支持：为患有影响语言的疾病的人群提供治疗应用；为有学习需求的人群提供教育增强功能等。譬如它能够为不会说话的人群提供多种语言的独特非机器人语音。用户可以选择最能代表自己的语音，对于多语种用户，它也能使每种口语都保持一致的语音。

担心合成技术可能会被滥用，暂时没有完全公开的计划。

尽管语音生成式AI被认为是OpenAI的又一次巨大突破，但很显然，官方并不急于向外界完全公开Voice Engine。究其原因，主要是因为合成语音技术具有巨大的风险，很可能会被滥用。特别是最近一段时期，由合成语音引发的电信诈骗，版权侵害等社会风险问题层出不穷，这些都是OpenAI做出“暂不公开”选择的重要原因。OpenAI也表示，在开发的过程中，一直在与政府，媒体，教育等社会各界的美国和国际合作伙伴接触，保证听取和采纳反馈。特别当下这处于美国大选时期，OpenAI又正与政府和外部企业合作，势必会采取必要的安全措施和谨慎的态度。

无独有偶，OpenAI于2月推出了视频生成AI“Sora”也同样未对外界公开。面对生成式AI技术日益普及所引发的滥用风险，OpenAI对商用化明显采取了较审慎的态度，以确保安全和负责任的使用。

当然，我们无法否认，生成式AI的潜力是无穷的，终究要有落地应用的一天。相较于始终保持“审慎开放”，乃至“拒绝开放”的态度，我们莫不如提前做好评估和防范。譬如要逐步淘汰基于语音的身份验证作为访问银行账户和其他敏感信息的安全措施；教育公众了解AI技术的能力和局限性,包括存在欺骗性AI内容的可能性；加快开发和采用追踪视听内容来源的技术,以便随时明确您是与真人还是与AI互动等举措，都是势在必行的。无论OpenAI是否会广泛部署这项技术，我们大家都要了解它的发展方向。

最后，我们再来讨论一个问题：在生成式AI领域，OpenAI是否依旧领跑？

从2022年便孵化出了Voice Engine这一点来看，OpenAI是早就开始布局合成语音这一赛道了。从某种程度上说，现在分享的最早期版本很可能只是在小秀肌肉，内部应该已经完成了强力迭代。而且，根据The Information的独家报道，微软和OpenAI将合力打造一台成本高达1000亿美元，拥有数百万个GPU的超级计算机“Stargate （星门）”。它将为OpenAI的人工智能提供巨大的动力和算力会，不夸张的说，照比现在微软给OpenAI的支持直接提升几个量级。

此外，从OpenAI通篇官宣文来看，OpenAI不会在短期内向公众推出合成语音领域的更新了，毕竟这个赛道日趋敏感。这或许是出于重塑企业形象和公信力的需要。未来我们或许可以期待OpenAI将Sora和Voice Engine以怎样的模式集成到下一代 GPT。一旦这样的GPT得以成行，OpenAI在生成式领域的霸主地位将不可动摇。

生物学科虽然在高中课程中不是主要学科，但是生物学是21世纪最有发展前景的学科之一，它作为自然科学领域的带头学科，将会有极大的发展空间; 另一方面，人类社会在新世纪面临的人口、粮食、资源、环境和健康问题将更加突出，而这些问题的解决，都将在很大程度上依赖于生物科学的进步;而且生物学在高考理科综合试卷中占有举足轻重的地位。因此，我们没有理由不学好生物。今天，学姐给大家整理了“高中生物高清思维导图总结”，很多同学领到了都说很有用，这次无常分享给你们，guan+ping666发你完整版哦~ [图片] [图片] [

11棉花糖吖22 2024-12-29

搜索一号 2024-12-29

新年将至，很多人都想要通过一份礼物，表达自己的心意。如果你恰好有换机需求，并且你的送礼预算在3000元左右，华为nova 13系列或许是很值得考虑的好礼，它不仅拥有格纹变奏设计的高颜值，是点缀穿搭的时尚单品，而且影像表现也非常强大，有前后多焦段人像、达芬奇人像引擎、多项AI修图功能，是记录生活的出片神器。对于年轻人而言，各种聚会不仅是与朋友、同学、亲戚联络感情，更是通过一些方式展现自己。而在穿搭中，手机就承担与首饰一样的点缀穿搭作用。华为nova 13系列之所以颜值出众，很适合点缀穿搭，是因为主打的洛登绿

科技命脉 2024-12-29

BA系统应该具备什么特点？速力思为你解答

前两期，我们给大家介绍了速力思国产BA系统的一些功能介绍。目前，市面上的群控系统主要采用DDC或者PLC方案，整体上能够满足控制需求。但是大部分为非国产品牌，面临着整体费用高，调试配置复杂周期长等问题。那我们的BA系统和目前市面上其他BA系统有什么区别，有什么独特的地方呢？今天，我们给大家详细介绍下。为什么选择速力思BA系统1、全国产化速力思BA系统采用国产化设备，在目前国产化趋势下，做到软硬件自主可控。2、控制效率高系统拥有更高效的控制效率，控制周期（循环扫描周期）最快可达10ms，能快速控制响应。3、

SHOONIS速力思 2024-12-29

新火种AI|OpenAI再发大招推出Voice Engine！

推荐体验

相关资讯

OpenAI再发大招推出Voice Engine！让失语者发声只需要15秒音频...

OpenAI可能会推出Jarvis一样的个人助理！OpenAI新商标Voice Engine透露的信息总结！

OpenAI首次展示语音生成模型Voice Engine：可复制原声

全球科技早参丨OpenAI发布语音模型Voice Engine

OpenAI首次展示音频模型Voice Engine 15秒即可复制原音

近期资讯

2024欧女奥赛印度选拔赛平几题解析

【高中生物】高清思维导图总结，就凭它，生物也能冲上85+！

施乐百RD13S-2EP.WD.2R风机

飞思图像处理软件2024中文版Capture One Pro Enterprise v16.4.3.2158支持系统WinMac

谷歌优化快速提高排名的5大技巧分享

今晚七点，25土木考研复试准备计划交流会见

高中政治学考，合格考会考必背选择题50道

格纹变奏设计+前后多焦段人像，年末送礼首选华为nova 13系列

BA系统应该具备什么特点？速力思为你解答

高中政治核心必背知识点！背完稳了！！！

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响