当前位置：首页|资讯|OpenAI

OpenAI推出全新语音引擎只需15秒样本即可完成

作者：铋读发布时间：2024-04-16

近期，OpenAI宣布推出其最新开发的文本转语音生成平台，名为“语音引擎”，并提供有限访问权限。该平台可以根据15秒的语音片段创建合成语音，能够以与说话者相同的语言或多种其他语言朗读命令文本提示。这一新技术旨在为各个行业提供更广泛的应用，并为OpenAI自身的方法和保障措施提供信息。

在OpenAI的博客文章中指出，通过小规模部署此技术，有助于他们了解如何将语音引擎应用于各个行业，并为其技术的进一步发展提供反馈和数据支持。已被授权访问的公司包括教育科技公司Age of Learning、视觉讲故事平台HeyGen、一线健康软件制造商Dimagi、人工智能通信应用程序创建者Livox和健康系统Lifespan。

据OpenAI透露，该语音引擎技术的开发始于2022年底，已经为文本转语音API和ChatGPT的朗读功能提供了预设语音。OpenAI语音引擎产品团队成员杰夫·哈里斯在接受TechCrunch采访时表示，该模型是通过许可数据和公开数据的组合进行训练的。OpenAI告诉该出版物，目前仅有大约10名开发人员获得了此模型的开放权限。

语音生成技术一直是人工智能领域不断发展的一部分。虽然大多数人关注的是乐器或自然声音的生成，但语音生成技术的应用潜力巨大。一些公司如Podcastle和ElevenLabs已经开始探索人工智能语音克隆技术和工具的应用，这进一步证明了这一领域的前景和潜力。

OpenAI的语音引擎的推出标志着文本转语音技术的进一步演进，为各行业提供了更多可能性，同时也为该领域的发展提供了新的动力和方向。

推荐体验

相关资讯

OpenAI语音模型“炸场” 15秒样本即可复刻人声

继文生视频大模型Sora后，近日，OpenAI终于将按捺许久的语音引擎模型—VoiceEngine公之于众。利用文本输入和单个15秒音频样本，VoiceEngine就能生成与原说话者非常相似且情感丰富的自然语音。不过，和文本生成视频模型Sora一样，目前OpenAI只针对少部分内测用户开放VoiceEngine。

21世纪经济报道 2024-04-01

15秒样本生成乱真语音，OpenAI低调“试听”，建议银行关闭语音认证

15秒样本生成乱真语音，OpenAI低调“试听”，建议银行关闭语音认证 OpenAI非常低调地发布了强大的语音模拟和生成技术：Voice Engine (声音引擎)。 “今天，我们分享一些浅见

未尽研究 2024-03-30

用15秒样本就能克隆原声！OpenAI首次公布语音模型

用15秒样本就能克隆原声！OpenAI首次公布语音模型当地时间3月29日， OpenAI分享语音生成模型Voice Engine的预览，只需15秒样本语音就能生成声线相似的新音频，还能将合成语

封面新闻 2024-04-01

15 秒音频即可“复制”原声！但OpenAI 担心新语音模型被滥用而限制发行

造假风险该如何应对？

傅宇琪 2024-04-02

OpenAI推出语音克隆人工智能模型：可从15秒音频样本模仿任何说话人

鞭牛士报道，3月30日消息，据外电报道，OpenAI刚刚宣布近期进行了小规模预演一个名为语音引擎的新工具的诞生。该公司表示，它可以生成自然的语音和情感丰富且真实的声音。

OpenAI 人工智能

鞭牛士 2024-03-30

近期资讯

微信“送礼物”，看上去很美？

微信最近推出的“送礼物”功能，允许用户在微信小店中为朋友挑选并赠送商品，这一新举措在社交媒体上引发了讨论。本文将深入探讨这一功能的潜在影响，分析它如何融入微信的社交和电商生态，并讨论它可能带来的商业机会和挑战。

判官 2024-12-26

刚哥讲故事（3）Zelle转账漏洞的警示

在数字支付日益普及的今天，安全问题成为了我们不得不面对的挑战。本文深入探讨了国际支付巨头Zelle在即时转账交易中存在的支付漏洞，并分析了这些漏洞如何被诈骗分子利用，给消费者带来巨大财产损失。

刚哥 2024-12-26

AI都这么好用了，要不试试用视频形式做年终总结？

在快速发展的数字时代，视频内容已成为信息传递和总结的重要方式。本文将探讨如何利用AI技术和视频制作工具，轻松创建高质量的年终总结。

58UXD 2024-12-26

北京京能能源技术研究有限责任公司申请基于图像捕捉数据的行为识别专利，提高识别行为准确性

金融界2024年12月26日消息，国家知识产权局信息显示，北京京能能源技术研究有限责任公司申请一项名为“基于图像捕捉数据的行为识别方法、装置、设备及介质”的专利，公开号CN119181134A，申请日期为2024年8月。

金融界 2024-12-26

调研近千名真实用户，我们弄清了「乐子」是如何变成「金子」的

在当今社会，喜剧综艺节目（喜综）已经成为人们生活中不可或缺的一部分，它们不仅仅是娱乐的源泉，更是情感共鸣和社会话题的放大器。本文深入探讨了喜综如何从一种文化现象转变为强大的商业力量，揭示了“乐子”背后的商业价值。

增长黑盒 2024-12-26

旗捷科技取得升级设备专利，解决升级设备可靠性较差的问题

金融界2024年12月26日消息，国家知识产权局信息显示，杭州旗捷科技股份有限公司取得一项名为“升级设备”的专利，授权公告号CN222202052U，申请日期为2024年4月。

金融界 2024-12-26

朗帝科技取得喷码机喷头喉管加温装置专利，保证墨水不冻结

金融界2024年12月26日消息，国家知识产权局信息显示，朗帝科技有限公司取得一项名为“一种喷码机喷头喉管加温装置”的专利，授权公告号CN222202047U，申请日期为2024年3月。

金融界 2024-12-26

Kaken与强生签订Stat6全球许可协议

36氪 2024-12-26

合盛智联申请行为姿态识别分析方法及系统专利，提高姿态识别结果的准确性

金融界2024年12月26日消息，国家知识产权局信息显示，成都合盛智联科技有限公司申请一项名为“一种行为姿态识别分析方法及系统”的专利，公开号CN119181137A，申请日期为2024年9月。

金融界 2024-12-26

名创优品跨年优惠，员工快要卷疯了

随着年末的临近，名创优品推出了一系列跨年优惠活动，旨在吸引顾客并促进销售。然而，这些优惠背后隐藏着员工们的压力和挑战。本文将带您深入了解名创优品的跨年优惠策略，探讨这些活动对员工的影响，以及它们如何适应当前的IP联名潮流。

智商税研究中心 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1