OpenAI推出高级语音模式：提供更多声音和新外观

作者：鞭牛士发布时间：2024-09-25

鞭牛士报道，9月25日消息，据外电报道，OpenAI于周二宣布，将向 ChatGPT 的更多付费客户推出高级语音模式 (AVM)。该音频功能使 ChatGPT 的对话更加自然，将首先向 ChatGPT 的 Plus 和 Teams 层级的客户推出。

企业和教育客户将于下周开始获得访问权限。

作为此次发布的一部分，AVM 的设计也进行了改进。该功能现在由蓝色动画球体表示，而不是 OpenAI 在 5 月份展示该技术时展示的动画黑点。

当 AVM 可供用户使用时，用户将在 ChatGPT 应用程序中的语音图标旁边收到一个弹出窗口。

本周，Advanced Voice 将在 ChatGPT 应用程序上向所有 Plus 和 Team 用户推出。

在您耐心等待的同时，我们添加了自定义指令、记忆、五种新声音和改进的口音。

它还可以用 50 多种语言说“抱歉我迟到了”。pic.twitter.com/ APOqqhXtDg

— OpenAI (@OpenAI) 2024 年 9 月 24 日

ChatGPT 还新增了五种可供用户尝试的新声音：Arbor、Maple、Sol、Spruce 和 Vale。这样 ChatGPT 的语音总数就达到了 9 种（几乎与Google 的 Gemini Live一样多），此外还有 Breeze、Juniper、Cove 和 Ember。您可能会注意到，所有这些名字都受大自然的启发，这可能是因为 AVM 的整个目的是让 ChatGPT 的使用感觉更自然。

阵容中缺少 Sky 的声音，这是 OpenAI 在春季更新中展示的声音，这导致斯嘉丽约翰逊 (Scarlett Johansson) 提出法律威胁。这位在故事片《她》中扮演人工智能系统的女演员声称 Sky 的声音听起来与她自己的声音有点太相似了。OpenAI 迅速删除了 Sky 的声音，称它从未打算模仿约翰逊的声音，尽管当时有几名工作人员在推文中提到了这部电影。

此次发布中缺少的另一个功能是四个月前 OpenAI 在春季更新中首次推出的 ChatGPT 视频和屏幕共享功能。该功能旨在让 GPT-4o 同时处理视觉和听觉信息。

在演示过程中，OpenAI 的一名工作人员展示了如何在你面前的一张纸上向 ChatGPT 实时询问数学问题，或者在电脑屏幕上编写代码。目前，OpenAI 尚未提供何时推出这些多模式功能的时间表。

尽管如此，OpenAI 表示，自发布 AVM 的有限 alpha 测试以来，它已经取得了一些进步。据称，ChatGPT 的语音功能现在能够更好地理解口音，该公司表示，其对话也更流畅、更快速。在我们对 AVM 的测试中，我们发现故障并不罕见，但该公司声称现在情况已经有所改善。

OpenAI 还将 ChatGPT 的一些自定义功能扩展到 AVM：自定义指令，允许用户个性化 ChatGPT 对他们的响应方式，以及记忆，允许 ChatGPT 记住对话以供以后参考。

OpenAI 发言人表示，AVM 尚未在欧盟、英国、瑞士、冰岛、挪威和列支敦士登等多个地区推出。

OpenAI推出高级语音模式：提供更多声音和新外观

推荐体验

相关资讯

OpenAI向部分ChatGPT Plus用户推出高级语音模式

OpenAI开始为ChatGPT推出新的高级语音模式

OpenAI为部分付费用户提供ChatGPT高级语音模式

OpenAI终于兑现承诺，提供GPT-4o高级语音模式 | 钛媒体AGI

OpenAI向部分付费订阅用户开放高级语音模式提供更自然实时对话

近期资讯

分析师称高通收购英特尔可能性太低：现金太少、阻碍太多

高德、百度地图双双致歉！家电维修服务虚假报价、虚假维修

上海迪士尼将实行实名制购票：一人一证一票

曝特斯拉无人自动泊车出意外：跑到路上、一溜烟逃走了

可用上千年！中国开发效率最高辐光伏核电池！效率提8000倍

一文看懂USB4 从20Gbps到80Gbps的极速体验

国庆档10部新片片长出炉：王俊凯《749局》123分钟

爱奇艺武侠动作电影《捉刀人》定档：释小龙主演

699元！小米智能门锁E30开售：三防智能锁体六重安全系统

罗蒙男士针织衫、灯芯绒休闲长裤大促：2件到手99元

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响