OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式，可提供更自然实时对话

作者：动点科技发布时间：2024-07-31

OpenAI

OpenAI 宣布即日起向部分 ChatGPT Plus 用户开放 GPT-4o 的语音模式，并将于今年秋季逐步推广至所有 ChatGPT Plus 订阅用户。

今年 5 月，OpenAI 首席技术官米拉·穆拉蒂（Mira Murati）在演讲中提到：

在 GPT-4o 中，我们训练了跨文本、视觉和音频的端到端全新统一模型，这意味着所有输入和输出都由同一个神经网络处理。

由于 GPT-4o 是我们第一个结合所有这些模式的模型，因此我们在探索该模型的功能及其局限性方面仍处于起步阶段。

OpenAI 原计划今年 6 月底邀请一小部分 ChatGPT Plus 用户测试 GPT-4o 语音模式，但官方在 6 月宣布推迟，表示需要更多时间打磨该模型，提高该模型检测和拒绝某些内容的能力。

根据此前曝光的信息，GPT-3.5 模型的平均语音反馈延迟为 2.8 秒，而 GPT-4 模型的延迟为 5.4 秒，因此在语音交流方面不太优秀，而即将推出的 GPT-4o 可以极大地缩短延迟时间，近乎无缝对话。

GPT-4o 语音模式具有快速反应、声音堪比真人等特征，OpenAI 更称 GPT-4o 语音模式可以感知语音中的情感语调，包括悲伤、兴奋或歌唱。

OpenAI 发言人林赛·麦卡勒姆（Lindsay McCallum）表示：“ChatGPT 不能假冒他人的声音，包括个人和公众人物的声音，并且会阻止与预设声音不同的输出。”

相关资讯

OpenAI向部分付费订阅用户开放高级语音模式提供更自然实时对话

7月31日消息，据国外媒体报道，OpenAI公司宣布，已开始向少量付费订阅ChatGPT用户推出高级语音模式（AdvancedVoiceMode），让他们可以测试更自然的实时对话。ChatGPT的高级语音模式…

OpenAI ChatGPT

IT指北针 2024-08-09

OpenAI向部分用户开放GPT-4o语音模式

当地时间7月30日，OpenAI宣布，即日起开始向部分ChatGPT Plus用户推出GPT-4o的语音模式。据OpenAI介绍，高级语音模式能提供更自然的实时对话，允许用户随时打断，并能感知和响应用户的情绪。OpenAI在今年5月推出了新版本大模型GPT-4o，同时还展示出了语音模式。该公司原定于6月底开始逐步向用户开放语音模式，但最终决定推迟至7月发布。语音模式将于今年秋季向所有ChatGPT Plus用户开放。目前GPT-4o语音模式可使用四种预设声音，Juniper、Breeze、Cove和Ember，这些声音是与付费配音演员合作生成的。

OpenAI ChatGPT

2024-08-01

OpenAI 向部分用户开放 GPT-4o 高级语音模式

[图片] 开发者朋友们大家好：这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。本期编辑：@JLT，@鲍勃 01有话题的新闻 1、OpenAI 向部分付费订阅用户开放 GPT-4o 高级语音模式，可提供更自然实时对话当地时间 30 日，Open

OpenAI

RTE开发者社区 2024-07-31

OpenAI向部分用户开放GPT-4o语音模式，今秋将扩大至所有付费用户

OpenAI向部分用户开放GPT-4o语音模式，今秋将扩大至所有付费用户界面新闻2024-07-31 08:54发布于北京界面新闻官方账号当地时间7月30日，美国开放人工智能研究中心（OpenAI

OpenAI 人工智能

界面新闻 2024-07-31

OpenAI向部分用户开放GPT-4o语音模式，今年秋季将覆盖所有付费用户

多知网8月1日消息，OpenAI宣布向部分ChatGPTPlus用户推出高级语音模式，并计划于秋季向所有ChatGPTPlus用户开放。目前GPT-4o语音模式可使用四种预设声音，Juniper、Breeze、Cove和Ember，这些声音是与付费配音演员合作制作的。

OpenAI

多知网 2024-08-01

近期资讯

Solid.js 最新官方文档翻译（11）—— Effects

Solid.js，一个比 React 更 react 的框架。每一个使用 React 的同学，你可以不使用，但不应该不了解。我同时搭建了 Solid.js 最新的中文文档站点：https://soli

冴羽 2024-12-27

大模型应用— 爬虫 ScrapeGraphAI

大模型爬虫—ScrapeGraphAI 一、介绍 ScrapeGraphAI是一个网络爬虫 Python 库，使用大型语言模型和直接图逻辑为网站和本地文档（XML，HTML，JSON 等）创建爬取管道

刘不二 2024-12-28

大模型应用—AI 编程工具Cursor

AI 编程工具—Cursor 最近一款名叫cursor的工具刷屏了，打开搜索引擎直接搜索，可以看到诸多关于它的报道什么是Cursor Cursor是一个先进的AI编程辅助工具，旨在通过智能代码生成和

刘不二 2024-12-28

从零实现LevelDB 2. 从一道leetcode开始

在本节，我们将会了解： 1. 跳跃链表 2. 实现跳跃链表跳表是leveldb中一个重要的数据结构，在本节，将会介绍并实现跳表。

李沐阳_ 2024-12-28

Android MVI 怎么写

总览 UI Layer View Layer ViewModel Layer Domain Layer Data Layer 单一数据源 view只根据uiState显示内容，不提供对外可直接修改vi

swithun 2024-12-28

2亿条数据量如何在一刻钟左右完成同步

Datax调优，2亿条数据量一个小时同步完成优化到一刻钟左右同步完成，是如何进行实现的。主要了解Datax架构和任务并发设计

Shawn_Shawn 2024-12-28

Python包管理不再头疼：uv工具快速上手

Python 包管理生态中存在多种工具，如 pip、pip-tools、poetry、conda 等，各自具备一定功能。而今天介绍的uv 是 Astral 公司推出的一款基于 Rust 编写的 Py

databook 2024-12-27

React 的设计哲学

React 的渲染机制不知道大家有没有遇到过在一个网页输入内容的时候，每次输入都得卡个半秒；又或者点一下运行，整个页面完全无法交互，变得像一张图片，任你点击都没有任何反应。从前，React 渲染就

ssshooter 2024-12-27

【Next.js】002-路由篇|App Router

【Next.js】002-路由篇|App Router [toc] 一、前言路由（Router）是 Next.js 应用的重要组成部分。在 Next.js 中，路由决定了一个页面如何渲染或者一个请求

訾博ZiBo 2024-12-28

分析大文件上传：实现分片上传和断点续传

前言在现代网络环境中，用户上传大文件的需求越来越普遍，尤其是在云存储、视频分享、在线教育等领域。然而，大文件上传过程中的网络波动、不稳定性，以及客户端资源的限制，常常给用户带来不佳的体验......

总是睡不够 2024-12-28

OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式，可提供更自然实时对话

推荐体验

相关资讯

OpenAI向部分付费订阅用户开放高级语音模式提供更自然实时对话

OpenAI向部分用户开放GPT-4o语音模式

OpenAI 向部分用户开放 GPT-4o 高级语音模式

OpenAI向部分用户开放GPT-4o语音模式，今秋将扩大至所有付费用户

OpenAI向部分用户开放GPT-4o语音模式，今年秋季将覆盖所有付费用户

近期资讯

Solid.js 最新官方文档翻译（11）—— Effects

大模型应用— 爬虫 ScrapeGraphAI

大模型应用—AI 编程工具Cursor

从零实现LevelDB 2. 从一道leetcode开始

Android MVI 怎么写

2亿条数据量如何在一刻钟左右完成同步

Python包管理不再头疼：uv工具快速上手

React 的设计哲学

【Next.js】002-路由篇|App Router

分析大文件上传：实现分片上传和断点续传

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响