GPT-4o 语音模式首批用户体验来了，电影《her》终于成真，网友：差点爱上她了

作者：爱范儿发布时间：2024-07-31

ChatGPT

在屡次「放鸽子」之后，OpenAI 今天终于向部分 Plus 用户正式推送了 GPT-4o 高级语音模式(Advanced Voice Mode)的 Alpha 测试版。

不知道你是不是被选中的幸运儿？

GPT-4o 高级语音模式不仅允许用户随时打断对话，而且系统还能感知并回应用户的情绪波动，仿佛电影《her》走入现实。

只不过，别急着欢呼，OpenAI 还藏了一手，此前备受关注的视频和屏幕共享功能将在晚些时候推出。

也就是说，目前推送的功能尚属「阉割版」。这也是继 GPT-5、Sora、SearchGPT 之后，OpenAI 再次埋坑。不得不说，没有人比 OpenAI 更懂「埋坑」。

OpenAI 官方明确表示，参与此次 Alpha 测试的用户将会收到一封包含使用指南的电子邮件，同时手机 APP 也将推送相关通知消息，大概如下图所示，快去检查一下你有没有收到。

ChatGPT 的计划是逐步扩大测试用户数量，预计在今年秋季，所有 Plus 会员都将能体验到这项功能。

不少海外网友已经拿到了 GPT-4o 高级语音模式的测试资格，让我们一起来看看他们是怎么玩出花的。

GPT-4o 能成为你的口语外教吗？

在看完五月份 OpenAI 的春季发布会之后，许多人开始担忧语言类外教甚至翻译都要失业了。

为此，X 网友一拿到测试资格，就立刻让 GPT-4o 给他当法语陪练。结果显而易见，主打情绪价值的 GPT-4o 与法语底子不错的网友上演了一场教科书式的课堂教学。

听听 GPT-4o 的语音，你可能会惊讶地发现，它甚至可能比你的人类老师还要耐心细致。

不过，网友的评价却是褒贬不一，GPT-4o 的法语发音让母语为法语的听众点头称赞，但也有人觉得它跟五月份的演示效果相比，差那么一丢丢意思。

要给 GPT-4o 上强度的网友也一口气测试了三种不同语言的切换。法语、西班牙语、乌尔都语，GPT-4o 切换流畅自如，拿捏到位。

有没有熟悉乌尔都语的朋友们，GPT-4o 发音的准确度如何，欢迎在评论区分享你的见解。

至于中文的效果，就别提了，让 GPT-4o 讲故事，听起来有些机械感，有感情，但不多，给人感觉就像是以前老收音机传出的声音。

古有仓颉造字，今有 GPT-4o 凭空「造」语言，网友让它用一种不存在的语言说话，然后解释这种语言是如何工作的，没啥大毛病，就是对耳朵有些不太友好。

让 GPT-4o 讲个笑话、讲故事、来段绕口令

应网友 @sirbughunter 的提议，网友 @yoimnotkesku 给 GPT-4o 讲了一个精心准备的笑话，测试其对笑话的理解和反应。

网友：我能给你讲个笑话不？
GPT-4o：当然了！我超想听的，你的笑话是啥？
网友：为什么科学家们不相信原子？
GPT-4o：为什么？
网友：因为它构成了一切。
GPT-4o：哈哈哈哈哈哈，确实，原子真的「构成」了一切。
笑点：这里的「make up」既可以指「构成」，也可以指「编造（谎言）」。

网友的评价也是两极分化，有的表示很真实，喜欢 AI 听完笑话的声音，甚至要爱上它了，也有的表示很糟糕。

但接下来的评论就图穷匕见了，这算盘响到我在中国都听见了。

接着应网友 @sirbughunter 的要求，不妨也反过来让 GPT-4o 讲个惊悚的故事。

没想到，GPT-4o 模拟出暴雨天的恐怖音效让网友大呼意外，仿佛真的置身于一个惊悚的环境，照这表现，估计又得干翻不少说书人的饭碗了。

普通人念段绕口令免不了舌头打结，但让它来段绕口令也没啥强度。

B-BOX 也不在话下，但怎么到后面有点喘不过气了呢？

邀请长眼睛的 GPT-4o 看看我们的世界

有极少数「神通广大」的网友甚至抢先内测到了实时的视频理解功能。

例如，网友 @ManuVision 养了一只可爱的小猫，他利用视频模式向 GPT-4o 介绍了小猫的日常生活，GPT-4o 也没少给予情绪上的正反馈。

体验过后，他在 X 平台上赞叹道：「这感觉就像是在和一位知识渊博的朋友面对面交流」。

接着，他也分享了新的高级语音模式+视觉功能进行实时日语翻译。

‍在看完上面这些测试视频后，AI 在表达情感方面似乎比人类还要丰富细腻，这真不怪会有人喜欢上 AI 伴侣了。

目前，GPT-4o 的语音模式只提供四种精心挑选的声音选项：Juniper、Breeze、Cove和Ember，这些声音均出自专业配音演员。

此前，一款名为 Sky 的女性配音因与好莱坞女星斯嘉丽·约翰逊的声音相似度极高而备受关注。随后 OpenAI 也暂停 Sky 声音的使用。

OpenAI 还宣布，他们已经开发并部署了新的过滤器，用以识别并拒绝生成任何可能侵犯版权的音乐或其他音频内容。

自今年以来，OpenAI 的产品发布节奏堪称稀碎。包括今天发布的 GPT-4o 高级语音模式更是反复「跳票」，才来到我们眼前。

不少观点质疑，OpenAI 本身是一家没有产品基因的公司，所以才导致不少产品「难产」，但关键是，几乎没有人会质疑 OpenAI 的技术基因。

这就好比，吐槽归吐槽，但极少有人会质疑 Sora 不会发布，只是时间早晚的事情。

OpenAI 的底气就在于，先前 ChatGPT 的成功除了印证一条业界以往罕有人迹的路线，也让不少「爱屋及乌」的人对于 OpenAI 的「埋坑」有了更高的期待和宽容度。

相比之下，另一个喜欢「画饼」的 Google 就没有这么好的舆论境遇了。

虽然擅长营销的 OpenAI 埋得坑多，却也总能在关键时刻填上一两个，就像是挂在毛驴前的萝卜，时不时给点甜头。今天的 GPT-4o 高级语音模式也是一个典型的例子。

只不过，功能是推送了，但却只是一个阉割版，我们甚至都分不清他是在憋大招，还是在加班加点解决 Bug。当然，如果 OpenAI 的弹药库充足的话，作为用户，还是期待 OpenAI 能早日推出 GPT-5。

本文来自微信公众号“APPSO”，作者：APPSO，36氪经授权发布。

近期资讯

昆山协鑫光电申请一种自组装空穴传输材料的制备方法与应用专利，有助于实现钙钛矿电池转换效率和稳定性的进一步提升

金融界2024年12月25日消息，国家知识产权局信息显示，昆山协鑫光电材料有限公司申请一项名为“一种自组装空穴传输材料的制备方法与应用”的专利，公开号CN119176836A，申请日期为2024年9月。

金融界 2024-12-25

大模型·大未来｜明途科技周道：大模型落地离不开算力、算法、数据

12月25日，以“大模型·大未来”为主题的“2024人工智能大模型基准测试科创发展大会”（下称“大会”）在成都高新区拉开帷幕。明途科技是成都本土少数拥有“双备案”的大模型厂商，今年入选第六批国家专精特新“小巨人”企业名单，获得人工智能专利等知识产权数已超200件。

红星新闻 2024-12-25

深圳艾欣达伟申请具有磷酸氮丙啶结构化合物的合成方法专利，转化率高

金融界2024年12月25日消息，国家知识产权局信息显示，深圳艾欣达伟医药科技有限公司申请一项名为“具有磷酸氮丙啶结构化合物的合成方法”的专利，公开号CN119176835A，申请日期为2023年6月。

金融界 2024-12-25

大模型·大未来｜久远银海肖华荣：大模型技术在民生服务领域应用前景广阔

微成都报道12月25日，以“大模型·大未来”为主题的“2024人工智能大模型基准测试科创发展大会”（下称“大会”）在成都高新区开幕。大会现场，久远银海（002777.SZ）研发中心技术产品总监肖华荣就公司大模型使用情况接受微成都采访，介绍了大模型技术在民生服务领域的创新应用和未来趋势。

红星新闻 2024-12-25

“另类”生图产品，上线4个月拿下420万流量

然后我们发现，这款产品在即刻上的讨论度也不低。乍听起来确实是不少用户有这方面需求的，Napkin切入市场也算顺理成章，但是盘点了一下市面上现有产品，却发现供给和需求之间的缺口并没有那么大。而如果用户已经有现成的内容，则可以选择“BlankNapkin”选项，系统会直接给出空白文档。

钛媒体APP 2024-12-25

掌握复制链接的技巧，轻松分享信息的实用指南

在这个信息爆炸的时代，链接无处不在。无论是社交媒体、新闻网站，还是各种应用程序，链接都是我们获取信息的重要途径。有时候，我们需要把某个链接分享给朋友，或者保存下来以便日后查看。那么，怎么复制链接呢？这看似简单的操作，其实在不同的设备和平台上，方法略有不同。接下来，我就来详细讲讲。如果你是在电脑上操作，复制链接的方式非常简单。

新报观察 2024-12-25

辰显光电发布全球首款 TFT 基 Micro LED 创新产品

IT之家12月25日消息，成都辰显光电有限公司今日发文宣布，辰显光电于12月19日在世界显示产业创新发展大会上，发布了全球首款TFT基MicroLED产品，新品包括：135英寸P0.7TFT基MicroLED拼接屏、88英寸P0.5TFT基MicroLED拼接屏、P0.5MicroLED透明拼接屏、MicroLED光场裸眼3D屏。

IT之家 2024-12-25

深圳艾欣达伟申请制备高光学纯度 AST-3424 专利，提高制备纯度

金融界2024年12月25日消息，国家知识产权局信息显示，深圳艾欣达伟医药科技有限公司申请一项名为“制备高光学纯度AST-3424的方法”的专利，公开号CN119176834A，申请日期为2023年6月。

金融界 2024-12-25

掌握文件压缩技巧，让存储与传输更高效！

文件压缩，很多人可能听说过，但具体怎么操作却未必清楚。其实，文件压缩是一种非常实用的技术，可以帮助我们减小文件的大小，方便存储和传输。尤其是在我们这个信息爆炸的时代，文件大小的控制显得尤为重要。今天就来聊聊文件压缩的那些事儿，让你在处理文件时游刃有余。首先，什么是文件压缩呢？

新报观察 2024-12-25

电脑与投影仪连接方法详解：有线与无线方式的选择与设置

在现代的工作和学习环境中，投影仪已经成为了一个不可或缺的工具。无论是进行商务演示，还是在课堂上展示教学内容，投影仪都能帮助我们更好地传达信息。很多人可能会问，电脑和投影仪到底怎么连接呢？

新报观察 2024-12-25

GPT-4o 语音模式首批用户体验来了，电影《her》终于成真，网友：差点爱上她了

GPT-4o 能成为你的口语外教吗？

让 GPT-4o 讲个笑话、讲故事、来段绕口令

邀请长眼睛的 GPT-4o 看看我们的世界

推荐体验

相关资讯

OpenAI发布新品GPT-4o，电影《HER》演绎的世界真的来了！

OpenAI 推出 GPT-4o 语音模式 ChatGPT Plus 用户的全新体验

OpenAI向部分用户开放GPT-4o语音模式

速递｜OpenAI 推出 ChatGPT 高级语音模式，Plus 用户率先体验 GPT-4o 超逼真语音交互

OpenAI的GPT-4o上场，科幻电影《Her》有了现实版

近期资讯

昆山协鑫光电申请一种自组装空穴传输材料的制备方法与应用专利，有助于实现钙钛矿电池转换效率和稳定性的进一步提升

大模型·大未来｜明途科技周道：大模型落地离不开算力、算法、数据

深圳艾欣达伟申请具有磷酸氮丙啶结构化合物的合成方法专利，转化率高

大模型·大未来｜久远银海肖华荣：大模型技术在民生服务领域应用前景广阔

“另类”生图产品，上线4个月拿下420万流量

掌握复制链接的技巧，轻松分享信息的实用指南

辰显光电发布全球首款 TFT 基 Micro LED 创新产品

深圳艾欣达伟申请制备高光学纯度 AST-3424 专利，提高制备纯度

掌握文件压缩技巧，让存储与传输更高效！

电脑与投影仪连接方法详解：有线与无线方式的选择与设置

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响