ChatGPT高级语音正式开放，新增记忆功能，支持50种语言

作者：智东西发布时间：2024-09-25

ChatGPT OpenAI

智东西9月25日消息，OpenAI今日宣布本周内将向所有ChatGPT Plus和Team用户开放高级语音模式。

除了已经可用的4种风格的声线之外，ChatGPT的高级语音模式中还新增了5种不同风格的声线。它还会说包括普通话在内的50多种语言。此外，高级语音模式还新增了自定义指令功能和记忆功能。

高级语音模式将会在美国先开放使用。而在欧盟、英国、瑞士、冰岛、挪威和列支敦士登的用户还暂时不可用。

以上这些更新仅适用于GPT-4o模型，而不适用于最近发布的o1。

一、新增5种风格声线、2大功能，会说超过50种语言

根据OpenAI的说法，所有订阅了ChatGPT的Plus和Team计划的付费用户都将在本周内获得ChatGPT高级语音模式的使用权限。下周，OpenAI计划将ChatGPT高级语音模式扩展到Edu和Enterprise计划的订阅用户。

高级语音模式将会在美国先开放使用。而在欧盟、英国、瑞士、冰岛、挪威和列支敦士登的用户还暂时不可用。

除了已经可用的4种风格的声线（活跃真诚的Breeze、开放积极的Juniper、沉着直率的Cove和自信乐观的Ember）之外，ChatGPT的高级语音模式中还新增了5种不同风格的声线（随和且多才多艺的Arbor、开朗率真的Maple、聪慧随性的Sol、冷静坚定的Spruce和聪明好学的Vale）。

此外，OpenAI为ChatGPT的高级语音模式新增了自定义指令功能和记忆功能。这些功能的增加，使得语音模式的交互体验更加丰富和个性化。

新增的自定义指令功能允许用户根据自己的需求定制ChatGPT的回复方式，包括但不限于设定对话的正式程度、回复的长度、称呼方式，以及是否持有观点或保持中立。用户可以通过这个功能告诉ChatGPT更多关于自己的信息，比如职业背景、兴趣爱好等，以便ChatGPT能够提供更加个性化和贴合用户需求的回答。

而记忆功能则是指ChatGPT能够记住用户在不同对话中提供的信息，从而在后续的交流中提供更加相关和个性化的回答。例如，如果用户告诉ChatGPT他们有某些饮食限制，记忆功能将使得ChatGPT在未来涉及到菜谱建议之类的对话中考虑到这些限制，并提供相应的建议或信息。

而且，ChatGPT高级语音模式还会说包括普通话在内的50多种语言。OpenAI在社交平台X上发布的帖子中附带了一段视频。视频中，用户向语音助手提出指令：由于让奶奶久等了，我需要向奶奶致歉。语音助手先用英语提出建议，并在用户反馈“奶奶只会说普通话”后，又用中文普通话表达了一遍。

二、延迟发布的背后原因：AI语音功能引争议，需进行充分测试确保安全性

OpenAI将语音功能添加到ChatGPT的尝试很早就引发了争议。

在5月份宣布GPT-4o和高级语音模式的时候，人们注意到其中一个声线Sky与女演员Scarlett Johanssen的声音极为相似。而且，OpenAI的首席执行官Sam Altman在社交媒体上发布过“her”一词，可能暗指了电影《Her》，而Johansson正是该电影中AI语音助手的配音演员。

这引发了人们对于AI开发商在创建语音助手时模仿知名人士声音的担忧。后来，OpenAI否认了Sky与Johansson的关联，并立即下架了Sky。

此次宣布高级语音模式将正式开放的同时，OpenAI还强调了用户只能选择OpenAI提供的9种声线。并且，他们在发布前已对其安全性进行了评估，以避免语音模式被用于欺诈等不当行为。

“我们与公司外部的红队测试人员一起测试了模型的语音功能。这些测试人员总共会说45种不同的语言，代表着29个不同的地理区域，”OpenAI在发布会上对记者说。

由于需要进行安全测试，ChatGPT高级语音模式的推出从最初计划的6月底推迟到了7月底或8月初，并且最初只向OpenAI选定的用户群体推出。

而现在，OpenAI将向所有付费用户正式开放ChatGPT高级语音模式的举措，说明它已经做好了充足的准备。这也符合OpenAI近来谨慎的作风。

结语：AI语音赛道正在越来越卷

自从苹果Siri和亚马逊Alexa之类的AI语音助手兴起以来，AI开发商们一直希望让用户与生成式AI的对话体验更加贴近人类交流。

比如，由前谷歌Deepmind成员Alan Cowen创办的初创公司Hume AI，于9月11日发布了其第二代情感智能AI。它能够通过分析用户的语音，如口音、语气、语调、拟声词、节奏和停顿等，来理解用户的情绪和心理状态，并做出实时响应。

法国AI公司Kyutai于7月6日发布了Moshi。它能够理解和表达情感，模拟70种不同的情绪和风格进行交流。

谷歌于8月14日正式发布了智能语音助手Gemini Live。

据路透社昨日报道，Meta也在开发模拟知名演员声音的语音助理，并计划在明天凌晨开始的Meta Connect 2024大会上宣布这一功能。

本文来自微信公众号“智东西”（ID：zhidxcom），作者：Vendii，编辑：漠影，36氪经授权发布。

ChatGPT高级语音正式开放，新增记忆功能，支持50种语言

一、新增5种风格声线、2大功能，会说超过50种语言

二、延迟发布的背后原因：AI语音功能引争议，需进行充分测试确保安全性

结语：AI语音赛道正在越来越卷

推荐体验

相关资讯

ChatGPT高级语音正式开放，新增记忆功能，支持50种语言

ChatGPT推出高级语音功能：支持超50种语言

ChatGPT「Her」全量开放！新增记忆、自定义指令，50种语言畅聊

ChatGPT 向更多用户推出高级语音模式：支持 50 种语言

ChatGPT推出高级语音功能：本周全面上线，四大提升，支持超50种语言

近期资讯

详细讲解vue3中的ref和reactive

盘点抑郁症的6个真相：很多人都误解了抑郁症

量增价低持续快递行业无人车无人机应用加速

00后女孩独自一人野外露营帐篷内差点殒命

🤓这周我又给我的小程序做了哪些有趣实用的功能？

难怪高铁动车8号9号车厢不通背后原因揭开

小米15 Pro上手：2024年旗舰手机的标准答案

57岁阿姨演短剧：享受与年轻人竞争的乐趣

HarmonyOS NEXT 实战之元服务：静态案例效果---蜻蜓AI小助手

亚洲小姐组团打卡哈尔滨冰雪大世界：人美雪也美

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响