OpenAI重大更新！为ChatGPT推出语音和图像交互功能

作者：BFT白芙堂机器人发布时间：2023-10-07

原创 | 文 BFT机器人

OpenAI旗下的ChatGPT正在迎来一次重大更新，这个聊天机器人现在能够与用户进行语音对话，并且可以通过图像进行交互，将其功能推向与苹果的Siri等受欢迎的人工智能助手更接近的水平。这标志着生成式人工智能运动的一个显著演进，OpenAI将基于语音助手与其强大的大型语言模型（LLMs）融为一体。

自从大约九个月前首次推出以来，这款广受欢迎的生成式人工智能助手一直是近年来最成功的技术之一，任何人都能通过简单的文本提示生成文章、诗歌和摘要。但现在，ChatGPT即将变得更加具有互动性，用户还可以与AI进行语音对话。

这一新闻与亚马逊承诺向OpenAI竞争对手Anthropic投资多达40亿美元的消息同时传出，这是全球科技巨头之间更大规模的生成式人工智能竞争的一部分，其中包括谷歌试图通过其Bard聊天机器人迎头赶上、Meta采取坚定的开源理念来帮助其占据优势地位、以及微软与OpenAI自身紧密合作。

ChatGPT的新语音功能不仅可以朗读文本输入，还可以讲述睡前故事，解决晚餐桌上的争论等等。这项语音功能由一款新的文本转语音模型提供支持，该模型可以从文本和少量采样的语音中生成类似人类的声音。OpenAI表示，他们与知名的配音演员合作，创建了五种不同的声音，使用他们的开源Whisper语音识别系统将口头表达转录成文本。

此外，Spotify也被宣布为OpenAI的合作伙伴之一，这家音乐流媒体巨头为播客制作者引入了一个非常有趣的新功能，允许他们采样自己的声音并将他们的节目从英语翻译成西班牙语、法语或德语，同时保留他们自己的原声。然而，OpenAI似乎很谨慎，不希望招致批评，因此他们并没有将这项技术提供给所有人——而仅仅跟播客制作者合作，其中包括Dax Shepard、Monica Padman、Lex Fridman、Bill Simmons和Steven Bartlett。

这些新功能将在未来两周内逐步推出，供付费的Plus和企业订阅用户使用。要启用语音功能，用户需要前往应用程序中的“设置”菜单，然后进入“新功能”并选择加入语音对话。然后，他们需要点击右上角的耳机按钮，然后选择他们想要的声音。

最初，语音将仅限于ChatGPT Android和iOS应用程序的选择性测试版，而图像搜索将默认在所有平台上提供。这一系列更新使ChatGPT更具互动性和创造力，为用户提供了更多有趣和实用的功能。

作者 | Azukii

排版 | 小河

审核 |

若您对该文章内容有任何疑问，请与我们联系，我们将及时回应。如果想要了解更多的前沿资讯，记得点赞关注哦~

OpenAI重大更新！为ChatGPT推出语音和图像交互功能

推荐体验

相关资讯

OpenAI：将在ChatGPT推出新的语音和图像功能

ChatGPT迎来重大更新，加入语音和图像识别功能，可能加速取代更多工作岗位

ChatGPT重磅更新：新增语音和图像功能可以看、听、说

ChatGPT新增两种交互方式，加入语音对话和图像识别功能

ChatGPT重大更新：新增实时搜索和高级语音

近期资讯

荣耀工程师称手机拍照只有 2 家可比，豪言背后的自信与底气

圆的面积计算：公式、应用与背后的数学故事

华凌HR-589WKP冰箱：直降400元，一级能效风冷无霜，大容量新选择

共绘巫山红叶盛景｜华为Mate70红枫原色影像见证自然之美

Steam账号安全指南：如何修改密码与启用双重验证

荣耀赵明谈与华为影像技术的竞争，工程师称手机拍照只有2家可比

启明星辰集团数据安全检查工具箱正式发布，“有理有据”搞定数据安全检查“痛点”！

景胜电子取得导电胶生产用切条装置专利，避免人工切割效率低下

美的BCD-185WM(E)冰箱：1199元享185升风冷无霜，节能静音新体验

配骁龙8 Gen2！荣耀GT Pro真机现身

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响