OpenAI的ChatGPT语音助手拥有视觉功能了，适用于教育场景

作者：多知网发布时间：2024-12-19

多知12月14日消息，本周四，是在OpenAI 为期 12 天的盛会的第六天，该公司在直播中表示，其为 ChatGPT 开发的类似人类的对话功能“ChatGPT Advanced Voice (高级语音模式)”正在实现视觉化，Advanced Voice由OpenAI的多模态模型GPT-4o支持。这意味着OpenAI 终于发布了近七个月前演示的ChatGPT实时视频功能，但目前不是向全部用户开放。

同时，OpenAI宣布，整个 12 月，ChatGPT Advanced Voice 都会获得新的圣诞老人“Ho Ho Ho”的声音。第一次使用时，OpenAI 甚至会将用户的 Advanced Voice 消息重置为零，以便用户可以通话更长时间。

使用 ChatGPT 应用，订阅ChatGPT Plus、Team或Pro 的用户可以将手机对准物体，ChatGPT 会近乎实时地做出响应。

带视觉的ChatGPT Advanced Voice还可以通过屏幕共享了解设备屏幕上的内容。例如，展示案例中给咖啡壶拍照让ChatGPT教授如何制作手冲咖啡。用户还可以上传植物的照片并询问养护技巧，或者展示教科书中的数学问题并要求分步解决方案。

今年5月，OpenAI在推出GPT-4o时演示了语音模式Voice Mode。可以说，这种多模态的交互方式非常适合教育场景，当时，OpenAI展示这项功能时就邀请了Salman Khan让GPT-4o辅导儿子Imran学习数学的视频，GPT-4o会听会说会看。

要使用视觉进入ChatGPT Advanced Voice，点击 ChatGPT 聊天栏旁边的语音图标，然后点击左下角的视频图标，即可开始视频。要共享屏幕，点击三点菜单并选择“共享屏幕”。

ChatGPT Advanced Voice支持50多种语言，展现AI陪伴工具体验感提升，为AI教育工具示范。

不过，OpenAI 表示，带视觉的高级语音模式本周四开始推出，并于下周结束。但并非所有用户都能获得访问权限。

此外，OpenAI 表示，ChatGPT Enterprise 和 Edu 用户要到明年 1 月才能获得该功能，而且对于欧盟、瑞士、冰岛、挪威等ChatGPT 用户，它还没有时间表。

OpenAI的ChatGPT语音助手拥有视觉功能了，适用于教育场景

推荐体验

相关资讯

OpenAI的ChatGPT语音助手拥有视觉功能了，适用于教育场景

适用于 .NET 稳定的官方OpenAI库

17个适用于SEO的ChatGPT提示词

OpenAI推出适用于 Mac 和 Windows 的 ChatGPT 桌面应用程序

MOpenAI 推出适用于 iOS 的免费 ChatGPT 应用程序

近期资讯

陕西微阅取得一种校平棍子组件专利，实现对校平辊子组件的维护更方便

国能三河发电申请一种脱硫废水蒸发浓缩装置专利，解决废水蒸发过程中电热板传热效率受影响的问题

上海合亚精密取得一种组合式压筋折弯模具专利，便于工件冲压入冲压槽中

山东德成铝业取得一种空调箔冲压装置专利，便于快速散热和避免冲压误差

威海恒锐精密机械取得板材冲压模具专利，能够对板材不同位置很好冲压便于使用

珈钠能源申请钠离子电池硫酸铁钠复合正极材料制备方法专利，提高界面稳定性

哈尔滨汽轮机厂有限责任公司取得用于呼啦密封的压型工装专利，可高效完成呼啦密封制造

宁德聚能动力取得一种冲压模具中使用的耐磨滑块机构专利，滑动顺畅无顿挫减小摩擦延长使用寿命

御马精密科技取得冲压模具用落料保护装置专利，防止冲压后的产品翻转，提高产品合格率

豪鹏科技申请正极前驱体等相关专利，提高锂离子电池性能

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响