当前位置:首页|资讯|ChatGPT

多模态版“Her”正式上线!ChatGPT推出视频通话功能,仅付费用户可用

作者:搜狐科技发布时间:2024-12-19

出品 | 搜狐科技

作者 | 梁昌均

面对谷歌推出Gemini 2的强势阻击,OpenAI依旧不紧不慢。在第六天的直播中,补上了鸽了很久的ChatGPT Vision功能,带来更丰富的多模态交互体验。

除了原有的高级语音模式外,用户现在还可以与ChatGPT进行视频通话、共享屏幕,并能在12月与圣诞老人进行实时互动,使对话内容更加丰富,更加多模态的“Her”正式上线。

今天直播,OpenAI四位员工都有着圣诞装扮,首席产品官Join Kevin首先对昨天ChatGPT的宕机表示道歉,表示团队正在进行事件分析,稍晚会发布报告。

然后,他就打开ChatGPT的视频功能和现场的四位员工进行了一番社交,并对它发出考验:认出每个人,说出特征和姓名。当然,ChatGPT都回答对了。

实际上,视频功能在OpenAI今年5月春季发布会上有所展示,时任OpenAI CTO的 Mira Murati发布了新一代旗舰生成模型 GPT-4o,其可以接受文本、音频和图像的任意输入和输出。

当时,OpenAI的工程师现场演示了语音、视频等多模态能力,其中高级语音能力原本定于6月上线,但因还未“达到发布门槛”而推迟一个月才上线,而视频功能迟迟不见踪影。

现在,用户就可以在最新的ChatGPT移动应用程序中,点击输入框右下角的高级语音模式图标,就能再左下角看到视频按钮,点击即可开启视频通话;通过下拉菜单选择共享屏幕,就让ChatGPT看到屏幕内容。

这意味着,ChatGPT用户除了可以用高级语音,现在还可以通过视频和屏幕共享功能与ChatGPT进行实时互动,通过跟ChatGPT打视频,展示面前的物品,或者分享屏幕内容,以便以更多形式更清晰地表达需求,从而获得更有效的帮助。

根据OpenAI的直播演示,当和ChatGPT开启视频后,在它看到水壶和滴漏器时,它就知道你想做手冲咖啡,并且可以进行步骤指导:滴漏器放在杯子中冲洗,以消除纸质味道;预热滴漏器和杯子;把咖啡粉添加到滤器中,每六盎司水约两汤匙咖啡粉;将少量热水倒在咖啡粉上,让咖啡粉“绽放”约30秒。

OpenAI研究员还问了什么是“绽放”,ChatGPT则解释说这是指让咖啡粉释放气体并增强风味的过程。然后,研究员被指导以圆形运动方式缓慢倒入剩余热水,让水通过咖啡粉滴入杯中,还提醒到要慢慢倒水。当研究员询问到是否有改进技巧的空间,ChatGPT回应说冲咖啡技术看起来不错,但需要保持稳定、温和的注水,确保咖啡粉均匀浸湿。

此外,OpenAI还推出了圣诞特供,整个12月,用户都可以在ChatGPT主屏幕上寻找雪花图标,或者在设置页面中找到联系圣诞老人选项,直接在ChatGPT中与圣诞老人语音或视频聊天。

圣诞老人可以回答用户问题,比如最喜欢的圣诞传统是什么?最喜欢的驯鹿是哪一只? Kevin还向圣诞老人提出了一个关于如何保持胡须处于最佳状态的问题,圣诞老人对此也给出了建议,建议保持清洁、定期修剪胡须等。

但第一次与圣诞老人聊天时,系统会重置高级语音使用限制,即使已经超出限制,仍然可以使用标准语音模式与圣诞老人聊天。这一功能将在今日面向全球推出,所有支持ChatGPT语音模式的地区均可使用,包括桌面端和移动端等。

目前,只有ChatGPT的付费用户才可以用ChatGPT vision功能。OpenAI表示,高级视频通话和屏幕共享功能将在接下来的一周内逐步向所有Team用户、ChatGPT Plus和Pro订阅用户推出,企业和教育用户将于明年年初获得访问权限。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1