当前位置:首页|资讯|OpenAI|ChatGPT

OpenAI发布新模型GPT-4o,音频视觉文本实现“大一统”

作者:福布斯发布时间:2024-05-17

北京时间5月14日1点整(当地时间5月13日22:00),OpenAI召开了名为「春季更新」的线上发布会。

现场,OpenAI的首席技术官Mira Murati宣布推出桌面版ChatGPT,并推出名为GPT-4o的全新旗舰人工智能模型。GPT-4o中的“o”代表的是“omni”,有包罗万象、全知全能的意思——象征着这款模型的全面性和多元性。

从OpenAI的现场演示视频中,我们在情感上已经很难再将GPT-4o当作是一个机器。它反应敏捷、能说会道、善于分析,还能察言观色,甚至是表达自我。

Mira Murati指出,过去的GPT-4可以处理由图像和文本混合而成的信息,并能完成诸如从图像中提取文字或描述图像内容等任务。而GPT-4o的核心变化就是在GPT-4的基础上,新增了语音处理能力。并且,GPT-4o还可接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。

更让人惊喜的是,GPT-4o的响应速度非常快。它可以在短短 232 毫秒内响应音频输入,平均为 320 毫秒,这与对话中的人类响应时间相似。

与GPT-4 Turbo相比,它在非英语文本上的处理能力有了大幅度提升,同时,API的运行成本也降低了50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色

在情感识别和表达上,新版ChatGPT有了更强的能力。它不仅能准确理解用户的情感,而且能根据用户的情感状态进行适当的回应,这将使得聊天体验更加丰富和真实。如果说过去的GPT还是一个助手,那么拥有了”眼睛“和”嘴巴“后的GPT已经在向朋友靠近了。

除了推出新模型,在产品上OpenAI也做出了诸多更新。

一个是最先进的新模型GPT-4o不再由付费用户独享。发布会上,Mira Murati 宣布 ChatGPT-4o 将免费向所有用户开放,而付费和企业用户,可以抢先获得体验。

另外,OpenAI还推出了新版的GPT桌面应用,让用户可以直接在电脑桌面上使用ChatGPT,并且Mac Plus用户将优先体验到这一功能。用户可以通过快捷键即刻向ChatGPT提问,或者直接在ChatGPT内截屏提问。这种直接在桌面上使用的便捷性,无疑将使用户体验得到大幅提升。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1