当前位置：首页|资讯|OpenAI|阿尔特曼

OpenAI推出新一代AI模型GPT-4o 音频视频理解能力尚无敌手

作者：IT指北针发布时间：2024-05-20

OpenAI 阿尔特曼

5月14日消息，据外媒报道，在今日凌晨1点开始的春季更新中，OpenAI宣布了他们新一代的旗舰模型GPT-4o，可以利用语音、视频和文本信息进行实时推理。

从OpenAI在官网上公布的信息来看，GPT-4o中的“o”源自“omni”，也就是全面、全能的意思，朝着更自然的人机交互又迈出了关键一步。

而GPT-4o也的确如名字中“omni”的全能一样，是一款能力更全面的大语言模型，打通了文本、音频和图像，接受任何文本、音频和视频的组合输入，并生成文本、音频和视频的组合输出。

OpenAI在官网上披露，GPT-4o在英文文本和代码中的表现与GPT-4 Turbo相当，但在非英文文本上的能力大幅提升，在视频和音频的理解上，GPT-4o要明显强于当前的其他模型。

在官网上，OpenAI提到，在GPT-4o之前，通过语音模式同ChatGPT对话时，有较长时间的延迟，GPT-3.5平均为2.8秒，GPT-4平均为5.4秒。而由三个独立模式组成的语音模式，也丢失了大量信息，无法直接识别音调、多个说话者或背景噪音，也无法输出笑声、歌唱或表达情感。

但在GPT-4o中，OpenAI训练一个跨文本、音频和视频的端到端新模型，所有的输入和输出都是由同一神经网络处理，GPT-4o也是他们首个整合了个文本、音频和视频模式的模型，

能力更全面的GPT-4o，响应速度也更快，最快232毫秒响应音频输入，平均响应时间为320毫秒，与人类在对话中的响应速度相当。

除了更强、更全面的能力，OpenAI也在推动GPT-4o更广泛的应用。GPT-4o的文本和图片功能自推出之日起就向ChatGPT推送，ChatGPT用户可免费使用，ChatGPT Plus用户的数据量上限将是免费用户的5倍，新版本的音频模式将在未来几周向ChatGPT Plus用户推送。

OpenAI周二凌晨1点开始的春季更新，是由CTO Mira Murati主持进行，登台的还有两位研发人员，公司CEO萨姆•奥特曼并未登场。

不过，未现身直播的萨姆•奥特曼，在社交媒体上对GPT-4o也进行了推广。他在社交媒体上就表示，他们最新的模型GPT-4o，是他们到目前为止最好的模型，它很聪明、速度很快，是天然的多模态。

萨姆•奥特曼在社交媒体上也提到，GPT-4o对所有的ChatGPT用户免费，而此前GPT-4级别的模型仅对按月付费的用户免费。

而值得注意的是，OpenAI在周二凌晨推出能力更全面的GPT-4o，无疑会给谷歌带来更大的压力，谷歌2024年度的I/O开发者大会，将在当地时间周二开始，外界预计他们会推出大量人工智能相关的产品。

推荐体验

相关资讯

OpenAI推出新一代AI模型GPT-4o 音频视频理解能力尚无敌手

GPT-4o中的“o”源自“omni”，也就是全面、全能的意思。

2024-05-14

OpenAI推出新一代AI模型GPT-4o

GPT-4o也的确如名字中“omni”的全能一样，是一款能力更全面的大语言模型，打通了文本、音频和图像，接受任何文本、音频和视频的组合输入，并生成文本、音频和视频的组合输出。本号不对转载或发布的任何信息存在的…

OpenAI 大语言模型

芯片观察者 2024-07-20

免费！OpenAI推出新旗舰模型GPT-4o，具备音频和视觉理解能力

免费！OpenAI推出新旗舰模型GPT-4o，具备音频和视觉理解能力金融界2024-05-14 09:01发布于北京据报道，当地时间5月10日，OpenAI在社交媒体X上宣布，将于下周一上午10点

金融界 2024-05-14

谷歌推出新一代AI芯片:Tensor 4

谷歌是全球名列前茅的科技公司之一，其一大重要业务便是人工智能领域。人工智能技术一直以来都是谷歌的重点发展方向之一，旗下的人工智能研究院AI Quantum Lab与AI Lab在持续不断地推进人工智能技术的研究和应用。今年4月，谷歌就推出了新一代人工智能芯片Tensor 4。这款芯片不仅是谷歌AI技术上的一项新突破，同时也为人工智能技术在硬件上的发展提供了更强有力的支持。Tensor 4芯片的性能比目前最强的AI芯片提高了50%，可支持更强大的深度学习算法和AI模型，能够智能化更多领域，如自动驾

谷歌 AI芯片人工智能深度学习

bili_64669114296 2023-04-20

谷歌推出新一代视频生成模型Veo 2

美国谷歌旗下的“深层思维”公司16日宣布，推出新一代人工智能视频生成模型Veo2，在视频分辨率与图像质量以及模拟真实世界物理规律方面大幅提升。该公司称，Veo2可以创建4K分辨率、时长两分钟的视频，大幅领先美国开放人工智能研究中心（OpenAI）日前公布的最新视频生成模型SoraTurbo。

谷歌 OpenAI 人工智能

北京日报 2024-12-18

近期资讯

26 岁 OpenAI 举报人离奇身亡：其母亲要求 FBI 介入调查

IT之家 2024-12-30

大众口腔：业绩良好，分红多，股东却在上市前夕疑似未赚钱就“跑路”

钛媒体APP 2024-12-30

联发科天玑 9500 处理器早期设定曝光：2+6 核 CPU，台积电 N3P

IT之家 2024-12-30

vivo胡柏山：未来2-3年中国手机市场竞争将更加胶着

36氪 2024-12-30

见到神雕无人预警机后，老外们不淡定了

黑科技老黄 2024-12-30

设计Plus商业｜数字化产品体验样板间

人人都是产品经理 2024-12-30

韩国当局将对济州航空进行严格安全检查

36氪 2024-12-30

涉及所有婴幼儿！这种疫苗接种程序有调整

河南科技报 2024-12-30

稚晖君开源百万机器人真机数据集，让机器人可以扫地、做沙拉、烫衣服

腾讯科技 2024-12-30

消息称台积电美国厂近期准备投片量产，初期月产能 1 万片晶圆

IT之家 2024-12-30

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1