GPT-4o空降，OpenAI又来“炸场”了

北京商报官方账号

2024-05-14 13:08发布于北京北京商报官方账号

备受关注的搜索产品“跳票”之后，OpenAI依然搞了个大的——推出GPT-4o，杀疯科技圈。其强大的自然对话能力以及对人类情感的实时感知，让人们怀疑，科幻电影《Her》里的萨曼莎、《钢铁侠》里的贾维斯是不是真的要来了。

北京时间5月14日凌晨，OpenAI举办线上“春季更新”活动，发布新旗舰生成式AI模型GPT-4o。据悉，GPT-4o的“o”代表“omni”，意为全能，是迈向更自然的人机交互的关键一步。

特别是在音频处理领域，过往独立模型之间的相互转化带来的延迟感，算得上是人工智能助手变科幻为现实的最大障碍之一。为应对这一情况，GPT-4o跨文本、视觉和音频端到端地训练了一个新模型，所有输入和输出都由同一个神经网络处理，成为其突破深度学习界限的最新举措，也完成了人工智能对话的“丝滑”实现。

在表现上，GPT-4o可以接收文本、音频和图像的任意组合作为输入，并实时生成文本、音频和图像的任意组合输出。据悉，新模型使ChatGPT能够处理50种不同的语言，同时提高了速度和质量。

在反应速度上，GPT-4o可以在短短232毫秒内响应音频输入，平均响应时长也仅有320毫秒，与对话中的人类响应时间相似。相比起来，GPT-3.5语音对话的平均延迟为2.8秒、GPT-4为5.4秒。

GPT-4o更大的惊喜则在于对“情绪价值”的提供。比如机器人能够从急促的喘气声中理解“紧张”的含义，并且指导他进行深呼吸，还可以根据用户要求变换语调。在发布会上，还有演示者将手机举到自己面前正对着脸，要求ChatGPT告诉他自己长什么样子。第二次尝试后，ChatGPT对他说：“看起来你感觉非常快乐，喜笑颜开。”

更“炸裂”的是，所有用户均可免费使用该模型，而付费用户的容量限制是免费用户的5倍。据悉，GPT-4o的文本和图像功能已经开始向付费的ChatGPT Plus和Team用户推出，企业用户也即将推出。免费用户也将开始使用，但有使用限制。

在API使用方面，OpenAI首席技术官米拉·穆拉蒂表示，相比去年11月发布的GPT-4-turbo，GPT-4o价格降低一半，速度提升两倍。GPT-4o的语音和视频输入功能将在未来几周内推出。

此外，OpenAI还发布了桌面版的ChatGPT和新的用户界面。“我们认识到这些模型正变得越来越复杂。”穆拉蒂说道，“但我们希望用户与人工智能模型的交互体验能够更加自然、轻松，让用户可以将注意力完全集中在与模型的协作上，而无需在意界面本身。”

“语音对话的能力原本就有，但是这次可怕在于基本没有延迟的响应，还有对复杂环境，包括情绪、语气的识别”，阿里研究院执行院长袁媛对北京商报记者分析称，低延迟来自于推理架构的整体优化，而复杂环境识别理解又是模型能力的提升，“所以最后的winner，还是要赢在一个从头到脚的技术体系”。

此前OpenAI频传将推出AI搜索引擎，GPT-5的消息也甚嚣尘上。但当地时间5月10日，OpenAI表示，将于当地时间5月13日以直播的形式宣布产品更新，不过届时不会发布GPT-5，也不会发布搜索引擎产品。

GPT-5和搜索产品的缺席，也导致外界讨论OpenAI是否“慢下来了”。对此，袁媛认为，技术能力并不是跟着数字线性增长的，GPT-4o虽然还“姓”4，但已经能看到清晰的技术特点和可能的商业模式以及后续发展潜力，例如低延迟推理能力，还可能支持更多的模型能力，比如动作控制和交互。此外，“omni”代表的多模态信息输入输出，也有很大潜力。

受GPT-4o消息影响，A股多模态AI概念高开，其中汤姆猫涨停。公开信息显示，汤姆猫5月12日发布机构调研内容提到，公司正有序推进人工智能垂直模型与算力基础设施的建设。

国盛证券认为，GPT-4o是迈向更自然的人机交互的重大进步，新功能带来了崭新的多模态交互能力，通过新的端到端模型实现了体验上的新突破，有望在各类终端实现用户体验的最大化，利好智能终端Agent、机器人等方向。

北京商报记者杨月涵

查看原图 269K

GPT-4o空降，OpenAI又来“炸场”了

GPT-4o空降，OpenAI又来“炸场”了

推荐体验

相关资讯

OpenAI再次“炸场”！GPT-4o空降，速度更快而且免费开放！

OpenAI的 GPT-4o深夜炸场曝光，奥特曼《她》来了！?

GPT-4o“炸场” 但仍满足不了OpenAI的野心

GPT-4o mini深夜炸场，OpenAI亲自下场打价格战？

OpenAI一夜之间革了Siri和同传的命，GPT-4o五大核心能力炸场！

近期资讯

拾光科技取得便携式光伏组件专利，能快速收纳减小占位体积并便于携带

深圳市天麟精密模具有限公司申请高速连接器专利，有效提高连接端插拔时的稳定性和耐用性

中国石油天然气集团取得一种应用于野营房的离网低压光伏建材一体化发电系统专利，非常适合野外作业环境

深圳市创客工场取得一种电机驱动电路专利，消除电机反向电动势对其他电路的影响

成都逐飞智能设备取得一种基于STC32的无感无刷电机驱动装置专利，方便工作人员使用

深圳市铂电申请温度传感器的连接结构专利，有利于通过安装时调整支撑应力，适应不同工况下的安装需要

莫仕连接器申请连接器专利，能提升电连接性能

浙江维日托取得自动清扫发电设备专利，进行光伏发电并便于清扫光伏板

四川金力申请一种易连接的柔性扁平电缆专利，解决扁平电缆长度固定适应性差问题

爱沛股份申请电连接器对专利，提升电连接器的组合性能

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响