免费！OpenAI推出新旗舰模型GPT-4o，可综合利用语音、文本和视觉信息进行推理

金融界

2024-05-14 07:46发布于北京

当地时间周一，OpenAI推出了一个更快、更便宜的人工智能模型GPT-4o来支持其聊天机器人ChatGPT。这家初创公司正努力在日益拥挤的市场中保持领先地位。GPT-4o是已经问世一年多的GPT-4模型的更新版本。该模型基于来自互联网的大量数据进行训练，更擅长处理文本和音频，并且支持50种语言。新模式将面向所有用户，而非付费用户。

OpenAI的CEO山姆·奥尔特曼在博客中表示，AI达到人类级别的响应时间和表现力证明是一个很大的改变，这个新东西在感受上是完全不同的。它快速、聪明、有趣、自然且有帮助。此外，苹果电脑用户将迎来一款为macOS设计的ChatGPT桌面应用，用户可以通过快捷键“拍摄”桌面并向ChatGPT提问，OpenAI表示，Windows版本将在今年晚些时候推出。

OpenAI首席技术官穆里・穆拉蒂 (Muri Murati) 表示，GPT-4o将提供与GPT-4同等水平的智能，但在文本、图像以及语音处理方面均取得了进一步提升。

“GPT-4o可以综合利用语音、文本和视觉信息进行推理。”穆拉蒂在OpenAI公司总部举行的主题演讲中表示。GPT-4是OpenAI此前的旗舰模型，可以处理由图像和文本混合而成的信息，并能完成诸如从图像中提取文字或描述图像内容等任务，GPT-4o则在此基础上新增了语音处理能力。

GPT-4o的运行速度将大大提升，最大亮点在于其语音交互模式采用了新技术。OpenAI一直致力于让用户通过语音与ChatGPT进行交流，仿佛与真人对话一般。然而，之前的版本由于延迟问题，严重影响了对话的沉浸感。GPT-4o则采用了全新的技术，让聊天机器人对话的响应速度大幅提升。

发布会上OpenAI展示了使用GPT-4o进行语音对话的演示。演示者提问结束后，GPT-4o几乎可以即时回应，并通过文本转语音功能进行朗读，让对话感觉更加自然逼真。

另一个演示展示了GPT-4o根据要求调整说话时语气，GPT-4o可以根据指令改变声音，从夸张戏剧到冰冷机械，展现了出色的可塑性。最后，演示还展示了GPT-4o的唱歌功能。

此外，OpenAI还发布了桌面版的ChatGPT和新的用户界面。“我们认识到这些模型正变得越来越复杂，” 穆拉蒂说道，“但我们希望用户与人工智能模型的交互体验能够更加自然、轻松，让用户可以将注意力完全集中在与模型的协作上，而无需在意界面本身。”

免费！OpenAI推出新旗舰模型GPT-4o，可综合利用语音、文本和视觉信息进行推理

免费！OpenAI推出新旗舰模型GPT-4o，可综合利用语音、文本和视觉信息进行推理

推荐体验

相关资讯

OpenAI 2024 Spring推出 GPT-4o，新旗舰模型，可以实时对音频、视觉和文本进行推理

免费！OpenAI推出新旗舰模型GPT-4o，具备音频和视觉理解能力

OpenAI推出新旗舰模型GPT-4o 上线语音交互等新功能

前瞻全球产业早报：OpenAI推出新旗舰模型GPT-4o

重磅！类人速度超快语音响应！OpenAI推出新旗舰模型GPT-4o，图文音频手机AI搞定

近期资讯

1月新机阵容揭晓：小米、华为、iQOO等轮番上阵！

抢到赚翻了！蛇年纪念钞溢价到1000元一套

AGI的终极形态！李想：对“硅基家人”成真无比相信

李想：理想汽车100%会做人形机器人但不是现在

229元酷态科10号超级电能棒Plus上架：15000mAh大容量

老外评年度十佳性感游戏角色：《剑星》伊芙仅第七

李想透露自研自动驾驶原因：被供应商欺负惨了

李想：2030年可能做一辆AI超级跑车

黄子韬称送粉丝10台车：一天涨粉500万评论区全是小米SU7

李想回应购买法拉利还想让理想同学入驻超跑

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响