划重点:
- 1
OpenAI发布新旗舰人工智能模型GPT-4o,并推出桌面版ChatGPT。
- 2
GPT-4o将免费提供给所有用户,付费用户消息限制是普通用户的五倍。
- 3
GPT-4o速度比GPT-4 Turbo快一倍,而且改进了文本、视频和音频功能。
- 4
GPT-4o能够感知用户情绪,能够分析用户面部表情。
腾讯科技讯 5月14日消息,据国外媒体报道,OpenAI于美国西部时间5月13日上午10点(北京时间14日凌晨1点)拉开其春季更新活动的帷幕,通过线上直播的形式,向全球演示ChatGPT和GPT-4更新的功能。活动中,OpenAI发布名为GPT-4o的新旗舰人工智能模型,并推出桌面版ChatGPT。在GPT-4o的名称当中,“o”代表的是“全能的”(omni)。
OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在直播活动中表示:“谈到易用性,这是我们第一次真正向前迈出了一大步。”OpenAI在活动中除去发布GPT-4o和桌面版ChatGPT之外,还发布了新版的用户界面。她还表示:“更新的GPT-4将面向所有用户,包括OpenAI的免费用户。”
穆拉蒂称,GPT-4o提高了50种不同语言的ChatGPT服务的质量和速度,并且还将通过OpenAI的API提供,以便开发人员从周一开始就可以开始使用新模型构建应用。穆拉提还说,GPT-4o的速度是GPT-4 Turbo的两倍,但成本仅是后者的一半。此外,PT-4o还改进了文本、视频和音频功能。
得到微软支持的OpenAI当前的估值已超过800亿美元。这家成立于2015年的公司当前面临着双重压力--在竞争激烈的生成式人工智能市场保持领先优势的同时,OpenAI还因为在处理器和基础设施上投入巨资开发和训练模型,需要想办法获取更多的营收。
在直播活动中,OpenAI团队成员展示了GPT-4o的音频功能。OpenAI研究人员马克·陈(Mark Chen)表示,该模型具有“感知用户情绪”的能力。该团队还要求GPT-4o分析用户的面部表情,用于评估用户当前的情绪。根据OpenAI的官方博文,该公司计划在未来几周内测试语音模式,并为ChatGPT Plus的付费用户提供早期服务。OpenAI还表示,新模型可以“在最短232毫秒内响应用户的音频提示,平均响应时间为320毫秒,与人类在对话中的响应时间相似。”
OpenAI的新模型可以充当翻译器。OpenAI的团队成员还展示了GPT-4o解答数学方程和帮助编写代码的能力,称它是微软GitHub Copilot强有力的竞争对手。
对于OpenAI而言,这是该公司自去年8月推出企业版ChatGPT Enterprise以来最大规模的发布活动。OpenAI首席运营官公司的布拉德·莱特卡普(Brad Lightcap)当时曾表示,该工具的开发时间不到一年,得到了不同规模和行业的20多家公司的帮助。
OpenAI、微软和谷歌正引领着生成式人工智能淘金热,似乎每个行业的公司都在竞相为关键服务添加人工智能聊天机器人和智能体,以避免被竞争对手甩在后面。本月初,OpenAI的竞争对手Anthropic发布了其第一款企业产品和免费的iPhone应用。
根据PitchBook的数据,2023年,近700笔生成式人工智能交易的投资达到创纪录的291亿美元,比上一年增长了260%以上。预计该市场的营收将在十年内突破1万亿美元。不过一些业内人士对未经测试的新服务进入市场的速度表示担忧,学者和伦理学家对该技术传播偏见的趋势感到担忧。
ChatGPT于2022年11月推出后迅速打破记录,成为史上增长最快的消费者应用,目前拥有约1亿周活跃用户。OpenAI表示,超过92%的财富500强公司正在使用该公司的服务。
穆拉蒂在周一的活动中表示,OpenAI希望“消除技术中的一些神秘主义。”她说:“在接下来的几周内,我们将向每个人推出这些功能。”按照OpenAI的计划,GPT-4o将于周二首先向ChatGPT Plus和Team的客户推出,随后将向企业版用户推出。从周一开始,ChatGPT的免费用户也可以使用GPT-4o,但有使用限制。ChatGPT Plus用户的消息限制将是免费用户的五倍,ChatGPT Team和Enterprise的客户端将有更大的使用限制。
穆拉蒂在周一直播活动的最后特别感谢了英伟达和该公司首席执行官黄仁勋,感谢他们为OpenAI技术提供必要的GPU。她说:“我只想感谢令人难以置信的OpenAI团队,也感谢黄仁勋和英伟达团队为我们带来了最先进的GPU,让今天的演示成为可能。”(编译/无忌)