当前位置:首页|资讯|OpenAI

OpenAI推出小模型GPT-4o Mini:在数学推理和编码方面表现出现

作者:多知网发布时间:2024-07-19

多知7 月19日消息,OpenAI今日宣布推出了小模型 —— GPT-4o Mini,其价格更实惠且性能更精简。OpenAI 表示,升级后的模型即日起向免费用户和付费 ChatGPT Plus 和 Team 用户推出,并将于下周向企业客户推出。

GPT-4o mini以其低成本和低延迟使广泛的任务成为可能,能够处理大量上下文信息,支持文本和视觉输入输出需要高效、低成本智能解决方案的企业和技术开发者客户支持聊天机器人、数据提取和分析工具等。

据OpenAI介绍,GPT-4o mini支持API中的文本和视觉,未来将支持文本、图像、视频和音频的输入和输出。该模型具有128K令牌的上下文窗口,每个请求支持最多16K输出tokens,并拥有截至2023年10月的知识。得益于与GPT-4o共享的改进分词器,处理非英语文本现在更加经济实惠。

根据OpenAI的数据,在大规模多任务语言理解(MMLU)基准测试中,GPT- 4o Mini的得分为82%,超过了其他小型模型和GPT-3.5 Turbo。MMLU测试测量了包括数学和法律在内的57门学科的语言模型的能力。这款小模型将取代ChatGPT中的GPT-3.5 Turbo,免费、Plus和团队用户现在可以使用新模型。

其中,数学和编码能力:GPT- 4o Mini在数学推理和编码任务方面表现出色,优于市场上以前的小型号。在测量数学推理的MGSM测试中,GPT- 4o Mini得分为87%,而Gemini Flash得分为75.5%,Claude Haiku得分为71.7%。GPT- 4o Mini在衡量编码性能的HumanEval中得分为87.2%,而Gemini Flash得分为71.5%,Claude Haiku得分为75.9%。

OpenAI表示:“我们设想的未来是,模型可以无缝集成到每个应用程序和每个网站上。GPT- 4o Mini为开发人员更高效、更经济地构建和扩展强大的人工智能应用铺平了道路。”

对于企业而言,较小的模型可能适合自动执行大量基本任务,而较大的模型可能可以处理更复杂的任务。一些企业可能会在一个应用程序中同时使用两者。因此,目前,很多大模型企业也都在推轻量级的小模型。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1