当前位置:首页|资讯|OpenAI|微软|ChatGPT

OpenAI新GPT-4o mini,更快更便宜ChatGPT在微软Azure OpenAI上线

作者:等保测评办理发布时间:2024-08-08

OpenAI最新、最快的模型GPT-4o mini现已在Azure AI(国际版)平台上线,为开发者带来前所未有的开发体验!

企业如何合规、稳定使用ChatGPT以及Copilot?

出于合规角度,建议国内企业可以选择微软的Azure OpenAI服务来使用接口。

通过微软官方合作伙伴获取服务,企业用户可以合规、稳定地使用ChatGPT,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。

作为微软的合作伙伴,全云在线可为企业开通绿色申请通道!包括最新版本GPT-4o、Dalle-3等,只要企业有需求,全云在线都能协助快速开通!

企业微软 Azure OpenAI 免费试用申请:
https://azureopenai.cloudallonline.com/?zxwsh67

OpenAI终于开卷小模型!

每百万输入token已达15美分的超低价,跟GPT-3相比,两年内模型成本已降低99%

根据测试性能显示,GPT-4o mini的性能比GPT-4更好,大约有GPT-4o的80%能力。但API的价格却大幅度下降,每100万tokens的输入为15美分,每100万tokens的输出为60美分。

值得一提的是,从今天开始GPT-4o mini已经取代了GPT-3.5 Turbo,免费为注册的ChatGPT用户提供服务,同时这也是OpenAI发布的第一个基于指令层级结构的模型。

虽然,目前OpenAI对国内的API禁令已经在7月9日生效了,但只要注册微软的Azure云服务,国内企业依然可以使用OpenAI的模型

以下为OpenAI官网内容:

OpenAI 一直在努力让人工智能技术更加普及。今天,我们很高兴地宣布推出 GPT-4o mini,这是一款性价比极高的小型模型。我们相信 GPT-4o mini 将通过降低智能技术的门槛,极大地扩展 AI 应用的范围。在 MMLU 测试中,GPT-4o mini 取得了 82% 的成绩,并且在聊天偏好方面超越了 GPT-4 1(点击这里查看详情)。它的价格非常亲民,每百万输入代币只需 15 美分,每百万输出代币 60 美分,比之前的 Frontier 型号便宜十倍,比 GPT-3.5 Turbo 便宜超过 60%。

GPT-4o mini 以其经济实惠和快速响应的特点,能够胜任多种任务,如调用多个模型、处理大量上下文信息(例如完整的代码库或对话记录),或者通过快速的文本回复与用户进行互动(如客服聊天机器人)。

目前,GPT-4o mini 支持文本和视觉内容的 API 调用,未来还将扩展到支持文本、图像、视频和音频的输入和输出。它拥有 128K 个 token 的上下文窗口,每个请求最多可支持 16K 个输出 token,并且涵盖了截至 2023 年 10 月的最新知识。得益于与 GPT-4o 共享的改进 tokenizer,处理非英语文本也变得更加经济高效。

具有卓越文本智能和多模态推理能力的小模型

GPT-4o mini 在文本理解和多模态推理的学术测试中表现卓越,超越了 GPT-3.5 Turbo 及其他小型模型。它支持的语言种类与 GPT-4o 一样广泛。此外,GPT-4o mini 在函数调用方面也表现突出,这使得开发者能够构建那些需要获取数据或调用外部系统执行操作的应用,并且其处理长文本的能力也比 GPT-3.5 Turbo 有所提升。

以下是 GPT-4o mini 在一些关键基准测试中的表现:

  1. 推理任务:在涉及文本和视觉的推理任务中,GPT-4o mini 表现优异。在衡量文本智能和推理能力的 MMLU 测试中,GPT-4o mini 得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
  2. 数学和编码能力:GPT-4o mini 在数学推理和编码任务上同样表现出色,超越了市场上的其他小型模型。在 MGSM 测试中,GPT-4o mini 得分为 87.0%,Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。在 HumanEval 测试中,GPT-4o mini 得分为 87.2%,Gemini Flash 为 71.5%,Claude Haiku 为 75.9%。
  3. 多模态推理:在 MMMU 多模态推理评估中,GPT-4o mini 也展现了其优势,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。

作为模型开发过程的一部分,我们与一些值得信赖的合作伙伴合作,以更好地了解 GPT-4o mini 的用例和局限性。我们与Ramp等公司合作(在新窗口中打开)和超人(在新窗口中打开)他们发现,在执行从收据文件中提取结构化数据或在提供线程历史记录时生成高质量电子邮件响应等任务时,GPT-4o mini 的表现明显优于 GPT-3.5 Turbo。

内置安全措施

安全性从一开始就融入到我们的模型中,并在开发过程的每一步中得到强化。在预训练中,我们会过滤掉(在新窗口中打开)我们不希望模型学习或输出的信息,例如仇恨言论、成人内容、主要汇总个人信息的网站和垃圾邮件。在训练后,我们使用强化学习和人工反馈 (RLHF)等技术将模型的行为与我们的策略保持一致,以提高模型响应的准确性和可靠性。

GPT-4o mini 内置了与GPT-4o相同的安全缓解措施,我们根据我们的准备框架并按照我们的自愿承诺,使用自动和人工评估对其进行了仔细评估。超过 70 位来自社会心理学和错误信息等领域的外部专家对 GPT-4o 进行了测试,以识别潜在风险,我们已经解决了这些风险,并计划在即将发布的 GPT-4o 系统卡和准备记分卡中分享详细信息。这些专家评估的见解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。

基于这些经验,我们的团队还致力于利用我们研究得出的新技术来提高 GPT-4o mini 的安全性。API 中的 GPT-4o mini 是第一个应用我们的指令层次结构的模型(在新窗口中打开)方法,有助于提高模型抵抗越狱、即时注入和系统即时提取的能力。这使得模型的响应更加可靠,并有助于使其在大规模应用中更安全地使用。

我们将继续监控 GPT-4o mini 的使用情况,并在发现新的风险时提高模型的安全性。

供货和价格

GPT-4o mini 现已作为文本和视觉模型在 Assistants API、Chat Completions API 和 Batch API 中提供。开发人员每 100 万个输入令牌支付 15 美分,每 100 万个输出令牌支付 60 美分(大约相当于标准书籍的 2500 页)。我们计划在未来几天推出 GPT-4o mini 的微调。

在 ChatGPT 中,免费版、Plus 版和团队版用户从今天开始将能够使用 GPT-4o mini,以替代 GPT-3.5。企业用户也将从下周开始使用,这符合我们让所有人都能享受 AI 好处的使命。

下一步是什么

过去几年,我们见证了人工智能的显著进步和成本的大幅降低。例如,自 2022 年推出功能较弱的模型 text-davinci-003 以来,GPT-4o mini 的每代币成本已下降 99%。我们致力于继续沿着这条降低成本、同时增强模型能力的轨迹前进。

我们设想的未来是模型可以无缝集成到每个应用程序和每个网站上。GPT-4o mini 为开发人员铺平了道路,使他们能够更高效、更经济地构建和扩展强大的 AI 应用程序。AI 的未来将变得更加易于访问、可靠,并嵌入到我们的日常数字体验中,我们很高兴能够继续引领潮流。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1