当前位置:首页|资讯|OpenAI

企业低成本使用OpenAI !Azure OpenAI 服务预配预留和小时定价

作者:等保测评办理发布时间:2024-09-02

企业如何合规、稳定使用ChatGPT以及Copilot?

出于合规角度,建议国内企业可以选择微软的Azure OpenAI服务来使用接口。

通过微软官方合作伙伴获取服务,企业用户可以合规、稳定地使用ChatGPT,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。

作为微软的合作伙伴,全云在线可为企业开通绿色申请通道!包括最新版本GPT-4o、Dalle-3等,只要企业有需求,全云在线都能协助快速开通!

参考链接:https://azureopenai.cloudallonline.com/?zxwsh107
全云微软 Azure OpenAI 试用申请

介绍

微软最近推出了Azure Essentials,旨在为您提供指导,帮助您高效管理云投资,方法是选择最符合您需求的定价方案、只按实际使用量付费,并随着业务的发展管理云支出,无论您是迁移第一个工作负载还是优化复杂的部署。随着 Azure Essentials 的推出,微软团队很高兴地宣布对 Azure OpenAI 服务的预配部署进行重大更改。我叫 Roman,是 AI 全球黑带团队的一员,今天非常高兴与大家分享这些变化。

从今天开始,我们将推出几项更新,这些更新将改变您采购和部署预置吞吐量单元的方式。这些变化旨在帮助您提高敏捷性、加快上市速度和提高成本效益。今天公布的变化仅与预置部署采购流程有关。技术价值主张仍然相同,预置部署仍然是实时和高吞吐量应用程序的最佳选择。

今天我们宣布:

  • 自助服务配置和模型独立配额请求
  • 服务容量和可用性的可见性
  • 预配置小时定价和预配置预留

这篇博文将重点关注最后一点,并深入探讨 Azure 预留的预配部署。要了解有关所有这些更改的更多信息,请访问此链接。

2023 年夏末,微软为 Azure Open AI 服务推出了预配置吞吐量单元。这曾经是、现在仍然是客户在 Azure OpenAI 服务中请求指定数量的计算能力并解决与公共云中的 AI 计算相关的“吵闹邻居”问题相关的挑战的一种方式。与区域标准和全球标准部署相比,预配置部署允许客户创建具有保证容量的部署;因此,客户可以构建具有可预测延迟和吞吐量的 GenAI 应用程序。

直到今天,如果您想创建预配置部署,您必须仔细规划并与您的客户团队合作;配额意味着从池中划出的实际容量,并暂时预先分配给您的订阅,直到购买完成。您承诺使用 30 天的容量和型号系列与您可以部署的内容紧密相关。此外,您必须将您的承诺与特定资源绑定在一起,这可能会给多区域甚至多订阅架构带来管理负担。

推出按小时无承诺购买

在 Microsoft,我们希望让客户能够使用生成式 AI 构建世界一流的实时高吞吐量应用程序。为此,我们希望使我们的预配置部署更易于访问;我们希望在提供高质量服务的同时提供尽可能多的灵活性。我们不再要求至少承诺 30 天才能购买预配置吞吐量。如果您愿意,现在您可以以自助服务的方式创建预配置部署,只需在今天下午运行基准测试脚本即可。完成后,您还可以拆除部署。没有任何附加条件。为此,我们制定了一个易于理解的固定价格,即每单位每小时 2 美元(可能会更改,请查看此链接了解最新价格)。无论您部署的是 GPT-3.5-Turbo 还是 GPT-4o,每单位价格都是相同的,并且预配置吞吐量单元的构造现在完全独立于模型。也就是说,不同的模型仍然具有不同的最小增量大小。以 GPT-4o 为例,可以部署 50 个 PTU 的任意倍数。

我们并没有止步于此。如果一个小时的时间超出了您的需要,您可以提前停止使用,我们将按比例分摊部分时间的费用。如果您创建了 100 个单位的预配置部署,但只使用了 15 分钟,则将向您收取相当于 25 个小时单位的费用。我们希望让所有人都能使用预配置部署。

此选项非常适合所有测试场景以及过渡期,客户可能会将部署从一个区域移动到另一个区域,并且希望在没有 PTU 停机的情况下进行此操作。

Azure OpenAI 服务预配预留简介

按小时无承诺购买为我们的客户提供了更大的灵活性。但本着让预配置部署更加易于访问的精神,我们还希望提供一种成本优化机制。

假设您构建了一个应用程序,并且希望您喜欢按小时计费;在开发过程中,它为您提供了针对具有各种参数的多个模型运行测试的灵活性。但是您现在已经在生产中部署了该应用程序,它将稳定地发送完成请求。不仅在接下来的几个小时内,而且在接下来的几周和几个月内。在这种情况下,Azure OpenAI 服务预配的预留将非常有益。从技术角度来看,Azure 预留根本不会改变您的预配部署。相反,它在其上覆盖了一个可预测且经济高效的计费机制。

它的工作原理很简单。在 Azure OpenAI Studio 中,我们提供了一个简单的容量计算器,您输入应用程序的特征,计算器就会估算出您需要配置的单元数量,以覆盖您预计在部署中处理的所有请求。

Azure Open AI Studio 中的容量计算器

作为客户,您可以使用计算器确定在您的应用程序中需要一定数量的预配置吞吐量单位。然后,您可以在 Azure 门户中购买一个月或一年的此数量的 PTU 预留。通过进行月度预留,您可以节省高达 82%* 的小时费率,而对于一年的预留,您可以节省高达 85%**。请记住,虽然您必须选择一个区域,但您不再需要承诺使用特定的型号或型号系列。假设您为一年预留 500 个单位,您将获得相当大的折扣,并且您可以切换分配单位的型号,在多个部署中混合搭配型号,随意创建和拆除部署。还请记住,预留和部署现在是分离的,可以完全独立地更改。购买 PTU 预留不会创建部署或保证容量的可用性。因此,我们建议先创建部署,然后再继续预留。这种方法可确保您不会购买由于暂时容量短缺而无法满足的预订。

可以灵活地将预订范围限定为涵盖单个资源组、订阅、管理组中的订阅列表或同一计费上下文中的所有订阅中的部署。现在,如果您是一家大型企业,假设每个业务部门有一个订阅,并且这些订阅中可能每个应用程序都有一个资源,那么您现在可以购买一个集中预订来涵盖所有内容。

如果您预留的单位数与部署的单位数相匹配,则说明您的状况良好,并且正在尽可能地优化成本。如果您预留的单位数大于部署的单位数,则说明您没有获得应有的价值。如果您部署的单位数多于预留的单位数,则差额将按上一段所述按小时计费。无论如何,定期重新评估您的覆盖范围是一种很好的做法。

结论

这次新迭代不会改变预配置部署的技术特性。它们仍然提供一流的服务,具有低延迟和可预测的延迟。然而,在采购方面,这是一个全新的世界。自助服务配置、模型独立单元以及按小时按需部署以实现最大灵活性和预留以实现最大成本节省,Azure OpenAI 的预配置部署现在比以往任何时候都更具吸引力,进入门槛也降低了。

详细了解如何使用Azure Essentials提升云和 AI 投资的可靠性、安全性和持续性能。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1