Azure OpenAI 每个模型系列都有一系列模型,这些模型按功能进一步区分。 这些功能通常由名称标识,并且这些名称的字母顺序通常指示给定模型系列中该模型的相对功能和成本。 例如,GPT-3 模型使用 Ada、Babbage、Curie 和 Davinci 等名称来指示相对功能和成本。 Davinci 比 Curie 功能更强大(且成本更高),而 Curie 又比 Babbage 功能更强大(且成本更高),依此类推。
Azure OpenAI-ChatGPT
Azure OpenAI- ChatGPT 模型
与任何 OpenAI 以前的模型相比,GPT-4 可以更准确地解决难题。 与 gpt-35-turbo 一样,GPT-4 针对聊天进行了优化,但适用于传统的完成任务。
这些模型目前处于预览状态。 要获取访问权限,现有的 Azure OpenAI 客户可以通过填写此表单来提出申请。
gpt-4 最多支持 8192 个输入令牌,而 gpt-4-32k 最多支持 32,768 个令牌。
GPT-3 模型可以理解和生成自然语言。 该服务提供四个模型功能,每个都有不同级别的能力以及适用于不同任务的速度。 Davinci 是功能最强大的模型,而 Ada 是速度最快的模型。 模型排序(按功能从高到低的顺序):
虽然 Davinci 能力最强,但其他模型提供了显着的速度优势。 我们的建议是让用户在试验时从 Davinci 开始,因为它能产生最佳结果并验证 Azure OpenAI 可以提供的价值。 原型正常工作后,就可以优化模型选择,为应用程序实现最佳延迟/性能平衡。
Davinci
Davinci 是功能最强大的模型,可以执行其他模型能够执行的任何任务,并且所用的指令通常更少。 对于需要深入理解内容的应用程序(例如面向特定受众的摘要和创意内容的生成),Davinci 将产生最佳结果。 Davinci 提供的这些增加的功能需要更多计算资源,因此 Davinci 的成本更高,并且 Davinci 不如其他模型快。
Davinci 擅长的另一个领域是理解文本的意图。 Davinci 擅长解决多种逻辑问题并解释字符动机。 Davinci 已经能够解决一些涉及因果关系的最具挑战性的 AI 问题。
用途:复杂的意图、因果关系、受众摘要
Curie
Curie 功能强大,但速度很快。 虽然 Davinci 在分析复杂文本方面更强大,但 Curie 可以执行许多精细化的任务,例如情绪分类和摘要。 Curie 也善于回答问题和执行问答,适合用作常规服务聊天机器人。
用途:语言翻译、复杂分类、文本情绪、摘要
Babbage
Babbage 可以执行简单的分类等简单任务。 在语义搜索方面,它的功能也很强大,可对文档与搜索查询的匹配程度进行排名。
用途:中等分类、语义搜索分类
Ada
Ada 通常是最快的模型,可以执行的任务有分析文本、地址更正和不需要太多细微差别的某些分类任务等等。 Ada 的性能通常可以通过提供更多上下文来改进。
用途:分析文本、简单分类、地址更正、关键字
3.ChatGPT (gpt-35-turbo)(预览版)
ChatGPT 模型 (gpt-35-turbo) 是一种专为对话接口设计的语言模型,该模型的行为方式与以前的 GPT-3 模型不同。 以前的模型是文本输入和文本输出,这意味着它们接受了提示字符串并返回了一个会追加到提示的补全。 但是,ChatGPT 模型是对话传入和消息输出。模型需要摄入具体的类似聊天脚本形式的提示字符串,并返回作为聊天中模型编写的消息的补全。
要详细了解 ChatGPT 模型以及如何与聊天 API 进行交互,请查看深入了解操作方法。
Codex 模型
Codex 模型是基模型 GPT-3 的子代,可以理解和生成代码。 它们的训练数据包含自然语言和来自 GitHub 的数十亿行公开代码。
它们最擅长 Python,并且精通十几种语言,包括 C#、JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL 和 Shell。 Codex 模型排序(按功能从高到低的顺序):
Davinci
类似于 GPT-3,Davinci 是功能最强大的 Codex 模型,可以执行其他模型能够执行的任何任务,并且所用的指令通常更少。 对于需要深入了解内容的应用程序,Davinci 会生成最佳结果。 更强的功能需要更多计算资源,因此 Davinci 的成本更高,并且不如其他模型快。
Cushman
Cushman 功能强大,但速度很快。 虽然 Davinci 在分析复杂任务方面更强大,但 Cushman 是能够执行许多代码生成任务的模型。 Cushman 通常也比 Davinci 运行速度更快、成本更低。
嵌入模型
目前,我们提供了三个系列的嵌入模型以实现不同的功能:
每个系列都包含某一功能范围的模型。 以下列表根据模型功能指示服务返回的数字向量长度:
Davinci 功能最强,但比其他模型更慢更贵。 Ada 功能最弱,但速度更快且更成本更低。
深圳市云展信息技术有限公司成立于2015年,专注于云计算, BI大数据,数据中心, IoT物联网,人工智能, IT基础架构,信息安全等专业领域的高新技术企业,在广州、武汉等地设有分支机构,与众多的国内外知名软件厂商实现了全方位的紧密合作,先后的成为Microsoft、AWS、 Oracle、 VMware、 Citrix、 IBM、 Dell EMC、 Veritas、华为、阿里、腾讯的服务提供商,拥有丰富的软件产品线和解决方案。
目前提供Azure OpenAI, ChatGPT试用,解决方案咨询,应用开发与推广,托管运维技术服务。