鞭牛士报道,12月18日消息,据外电报道,在以假期为主题的产品发布会OpenAI 12 天的第九天, OpenAI 正在通过其应用程序编程接口 (API)向第三方开发人员推出其最先进的模型 o1 。
对于希望构建新的高级 AI 应用程序或将最先进的 OpenAI 技术集成到现有应用程序和工作流程(无论是面向企业还是面向消费者)的开发人员来说,这标志着向前迈出了重要一步。
如果您还不熟悉 OpenAI 的 o1 系列,这里是概要:它于 2024 年 9 月发布,是 ChatGPT 公司新系列模型中的第一个,超越了 GPT 系列的大型语言模型 (LLM),并提供推理功能。
基本上,o1 系列模型(o1 和 o1 mini)需要更长的时间来响应用户的提示并提供答案,但它们会在制定答案时检查自己是否正确,并避免产生幻觉。当时,OpenAI 表示 o1 可以处理更复杂的博士级问题——现实世界的用户也证实了这一点。
虽然开发人员之前可以访问 o1 的预览版本,并在此基础上构建自己的应用程序(例如,博士顾问或实验室助理),但通过 API 发布的完整 o1 模型的生产就绪版本可以提高性能、降低延迟并带来新功能,使其更容易集成到实际应用程序中。
大约两周半前, OpenAI已通过其 ChatGPT Plus 和 Pro 计划向消费者推出了 o1 ,同时还增加了模型分析和响应用户上传的图像和文件的功能。
除了今天的发布之外,OpenAI 还宣布对其 Realtime API 进行重大更新,同时降低价格并采用新的微调方法,让开发人员能够更好地控制他们的模型。
完整的 o1 模型现在可以通过 OpenAI 的 API 供开发人员使用
新的 o1 模型(编号为 o1-2024-12-17)旨在出色地完成复杂的多步骤推理任务。与之前的 o1-preview 版本相比,此版本提高了准确性、效率和灵活性。
OpenAI 报告称,其在编码、数学和视觉推理任务等一系列基准测试中都取得了显著的进步。
例如,SWE-bench Verified 上的编码结果从 41.3 提高到 48.9,而以数学为重点的 AIME 测试中的表现从 42 跃升至 79.2。这些改进使 o1 非常适合构建简化客户支持、优化物流或解决具有挑战性的分析问题的工具。
一些新功能增强了 o1 对开发人员的功能。结构化输出允许响应可靠地匹配自定义格式(例如 JSON 模式),从而确保与外部系统交互时的一致性。函数调用简化了将 o1 连接到 API 和数据库的过程。而对视觉输入进行推理的能力则为制造、科学和编码开辟了用例。
开发人员还可以使用新的reasoning_effort参数微调o1的行为,该参数控制模型在任务上花费的时间,以平衡性能和响应时间。
OpenAI 的 Realtime API 得到增强,为智能对话式语音/音频 AI 助手提供支持
OpenAI 还宣布了其 Realtime API 的更新,旨在为语音助手、实时翻译工具或虚拟导师等低延迟、自然的对话体验提供支持。
新的 WebRTC 集成功能可直接支持音频流、噪音抑制和拥塞控制,从而简化语音应用的构建。开发人员现在只需进行最少的设置即可集成实时功能,即使在多变的网络条件下也是如此。
OpenAI 还为其实时 API 引入了新的定价,将 GPT-4o 音频的成本降低 60% 至每百万输入令牌 40 美元,每百万输出令牌 80 美元。
缓存音频输入成本降低了 87.5%,现在每 100 万个输入令牌售价为 2.50 美元。为了进一步提高可负担性,OpenAI 正在添加 GPT-4o mini,这是一款更小、更经济高效的型号,售价为每 100 万个输入令牌 10 美元,每 100 万个输出令牌 20 美元。
GPT-4o mini 的文本代币费率也明显较低,输入代币起价为 0.60 美元,输出代币起价为 2.40 美元。
除了定价之外,OpenAI 还让开发人员能够更好地控制 Realtime API 中的响应。并发带外响应等功能允许在不中断用户体验的情况下运行内容审核等后台任务。开发人员还可以自定义输入上下文,以专注于对话的特定部分,并控制何时触发语音响应,以实现更准确、更无缝的交互。
偏好微调提供新的自定义选项
另一个主要的新增功能是偏好微调,这是一种根据用户和开发人员偏好定制模型的方法。
与依赖精确输入输出对的监督式微调不同,偏好微调使用成对比较来告诉模型哪些响应是首选。这种方法对于主观任务(例如总结、创意写作或语气和风格很重要的场景)特别有效。
与为金融分析师打造助手的 Rogo AI 等合作伙伴进行的早期测试显示出令人鼓舞的结果。Rogo 报告称,偏好微调帮助他们的模型比传统微调更好地处理复杂、分布外的查询,将任务准确率提高了 5% 以上。该功能现已适用于 gpt-4o-2024-08-06 和 gpt-4o-mini-2024-07-18,并计划在明年初将支持范围扩大到较新的模型。
面向 Go 和 Java 开发人员的新 SDK