OpenAI连甩5款新模型，价格暴降，功力大涨，还修复了GPT-4变懒问题

作者：智东西发布时间：2024-01-26

智东西1月26日报道，昨夜，OpenAI发布了一系列重磅大模型更新，连发了五个新模型以及新的API使用管理工具，总体来说可以说是“加量不加价”，OpenAI的友商们一觉醒来压力着实又大了不少。

首先，来看看新品和新特性：

1、新的GPT-3.5 Turbo模型，输入价格暴降50%，输出价格降低25%，同时修复各种BUG，回应准确性更高，老用户两周后还可自动升级！

2、新的GPT-4 Turbo预览模型，生成代码能力更强，模型“变懒”情况减少，修复各种BUG，带有视觉功能的GPT-4 Turbo也会在未来几个月内推出！

3、新的小型文本嵌入模型text-embedding-3-small，性能小幅提升，价格直接“打骨折”，暴降至上代的五分之一。

4、新的大型文本嵌入模型text-embedding-3-large，核心就是性能强，可创建多达3072维的嵌入，部分测试性能提升70%以上，价格略贵一点点。同时，OpenAI还搞了个新技术，直接让开发者在略微损失精度的情况下缩短嵌入，实现性能和成本的平衡，灵活性极大提升。

5、新的审查模型text-moderation-007，OpenAI将其称之为“迄今为止最强大的审查模型”。

新的API使用管理工具我们不在此赘述。

哦对了，最后OpenAI还很贴心地提示说，默认情况下，发送到OpenAI API的数据将不会被用于训练或改进OpenAI模型。话不多说，我们具体来看看今天各个重磅新品的升级细节。

01 五分之一的价格，更强的性能，模型使用灵活性显著提升

首先来看看OpenAI此次新推出的两个嵌入模型，更小且高效的text-embedding-3-small模型，以及更大且更强的text-embedding-3-large模型。

在看模型之前，首先要理解下什么是“嵌入（embedding）”，简单来说，嵌入是一系列数字，而这些数字代表了自然语言或代码等内容中的概念。

▲嵌入（embedding）示意图

嵌入让机器学习模型和其他算法能够理解内容之间的关系，并执行如聚类或检索等任务，为ChatGPT和Assistants API中的知识检索，以及许多检索增强生成（RAG）开发者工具提供了支持。

新的小型文本嵌入模型text-embedding-3-small相比于2022年12月发布的前代模型text-embedding-ada-002主要有两方面升级：更强的性能、更低的价格。

性能方面，在一个常用的多语言检索基准（MIRACL）测试中，text-embedding-3-small平均分数从31.4%增加到了44.0%，在一个常用的英语任务基准（MTEB）测试中，其平均分数从61.0%增加到62.3%。

▲text-embedding-3-small测试成绩

价格方面，text-embedding-3-small的价格仅为上代的五分之一，每1000个tokens的价格从0.0001美元降低到0.00002美元。

另外一个新的大型文本嵌入模型text-embedding-3-large，据称可以创建多达3072维（dimensions）的嵌入，其主要提升在于性能。

性能方面，text-embedding-3-large在MIRACL测试中的平均分数从31.4%增加到54.9%，而在MTEB测试中，其平均分数从61.0%增加到64.6%。价格为0.00013美元/1000 tokens。

众所周知，用更大的嵌入，会消耗更多的计算、内存和存储资源，比使用更小的嵌入成本更高。

为此OpenAI推出了一种新的技术，让开发者可以在使用嵌入的性能和成本之间进行权衡。具体来说，开发者可以通过调整维度API参数（dimensions API parameter）来缩短嵌入，同时保证嵌入不会失去其表示概念的属性。

比如，在MTEB基准测试中，一个text-embedding-3-large嵌入可以被缩短到256的大小，但其测试成绩仍然优于一个未缩短的、大小为1536的text-embedding-ada-002嵌入。

▲缩短到256大小的text-embedding-3-large与未缩短的、大小为1536的text-embedding-ada-002测试成绩对比

这样的特性可以让使用变得非常灵活。比如当开发者使用一个最多只支持1024维嵌入的向量数据存储时，他仍然可以使用性能最强的text-embedding-3-large模型，他只需要为维度API参数指定一个1024的值，将嵌入从3072维缩短，当然精度会略有损失。

02 两大经典产品重磅升级，模型更勤快，代码能力增强，后续还会支持视觉功能

新的GPT-3.5 Turbo模型——输入输出价格大幅下降，老用户升级方便

除了两个嵌入模型，这次OpenAI还宣布将在下周推出一个新的GPT-3.5 Turbo模型——gpt-3.5-turbo-0125，并且进一步降低其使用价格，这已经是过去一年时间里OpenAI对其进行的第三次降价了。

到底有多便宜呢？gpt-3.5-turbo-0125输入的价格降低了50%，为0.0005美元/1000 tokens，输出价格也降低了25%，为0.0015美元/1000 tokens。

当然，gpt-3.5-turbo-0125还会有各种升级，比如在以请求的格式回应时，会有更高准确性，同时OpenAI还修复了一些BUG。

另一个好消息是，使用pinned gpt-3.5-turbo模型alias的老客户将在新模型发布后的两周内自动升级。

新的GPT-4 Turbo预览模型——代码更强，减少“变懒”

除了GPT-3.5 Turbo，OpenAI这次还发布了新的GPT-4 Turbo预览模型——gpt-4-0125-preview。

这个模型可以比之前的预览模型更完整地完成像代码生成这样的任务，并且可以减少模型“变懒（laziness）”不完成任务的情况。去年年底，GPT-4被发现“变懒”问题愈发严重，出现回应速度慢、回答敷衍、不听指令、写代码爱省略甚至拒绝回答、中断会话等情况。当然，新模型也修复了一些BUG。

对于新的GPT-4 Turbo预览模型，OpenAI也引入了相关自动升级机制，如果用户订购了相关服务，他就会一直能够使用最新版的GPT-4 Turbo预览模型。

值得一提的是，OpenAI还提到他们计划在未来几个月内推出带有视觉功能的GPT-4 Turbo。

“迄今为止最强大的审查模型”

最后一个新产品是一个新的审查模型——text-moderation-007，OpenAI称之为“迄今为止最强大的审查模型”，免费的审查API可以允许开发者识别可能有害的文本。

两项平台改进，提升开发者API使用管理体验

此外，OpenAI正在推出两项平台改进，让API密钥的使用有更好的透明度，同时让开发者对API密钥有更多的控制权。

第一项改进是，开发者可以从API密钥页面为API密钥分配权限。第二项改进是，使用仪表板和使用导出功能在打开跟踪后可以显示API密钥级别的度量。

▲仪表盘可以显示API密钥级别的度量

这样一来，只需要为每个功能、团队、产品或项目分配单独的API密钥，就可以简单地查看每个级别的使用情况。

03 结语：性能更强价格更低，OpenAI大模型继续巩固优势

此次OpenAI发布的多款大模型新品，都在上代产品基础上实现了一定的性能提升，在开发者使用的便捷程度、灵活程度上有一定改进，同时在价格方面给予了不小的优惠。

对于OpenAI来说，大模型生态的完善离不开开发者，今天的一系列“加量不加价”的操作也势必会增加OpenAI产品的竞争力。OpenAI的对手们将会做和应对、未来视觉大模型的出现又会给产业带来哪些新变量，我们拭目以待。

本文来自微信公众号“智东西”（ID：zhidxcom），作者：云鹏，36氪经授权发布。

随着2024年的脚步渐行渐远，新的一年即将到来。转眼间，我们即将迎来充满希望和机遇的2025年。在这个辞旧迎新的时刻，为自己准备一份特别的新年礼物，不仅是对自己过去一年辛勤付出的奖励，更是对新一年美好生活的期盼。新年不仅是家人团聚、朋友相聚的美好时刻，也是展示自我品味和生活态度的最佳时机。无论是为了犒劳自己，还是为了给亲朋好友送上一份心意满满的礼物，选择一件合适的数码产品无疑是不错的选择。这些数码产品不仅能提升我们的生活质量，更能彰显出我们的时尚品味和科技实力。 [图片] 在这篇文章中，我们将为大家精选

御海蓝桉 2024-12-27

消除嘈杂,享受静谧时光 - 览邦LairPods Pro+降噪耳机的安静魔力

在这个喧嚣的时代,很多人都渴望找到一个属于自己的静谧空间,远离外界的噪音干扰,沉浸在内心的宁静之中。而这个梦想,正是览邦LairPods Pro+降噪耳机为我们实现的。记得第一次戴上这款耳机,我就被它的"静谧魔力"所征服。只见我轻轻打开降噪开关,耳畔的嘈杂声仿佛一下子消失殆尽,取而代之的是一片宁静祥和。无论我身处地铁、公交还是繁华街道,耳边都只有悦耳动听的音乐,以及内心深处的平静。开启降噪模式后，耳机的解析力更是得到了加强。在低频下潜方面更加凝练有力，同时对中高频的细节处理也极为到位，呈现出更加干净细腻的

bili_86176276645 2024-12-27

安天网络行为检测能力升级通告（20241222）

安天长期基于流量侧数据跟踪分析网络攻击活动，识别和捕获恶意网络行为，研发相应的检测机制与方法，积累沉淀形成了安天自主创新的网络行为检测引擎。安天定期发布最近的网络行为检测能力升级通告，帮助客户洞察流量侧的网络安全威胁与近期恶意行为趋势，协助客户及时调整安全应对策略，赋能客户提升网络安全整体水平。一、安天网络行为检测能力概述安天网络行为检测引擎收录了近期流行的网络攻击行为特征。本期新增检测规则225条，升级改进检测规则162条，网络攻击行为特征涉及变种木马、代码执行等高风险，涉及SQL注入、文件写入等中风险

安天科技 2024-12-27

丹品科普——可调混响时间听音室与音乐设备：紧密关联与发展前景

大家好，欢迎来到丹品科普揭秘。今天来了解一下可调混响时间听音室与音乐设备之间的紧密联系。先看当下，这听音室对提升音乐设备音质作用很大。就音箱而言，其音质好坏不光取决于内部零件，所处声学环境也极为关键，听音室就成了音箱研发的重要场地。工程师在研发时，把音箱搬进听音室，调节混响时间。模拟家庭聚会听流行乐场景，调短混响，音箱传出的流行乐鼓点清脆、节奏明快，歌手嗓音清晰，歌词清楚可辨；模拟古典音乐厅，拉长混响，交响乐弦乐颤音悠长、管乐和声醇厚，能让人仿佛置身高雅艺术殿堂。经反复调试，音箱的扬声器振膜、分频器等部

广州丹品和丹测声学 2024-12-27

有事大家谈 | “小作坊下料就是猛”AI魔改视频让人眼前一亮还是一黑？

[图片] [图片] [图片] [图片] [图片] 文案朱海歌郭安兰恭灏唐瑷祺覃容琳宣推王奕婷熊沁怡蒋雯菁主播张巍耀制作杨自齐 ↓↓微信↓↓ [图片] ↓↓微博↓↓ [图片] ↓↓节目表↓↓ [图片]

CUC广播台 2024-12-27

企业安全的利器：七款热门网络准入控制产品功能测评

随着企业数字化转型的推进，网络安全面临前所未有的挑战。为了确保企业网络的高效与安全，网络准入控制（Network Access Control, NAC）成为不可或缺的一环。本文精选七款热门网络准入控制产品，深度剖析其功能与特点，助力企业挑选最佳解决方案。 [图片] 1. OneNAC 适用场景：中小型企业、混合网络环境功能亮点：终端身份验证：支持多种认证方式（账号密码、证书、指纹等），确保设备安全接入。实时网络可视化：提供所有接入设备和用户的实时状态图，便于快速响应异常。灵活权限管理：基于角色的

安在软件 2024-12-27

硬盘作为现代数据存储的重要设备，承载着大量个人及企业的关键信息。然而，当硬盘数据被意外移走或丢失时，无论是由于误操作、病毒攻击、硬件故障还是其他原因，都可能带来严重的后果。本文将深入探讨硬盘数据被移走后的恢复方法，旨在为用户提供一套全面、实用的解决方案。图片来源于网络，如有侵权请告知一、数据丢失的初步判断与应对在数据恢复之前，首要任务是判断数据是否真的丢失以及丢失的原因。有时，数据可能只是被误删除或隐藏，而并非真正从硬盘上抹去。因此，第一步是尝试通过常规手段查找数据，如检查回收站、使用文件搜索功能等。而移

云骑士数据恢复 2024-12-27