今日，OpenAI杀死ChatGPT-3.5

作者：智东西发布时间：2024-07-20

GPT-4o mini白菜价！10家同行PK，谁能与OpenAI对打？

编译 | 李水青

编辑 | 心缘

GPT-4o新版本降到1块钱/百万tokens了，打败OpenAI的还是OpenAI！

智东西7月19日报道， 7月18日晚间，OpenAI推出最便宜模型GPT-4o mini，我们第一时间将包括OpenAI在内的10家国内外厂商的大模型API最新定价进行了对比，发现这次其他同行压力不小了。

GPT-4o mini API输入定价为15美分（约合1.09元人民币）/百万tokens，输出价格为60美分（约合4.36元人民币）/百万tokens，相比GPT-3.5 Turbo便宜了超60%；但其能力大幅赶超GPT-3.5 Turbo，在MMLU测试中取得了82%的好成绩，并在LMSYS排行榜的聊天偏好方面超越了GPT-4。

此前，许多开发者因大模型价格昂贵，转向谷歌的Gemini 1.5 Flash、Anthropic的Claude 3 Haiku等小模型。现在，这些模型都被GPT-4o mini“狙击”了。

▲GPT-4o mini性价比远高于一众小模型（图源：Artificial Analysis）

如下表所示，据智东西统计，GPT-4o mini目前定价明显低于Gemini 1.5 Flash的2.5元/百万tokens的输入价格、7.6元/百万tokens的输出价格，也低于Claude 3 Haiku的1.8元/百万tokens输入价格、9元/百万tokens的输出价格，且性能全方位碾压它们。

同时，从上表可知，国内厂商如深度求索、智谱AI、字节跳动、阿里云、百度、字节跳动、腾讯云、科大讯飞等在6月陆续将模型大幅降价，但现在价格优势也被削弱。

比如阿里云Qwen-Turbo输入价格2元/百万tokens、输出价格6元/百万tokens，百度ERNIE 3.5系列输入价格12元/百万tokens、输出价格12元/百万tokens，字节Doubao-pro-128k输入价格5元/百万tokens、输出价格9月/百万tokens……在GPT-4o mini面前，性价比都要打一个大大的问号。

OpenAI CEO Sam Altman称，GPT-4o mini“走向廉价到无法计量的智能”。

▲OpenAI CEO Sam Altman在社交平台X发文

根据OpenAI公告，GPT-4o mini对比2022年功能相对初级的GPT-3的text-davinci-003模型，tokens成本已锐减99%。

目前，GPT-4o mini已免费上线ChatGPT，预计逐步替代GPT-3.5。

01 .

赶超GPT-3.5 Turbo问鼎小模型

GPT-4o mini具备低成本和低时延特征，能胜任多种任务，如：链接或并行模型调用、处理大量上下文、快速实时文本交互等。

它拥有128k tokens的上下文处理能力，在API中已支持文本和视觉输入，且支持16k输出tokens，未来还将扩展到视频和音频的输入/输出。

在多个全球权威基准测试中，GPT-4o mini成绩超越了自家的GPT-3.5 Turbo以及一众小模型。

在MMLU文本智能与推理基准测试中，GPT-4o mini以82.0%的得分领先，而Gemini Flash和Claude Haiku分别为77.9%和73.8%。

在MGSM数学推理测试中，GPT-4o mini获得87.0%的高分，远超Gemini Flash的75.5%和Claude Haiku的71.7%。

在HumanEval编码性能测试中，GPT-4o mini也以87.2%的优异成绩领先，Gemini Flash和Claude Haiku则分别为71.5%和75.9%。

多模态推理领域，GPT-4o mini在MMMU评估中得分59.4%，同样领先于Gemini Flash的56.1%和Claude Haiku的50.2%。

在执行任务时，如从收据中提取结构化数据或基于对话历史生成高质量电子邮件回复等，GPT-4o mini的表现显著优于GPT-3.5 Turbo。

GPT-4o mini昨夜刚刚发布，AI大牛Andrej Karpathy在社交平台X上称：“大语言模型的尺寸竞争正在加剧……倒退！我敢打赌，我们会看到非常小的模型，甚至是GPT-2参数级别的模型，已经非常擅长‘思考’”且可靠。”

▲AI大牛Andrej Karpathy在社交平台X发文

02 .

API输入价格低至1元已免费上线ChatGPT

GPT-4o mini现已正式上线，集成于Assistants API、Chat Completions API及Batch API中，供开发人员使用。

费用方面，GPT-4o mini输入价格为15美分（约合1.09元人民币）/百万tokens，输出价格为60美分（约合4.36元人民币）/百万tokens，这大致相当于处理约2500页标准书籍内容的成本。

OpenAI计划在接下来几天内推出GPT-4o mini的微调功能。

对于ChatGPT用户，无论是免费版、Plus版还是团队版，从今天起他们都将能够体验到GPT-4o mini，它将逐步替代GPT-3.5。企业用户也将在下周起接入这一升级。

OpenAI称，GPT-4o mini继承了GPT-4o同等严格的安全防护机制。其在预训练阶段过滤掉不良信息，进入训练后采用强化学习与人工反馈（RLHF）等技术，使模型行为更加符合安全策略。

作为首个应用OpenAI指令层次结构方法的模型，GPT-4o mini在API中展现出更强的防御能力，有效抵御越狱攻击、即时注入及系统即时提取等风险。

OpenAI将持续监控GPT-4o mini的使用情况，一旦发现新风险，立即采取措施提升模型安全性。

OpenAI在公告文末附上了9位团队负责人的名字，其中Shengjia Zhao、Hongyu Ren、Haitang Hu、Mianna Chen、Kevin Lu五位都是华人面孔，毕业学校涉及到了清华大学、北京大学、同济大学等国内知名高校。

03 .

结语：模型尺寸竞赛逆转价格战加剧

大模型价格战加剧。OpenAI的GPT-4o mini对比2022年功能相对初级的GPT-3的text-davinci-003模型，tokens成本已锐减99%，这是此前6月份产业价格战的高潮延续。

OpenAI的每一次发新都把压力给到同行。而就在同日，英伟达和法国明星AI独角兽Mistral也联合发布了名为Mistral NeMo的小杯模型，性能超过Llama 3 8B。更低成本、更高性能的小模型出现，将推动AI无缝融入更多日常场景，也让产业换一个角度思考AI落地。

本文来自微信公众号“智东西”（ID：zhidxcom），作者：李水青，36氪经授权发布。

今日，OpenAI杀死ChatGPT-3.5

推荐体验

相关资讯

Chatgpt-3.5 api 接入Q群思路

# ChatGPT-3.5 vs. ChatGPT-4：多方面比较

对标ChatGPT-3.5 周亚辉和「天工」做对了什么

性能超ChatGPT-3.5，专用金融分析的多模态大语言模型

百度文言一心可能是套皮的旧版ChatGPT-3.5

近期资讯

滁州市宏旺信息科技取得电池组健康监控装置专利，可根据不同电池组进行不同时段的健康监控

金寨国轩新能源取得可实时监控运行压力的电芯相关专利，使柔性传感器获取的压力数据更为准确

东莞锂威能源科技取得卷绕式电芯及电池专利，改善变形提升循环性能

蜂巢能源取得制片系统专利，提高制片效率和产品质量

深圳市新浦自动化设备有限公司取得一种电池化成层压板、化成夹具专利，助力电池化成技术

上海电气国轩取得电池液冷管路系统专利，解决异程管路系统流量分配一致性差的问题

天津新柯瑞科技取得圆柱电池测试用散热工装专利，保证电池测试结果

深圳市比克动力电池有限公司取得具有过载保护功能的电池专利，能确保电池是否过载输出电流

东莞锂威能源科技取得一种叠片电芯、电池及用电设备专利，能够提高叠片电芯的结构稳定性

湖南福德电气取得应用于储能模块的水冷散热回路专利，提高换热效率

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响