Claude 3超GPT-4竞技场登顶！小杯版成开发者新宠：性价比无敌

作者：量子位发布时间：2024-03-27

Claude GPT-4

Claude 3超GPT-4竞技场登顶！小杯版成开发者新宠：性价比无敌

鱼羊发自凹非寺

量子位 | 公众号 QbitAI

GPT-4真的被反超了！

大模型竞技场上，Claude 3大杯Opus新王登基，Elo分数来到榜首。

连小杯Haiku也跻身第二梯队，超过了GPT-4-0613这个型号，把GPT-3.5-turbo远远甩在身后。

Haiku的输入token价格，可是比GPT-3.5-turbo还便宜了一半，输出方面，每100万token也比GPT-3.5-turbo便宜近2块钱。

跟GPT-4相比，价格更是只有1/20。并且Haiku同样支持200k上下文。

难怪有开发者直言：

GPT-3.5在Claude Haiku面前不堪一击。

不仅仅是价格更便宜，Haiku还更上一层楼了。

而在Claude 3加入竞技之前，GPT-4家族已经霸榜快一年了。

给新来的朋友补充一下背景知识：大模型竞技场榜单（LMSYS Chatbot Arena Leaderboard）的评分标准是人类打分，同一个问题同时抛给A、B两个模型，人类裁判觉得哪个回答得好就给哪个投票。

小杯Haiku成开发者新宠

值得一提的是，在竞技场官方贺电中，Haiku这个型号也被专门高亮了出来：

根据我们的用户偏好，Claude 3 Haiku达到了GPT-4级别。

其速度、功能和上下文长度在目前的市场上是独一份的。

具体有多快，已经有网友做了个直观的对比：

博尔特还没跑完100米，Haiku已经读完100k token的文档了……

事实上，凭借其超高的性价比，在开发者社群中，Claude 3小杯Haiku确已成新宠。

已经有人第一时间大开脑洞，搞出了能让Haiku效果“超频”到大杯Opus水准的开源项目，吸引不少关注。

简单来说，就是让Opus给Haiku当老师：

先用Opus生成执行任务的范例，再用这些教学案例来提高Haiku的姿势水平。

划重点：Haiku的价格仅为Opus的1/60，而响应速度则是Opus的10倍。

这个名为gpt-prompt-engineer的项目目前在GitHub上累计揽下7.3k标星。

还是这位马特老哥，还用Opus和Haiku搞了个“AI股票分析师”，直接火上了GitHub热榜。

不少应用产品也在第一时间接入了Haiku。比如能依据Prompt自动生成网站UI的Vercel。

△就说快不快吧

不过，就在一片给Claude 3新王点赞的声音中，也有网友认为：

GPT-3.5作为一个“老”模型，至今仍在与最新的模型竞争，这件事本身就很疯狂了。

但最让开发者们期待的当然还是：

OpenAI，快起来卷（doge）。

— 完 —

近期资讯

降噪耳机不建议乱买，几乎零差评的“四”款降噪耳机深度评选解析

随着生活节奏愈发快速,噪音污染已然成为不可忽视的一大问题。而对于许多追求安静、高品质音乐体验的用户来说,一款出色的主动降噪耳机显得尤为重要。但在市面上百花争艳的降噪耳机中,哪一款才是真正值得下手的佼佼者呢?本文将为大家深度解析四款备受好评的顶级降噪耳机,包括览邦LairPods Pro+、Bose QuietComfort 、华为 FreeBuds Pro 4 悦彰耳机、森海塞尔MOMENTUM真无线4代蓝牙耳机。从降噪性能、音质表现、功能特色等多方面对这些旗舰级产品进行全面评测,帮助您选择真正适合自己的

江诗一墨 2024-12-26

gygfth 2024-12-26

岛津GC-2014C入口压力波动

入口压力值处于95-105之间，频繁跳动，导致色谱没办法稳定压力达到进样条件。 [图片] 这种小压力变化基本能确定是由于气体管路中的轻微漏气或者堵塞导致电磁阀无法稳定的控制压力值。进样口入口通常只有惰性载气（TCD也可能使用氢气或者其他气体，排除思路是相通的）。 [图片] 可以用手堵住红色位置，波动加剧。首先可以排查圈蓝色的这个分流收集管（我不知道应该咋叫），一般使用时间过长，这里都会有焦油状的废物，可以拆下来用石油醚等溶剂清洗，或者豪横点可以直接更换，如果没有解决可以排查衬管与分流口看看是不是堵上了。

bili_64004414547 2024-12-26

2025高考政治核心必背知识点!学霸都在背的提分秘籍！！！

给大家整理全了高中政治核心必背知识点，高中政治每一本书都是有自己的核心知识点的，大家把这些核心知识点背熟，再围绕着这些知识点向外延展，会好背很多~ [图片] [图片] [图片] [图片] [图片] [图片]

UU学姐带你上岸 2024-12-26

中科致研动画制作公司：以专业实力，打造高品质二维动画

在当今数字化内容蓬勃发展的时代，二维动画以其独特的艺术魅力和广泛的应用价值，成为了众多领域传递信息、讲述故事、塑造品牌的有力工具。中科致研动画制作公司所提供的二维动画制作服务，更是为各种创意和想法注入了鲜活的生命力，使其能够以极具吸引力的形式呈现在观众眼前。一支专业的二维动画制作团队是确保服务质量的基石。这些团队通常由经验丰富的编剧、才华横溢的设计师、技艺精湛的动画师以及专业的后期制作人员等组成。编剧负责构思富有创意和吸引力的故事脚本，将客户的需求和核心信息巧妙地融入到故事情节中，使动画具有清晰的逻辑和引

中科致研 2024-12-26

Abaqus 与 Ansys不知道选哪个？快速了解二者优势

Abaqus 和 ANSYS 都是用于有限元分析 (FEA) 和计算机辅助工程 (CAE) 的软件包。这两个软件包都用于分析和模拟工程结构和机械部件在各种负载条件下的行为。 Abaqus 和 ANSYS 之间有几个区别：开发和所有权：Abaqus 由 Dassault Systèmes SIMULIA Corp. 开发和销售，而 ANSYS 由 ANSYS, Inc. 开发和销售。可用性：Abaqus 可作为独立软件包使用，也是 SIMULIA 产品套件的一部分。ANSYS 可作为独立软件包和 ANS

SOLIDWORKS硕迪科技 2024-12-26

Claude 3超GPT-4竞技场登顶！小杯版成开发者新宠：性价比无敌

Claude 3超GPT-4竞技场登顶！小杯版成开发者新宠：性价比无敌

推荐体验

相关资讯

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

GPT-4王冠没掉！Claude 3竞技场人类投票成绩出炉：仅居第三

GPT-4-turbo还是第一！Claude 3竞技场人类投票成绩出炉：仅居第三

OpenAI曾秘密测试GPT-4o，登顶聊天机器人竞技场排行榜

开源模型打败 GPT-4：LLM 竞技场最新战报，Cohere Command R + 上线

近期资讯

降噪耳机不建议乱买，几乎零差评的“四”款降噪耳机深度评选解析

【新疆无人机培训】低空经济崛起：城市与区域Vertiports的设计与挑战

2025.01.06-10 | 年前最后一场 | 华东 | Moldflow系统

美国AlphaLab 三轴DC高斯计设计用于快速识别和测量磁化区域

【新疆无人机培训】从飞行控制到数据分析：低空软件信息服务全景解读

高考政治22个时政热点压题（可打印）

岛津GC-2014C入口压力波动

2025高考政治核心必背知识点!学霸都在背的提分秘籍！！！

中科致研动画制作公司：以专业实力，打造高品质二维动画

Abaqus 与 Ansys不知道选哪个？快速了解二者优势

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响