当前位置：首页|资讯|OpenAI

OpenAI曾秘密测试GPT-4o，登顶聊天机器人竞技场排行榜

作者：IT之家发布时间：2024-05-14

IT之家 5 月 14 日消息，OpenAI 员工 William Fedus 周一在社交平台 X 证实，近期在 LMSYS 聊天机器人竞技场 (Chatbot Arena) 上表现优异的神秘聊天机器人“gpt-chatbot”，正是他们刚刚发布的全新人工智能模型 GPT-4o。Fedus 还透露，GPT-4o 在测试中登顶了竞技场排行榜，取得了有史以来的最高分。

“GPT-4o 是我们最先进的尖端模型，”Fedus 在推特上写道，“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”

聊天机器人竞技场是一个网站，访客可以同时与两个随机的 AI 语言模型对话，却不知道哪个是哪个，然后选择提供更好回复的模型。

从今年 4 月份开始，OpenAI 在竞技场测试了多个版本的 GPT-4o，该模型最初以“gpt2-chatbot” 的名称出现，然后变成了“im-a-good-gpt2-chatbot”，最后是“im-also-a-good-gpt2-chatbot”。

自 GPT-4o 今日发布以来，多方消息人士透露，该模型以巨大优势登顶了 LMSYS 的内部排行榜，超越了之前排名最高的模型 Claude 3 Opus 和 GPT-4 Turbo。

lmsys.org的官方账号分享了一张图表，并写道：“‘gpt2-chatbot’系列模型刚刚飙升至榜首，以显著的优势（约 50 Elo）超越了所有其他模型，它已经成为竞技场中最强大的模型。这是一张内部截图，公开版本的‘gpt-4o’现已进入竞技场，并很快将出现在公开排行榜上！”

截至IT之家发稿时，“im-also-a-good-gpt2-chatbot” 的 Elo 分数为 1309，领先于 GPT-4-Turbo-2023-04-09 的 1253 分和 Claude 3 Opus 的 1246 分。在三个“gpt2-chatbot” 出现并搅局之前，Claude 3 和 GPT-4 Turbo 一直在排行榜上争夺冠军。

推荐体验

相关资讯

GPT-4o mini凭什么登顶竞技场？OpenAI刷分秘诀被扒，原来奥特曼早有暗示

“成为更讨人喜欢的模型”

OpenAI 阿尔特曼

量子位 2024-07-29

Chatbot Arena (聊天机器人竞技场) (含英文原文)：使用 Elo 评级对LLM进行基准测试 -

内容使用“gpt-3.5-turbo” 分小节进行摘要说明：1：微软2023年Build大会来自OpenAI的研究员和创始成员Andrej Karpathy的一个主题为State of GPT的演讲中，介绍大语言模型的能力排名时用了本文项目中的Leaderboard，有关注价值。后续我们将每周更新追踪。 2: 文章使用''gpt-3.5-turbo''进行摘要测试。3: by: Lianmin Zheng*, Ying Sheng*, Wei-Lin Chiang, Hao Zhang, Joseph

微软 OpenAI 大语言模型

贝叶斯派对 2023-06-07

GPT-4o迷你版竞技登顶秘诀曝光奥特曼曾预示线索

这一结果起初让许多网友感到难以置信，怀疑lmsys是否受到了来自OpenAI的影响。GPT-4omini在与Claude3.5Sonnet的较量中主要凭借三点优势取胜：更少的拒绝回答、更详细的解答以及更为清晰…

阿尔特曼 OpenAI Claude3

Jm传媒 2024-08-03

2024 AIGC每日新闻|7月16日-LMSYS聊天机器人竞技场现神秘新模型

?【AIGC每日新闻】【LMSYS聊天机器人竞技场现神秘新模型或预示小型GPT即将发布】在LMSYS聊天机器人竞技场的“战斗”板块中，三款神秘的新模型“upcoming-gpt-mini”、“column-u”和“column-r”悄然现身，用户可以通过投票评估这些匿名模型的输出表现。其中，“upcoming-gpt-mini”自称是ChatGPT，并列出OpenAI为其创建者，而另外两个模型则未透露任何身份信息。此前，OpenAI在LMSYS测试了未发布的模型，而现在的这次出现可能预示着一个新的小型

AIGC ChatGPT OpenAI

二次元的Datawhale 2024-07-16

通义千问登顶HuggingFace排行榜

通义千问登顶HuggingFace排行榜潮新闻客户端记者张云山全球最大的开源大模型社区HuggingFace日前公布了最新的开源大模型排行榜，阿里云通义千问力压Llama2等国内外开源大模型

通义千问 Hugging Face

钱江晚报 2023-12-10

近期资讯

消息称 SK 海力士加速准备 16Hi HBM3E 量产，已启动全面生产测试

IT之家12月25日消息，韩媒ETNews表示，SK海力士已加速展开其全球首创的16Hi（IT之家注：即16层堆叠）HBM3E内存的量产准备工作，全面生产测试现已启动，为明年初的出样乃至2025上半年的大规模量产与供应打下基础。

IT之家 2024-12-25

快科技2024年度评奖：主板篇

2024年下半年几乎在同一时间，AMD与Intel不约而同地发布了新一代处理器，当然都有配套新主板。AMD这边采用Zen5构架的锐龙9000系列处理带来了前所未有的游戏性能，特别是锐龙79800X3D领先对手2个时代，而配套的X870E主板可以搭配更高频率的内存，高端型号标配了USB4接口和Wi-Fi7无线网卡。

驱动之家 2024-12-25

快科技2024年度评奖：笔记本电脑篇

在这个科技日新月异的时代，信息技术如同江河之水奔腾不息，持续地推动着人类社会的进步与发展。从轻薄便携的商务本到性能卓越的游戏本，从简约时尚的设计到智能便捷的交互体验，每一款笔记本都承载着品牌对技术创新的执着追求和对用户需求的深刻理解。

驱动之家 2024-12-25

华为音频年货节教你挑选一款最适合自己的华为耳机

【CNMO科技消息】最近想入手TWS耳机的同学有福利了，随着新年将至，华为音频也开启了年货节活动，多款华为音频产品开启了不同力度的促销活动。今天我们将根据预算来推荐最值得入手的华为耳机产品，或许可以帮助大家在新年聆听到更美妙的声音。预算在1000元+，三款产品非常值得推荐，不同的产品形态可以满足你的不同需求，快来看看吧。

手机中国 2024-12-25

九江天赐取得一种电解液的连续化生产系统专利，可降低电解液生产的整体生产时长

金融界2024年12月25日消息，国家知识产权局信息显示，九江天赐高新材料有限公司取得一项名为“一种电解液的连续化生产系统”的专利，授权公告号CN222196739U，申请日期为2024年4月。

金融界 2024-12-25

投影仪连接方式详解：HDMI、VGA与无线连接的使用指南

在现代生活中，投影仪已经成为了一个非常实用的工具。无论是在家庭影院、会议室，还是在学校的课堂上，投影仪都能帮助我们更好地展示内容。可是，很多人对于投影仪的连接方式并不是很清楚。今天，我们就来聊聊投影仪怎么连接，帮助你轻松搞定这个问题。首先，投影仪的连接方式有很多种，最常见的包括HDMI、VGA、无线连接等。

新报观察 2024-12-25

半导体存储新高度，longsys江波龙引领品牌企业创新

在日新月异的科技浪潮中，半导体存储技术作为信息技术的基石，正以前所未有的速度推动着全球数字化进程。而在这一波澜壮阔的半导体存储领域，江波龙作为半导体存储品牌企业的杰出代表，正以卓越的产品性能、灵活的存储定制服务以及不断突破的高端存储技术，引领着行业的新风尚。

中国财富网 2024-12-25

三部门：鼓励企业探索智能研发新应用开发“人工智能+”研发设计软件

其中提出，引导企业开展云端研发设计，按需订阅产品设计、仿真模拟等软件服务，提升产品仿真效率，降低软件运维成本。鼓励企业探索智能研发新应用，开发“人工智能+”研发设计软件，构建设计模型、仿真模型等数据集，开展模型训练，发展创成式设计、实时仿真等创新应用，加速新产品研发。

每日经济新闻 2024-12-25

家电新选择，海尔滚筒洗衣机EG100MATE29S：补贴下的性价比之王

海尔滚筒洗衣机以其高洗净比、节能效果以及智能化特点，赢得了消费者的一致好评。特别是在高端滚筒洗衣机市场，海尔凭借其深厚的技术积累和对用户需求的精准把握，持续推出符合现代家庭需求的优质产品，如EG100MATE29S，不仅在洗净效果上表现出色，更在能效和智能技术上引领潮流。

小米地瓜 2024-12-25

影视飓风2024年度相机颁奖：iPhone 16 Pro Max获最佳手机视频

快科技12月25日消息，B站千万粉UP主“影视飓风”公布了2024年度相机颁奖。其中“最佳手机视频”的桂冠颁给了苹果iPhone16ProMax。影视飓风表示，之所以颁给iPhone16ProMax，核心原因在于它的AppleLog，主摄支持4K/120帧，这是其他手机没有的。

快科技 2024-12-25

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1