当前位置：首页|资讯|ChatGPT|GPT-4|Vicuna

第一个超越ChatGPT的开源模型来了？然而网友并不买账

作者：AI研习所发布时间：2023-07-05

ChatGPT GPT-4 Vicuna

开源模型真的可以超过 ChatGPT了吗？

大模型火了起来，每天我们都能看到各种「大」新闻。

今天，又来了个大新闻：新开源的一个大模型超越了 ChatGPT。
具体是什么呢？
OpenLLM 是一系列在极小、多样且高质量的多轮对话数据集上进行微调的开源语言模型。
这两日，作者们更新了该系列模型，并宣称：OpenChat 模型在 AlpacaEval 上获得 80.9% 的胜率；在 Vicuna GPT-4 评估上，性能达到 ChatGPT 的 105%！

也就是上面推特截图中，两位博主宣称的开源模型超越 ChatGPT/GPT-3.5。
OpenLLM 的特色是基于 LLaMA 开源模型，在只有 6,000 个 GPT4 对话的数据集上进行微调，从而达到非常好的效果。
此次更新的模型型号与评审结果如下：

· OpenChat：基于 LLaMA-13B，上下文长度为 2048。

· 在Vicuna GPT-4 评估中达到 ChatGPT 分数的 105.7% 。

· 在 AlpacaEval 上达到 80.9% 的胜率。

· OpenChat-8192：基于 LLaMA-13B，扩展上下文长度为 8192。

· 在 Vicuna GPT-4 评估中达到 ChatGPT 分数的 106.6% 。

· 在 AlpacaEval 上实现 79.5% 的胜率。

也就是说，两个模型在 Vicuna GPT-4 评估榜单上结果都超越了 ChatGPT。但这种评审 + 宣传的方式似乎并不被大家认可。
网友：夸张
在 Twitter 讨论中，有网友表明，这就是夸张的说法。

在此「大」新闻公布后，Vicuna 官方也迅速做出了回应。
实际上，Vicuna 的测试基准已被弃用，现在使用的是更高级的 MT-bench 基准。该基准的测试，有着更加具有挑战性的任务，并且解决了 gpt4 评估中的偏差以及限制。
在 MT-bench 上，OpenChat 性能表现与 wizardlm-13b 相似。也就是说，开源模型与 GPT-3.5 仍然有着一定差距。这也正是 MT-bench 所强调的内容 —— 开源模型不是完美无缺的，但是这将迈向更好的聊天机器人评估。

评估还表明，在任何给定的评估中，最佳模型的平均性能达到 ChatGPT 的 83%、GPT-4 的 68%，这表明需要进一步构建更好的基础模型和指令调优数据以缩小差距。

推荐体验

相关资讯

第一个超越ChatGPT的开源模型来了？网友并不买账

机器之心报道编辑：梓文开源模型真的超过 ChatGPT了吗？大模型火了起来，每天我们都能看到各种「大」新闻。今天，又来了个 Big News：新开源的一个大模型超越了 ChatGPT。

机器之心Pro 2023-07-03

一个AI怀疑论者的自白：我为什么对AI炒作不买账

第一次用ChatGPT时，我让它写一首关于冰球队华盛顿首都队(WashingtonCapitals)的诗，我故意提了这样一个愚蠢的要求，但希望能得到一个很聪明的回答，我以为这会把这个人工智能聊天机器人搞疯。ChatGPT发布几周后，一个朋友给我发短信说：“我完全上瘾了……刚刚给你发了一篇ChatGPT写的关于僵尸末日的总统演讲稿。”

ChatGPT 人工智能

财经杂志 2023-07-10

欧盟积极“推销”AI监管法案，亚洲国家却并不买账

据来自欧盟和亚洲的高级官员表示，欧盟正在游说亚洲国家效仿其在人工智能方面的做法，为科技公司制定新的规则，包括披露版权和标注由人工智能生成的内容。据悉，欧盟及其成员国已派遣官员与至少10个亚洲国家就人工智能的使…

巴比特资讯 2023-07-18

GPT-4得不到MIT学位，MIT研究团队回应“作弊”，但网友不买账

GPT-4得不到MIT学位，MIT研究团队回应“作弊”，但网友不买账机器之心报道编辑：蛋酱避重就轻的解释，还是没能获得大家的认可。几天前，一篇名为《Exploring the MI

机器之心 2023-06-25

重磅！第一个真正开源的大语言模型！超越LLaMA2！训练代码也公开

0. 这篇文章干了啥？ChatGPT等大语言模型在日常、科研、工作上的作用不必多说，但是大模型的训练代码一般是不公开的，只会开放专用接口或者推理代码。但最近OLMo开源了！这是一个最先进的、真正开放的语言模型和框架，完整提供训练数据、训练和评估代码、中间模型检查点和训练日志。对于训练和建模，OLMo包括完整的模型权重、训练代码、训练日志、切除信息、以Weights & Biases日志形式的训练指标以及推理代码。OLMo也是首次发布包括7B规模的语言模型的四个变体，对应不同的架构、优化器和训练硬件，以及一

大语言模型编程 ChatGPT

3D视觉工坊 2024-02-17

近期资讯

临床实验室管理软件：优化实验室运营的关键工具

一、临床实验室管理软件在实验室运营中的作用临床实验室管理软件是现代实验室不可或缺的工具，它负责样本编目、标本跟踪、数据存储和安全、设备集成维护以及结果报告等关键任务。通过自动化和集成化，LIMS显著提高了实验室的运营效率和准确性。1.样本分类与跟踪：LIMS能够立即记录患者信息并为样本分配唯一标识符，确保样本在检测过程中的精确跟踪。这种能力对于大型实验室来说尤为重要，因为它们每天需要处理大量样本。2.数据存储与安全：LIMS提供安全的数据存储解决方案，将测试结果存储在云端，消除了本地系统管理成本，并增强了

白码科技 2024-12-26

从第一台相机到行业巨头，佳能的百年摄影传奇！

说到相机品牌，很多人都会想到佳能。这家拥有百年历史的公司，不仅见证了摄影行业的变迁，还用一代代技术革新改变了摄影的玩法。在重庆摄影培训的课程中，我们常常推荐学员了解佳能的品牌故事，从中汲取摄影的灵感与热情！今天就和树莓教育一起，走进佳能的辉煌发展历程！佳能的起源：从零开始的梦想佳能的故事始于1933年，当时它还是一家默默无闻的小公司。1936年，佳能推出了第一台自主研发的相机Kwanon，这也是日本第一台35mm焦平面快门相机。这个名字源自观音菩萨，寓意守护与智慧，展现了佳能对摄影技术的追求和

重庆树莓教育 2024-12-26

低温静电喷雾干燥机技术助力多肽类超细粉体5微米的制备

随着科技的不断进步，传统的干燥技术已经无法满足现代工业对高效、节能、环保的要求。低温静电喷雾干燥机作为一种新型干燥设备，凭借其独特的工作原理和显著的优势，正在逐步改变各行业的生产方式，成为干燥技术领域的“黑马”。上海乔枫低温静电喷雾干燥技术低温静电喷雾干燥机的工作原理低温静电喷雾干燥机主要通过静电雾化技术来实现物料的干燥过程。在设备中，首先将物料通过喷雾装置分散成微细液滴，并在低温环境下进行加热。这些液滴在空气流的带动下迅速蒸发，水分被带走，得到干燥的超细粉体5微米以下粉末状产品。该设备的工作原理有别于传

喷雾干燥机-上海乔枫 2024-12-26

怎么把mp4转换成mp3？（视频转音频）收藏着这8款格式转换工具！

怎么把mp4转换成mp3？总所周知，视频mp4、音频mp3格式是非常流行的常见格式。将视频转化为音频，这一项需求的本质就是从录屏、视频、影视剧中提取出音频，将这些人声、背景音乐、乐器声进行二次创作，使得画面呈现更加艺术的效果。除了这些媒体人常常使用的场景外，制作手机铃声、自己录制的博客、短视频的配音素材等等，都经常需要将视频转换为音频，即mp4转mp3。今天小编为了解决这个问题，无损分享8款格式转换工具，帮助我们快速转换不同格式的视频，提取想要的音频mp3素材！怎么把mp4转换成mp3「手机端●如何将m

江右软件 2024-12-26

揭秘：全自动发盘机发餐盘规律一人一次仅发一张餐盘

自动发盘机，也称为智能取餐盘机或自助餐具发放机，是现代食堂和餐饮场所中采用的一项智能化技术。这种设备主要基于数字化、自动化和人工智能技术，旨在提升食堂管理效率和用餐者的体验。以下是自动发盘机的几个关键方面：利物乙自动发盘机，刷脸卡自动发餐盘，取代专人值守发餐盘核心功能与技术智能识别与发放：自动发盘机通过面部识别、IC卡或扫码支付等方式验证身份，随后自动发放餐盘，实现无接触取餐，提高卫生标准。数智化管理平台：与智能就餐管理系统集成，支持灵活的餐补规则设定、智能扣费、多场景消费支持（如线上订餐、外卖等

利物乙智能餐盘机 2024-12-26

利泰检测振动在线监测系统：提升设备维护效率与延长设备寿命

在现代工业中，设备的正常运行至关重要，而设备的故障往往会导致停机、生产中断和高昂的维修成本。为了有效避免这种情况，振动监测作为一种重要的预测性维护手段，得到了越来越广泛的应用。利泰检测振动在线监测系统是一种基于持续监测、实时数据上传和智能分析的创新技术，旨在帮助企业全天候监测设备运行状况，提前发现潜在问题，从而减少设备停机时间，延长设备使用寿命。 [图片] 1. 振动监测：设备健康的“诊断仪” 设备的振动数据是反映其运行状态的重要指标。过大的振动往往意味着设备内部存在问题，如轴承磨损、齿轮箱故障或不平衡等

利泰检测 2024-12-26

网络准入控制系统排名：热门 NAC 解决方案大对比

在网络安全日益受到关注的今天，网络准入控制（NAC, Network Access Control）已成为企业确保数据安全的关键工具。市面上的 NAC 系统种类繁多，各具特色，那么如何选择适合自己企业的方案呢？本文将为您深度解析八款国外热门 NAC 解决方案，助您找到最适合的选择。 [图片] 1. OneNAC 优势与特点：全面设备识别：支持 IoT 设备、BYOD、自带设备等多种终端的精准识别和管理。灵活的认证机制：提供 802.1X、MAC 地址、Web Portal 等多种认证方式，满足复杂接入

安在软件 2024-12-26

2025年上海虹口区专精特新中小企业认定申请条件及材料流程详解

近年来，上海虹口区大力推动专精特新中小企业的发展，鼓励创新、提升技术实力，致力于为更多优秀企业提供成长的沃土。而“专精特新”是指那些在某一行业中专注于技术创新、产品精细化、服务特色化、管理现代化的中小企业。对于符合条件的企业，获得“专精特新”认定，不仅能够提升企业的行业竞争力，还能够享受到政府在政策扶持、资金补贴等方面的巨大优惠。1.专精特新企业认定的意义“专精特新”企业，意味着企业具备了技术创新、市场前景以及核心竞争力。获得这一认定后，企业将会在人才引进、科技创新、市场拓展等方面获得政策倾斜。

湘应企服 2024-12-26

LIMS系统在现代实验室中的关键优势与选择策略

一、LIMS系统的主要优势LIMS系统是现代实验室不可或缺的工具，它集合了数据管理、流程优化和法规遵从性等多重优势。1.简化工作流程，提高生产力：LIMS系统通过提供从记录、存储、处理到即时检索的单一窗口患者数据管理，显著简化了实验室工作流程。这降低了对单独人员或资源的需求，从而大幅提升了生产力。2.操作自动化，减少错误：自动化数据存储和处理是LIMS系统的另一大优势。通过计算机笔划直接输入关键样本信息，如来源、日期、时间和收集地点，LIMS系统能够准确追踪样本，减少人为错误。3.确保法规遵从性：在医疗领

白码科技 2024-12-26

windows文件夹哪些可以删除？如何查找重复文件夹和空文件夹？一文了解

windows文件夹哪些可以删除？大家使用电脑过程中是不是跟我一样，常常疑惑电脑C盘空间为什么越来越小，随着电脑的时间时长增加，各种软件的安装、更新以及日常的文件操作，使得Windows文件夹变得愈发臃肿杂乱。到底哪些文件夹是可以安全删除的呢？与此同时，我们还常常会发现系统中存在着许多重复的文件夹以及空文件夹，进一步加剧了磁盘的混乱程度。那么，又该如何快速有效地查找并清理这些重复文件夹和空文件夹呢？接下来，我们通过具体的操作，告诉大家应该如何查找重复文件夹、空白文件夹以及哪些文件夹是可以删除的。 wind

江上科技 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1