不对齐，反而性能爆表？130亿模型碾压650亿，Hugging Face大模型排行榜发布

作者：新智元发布时间：2023-06-09

Hugging Face

不对齐，反而性能爆表？130亿模型碾压650亿，Hugging Face大模型排行榜发布

新智元报道

编辑：拉燕

【新智元导读】对齐or不对齐，That is a question.

我们知道，大多数模型都具有某种嵌入式对齐方式。

随便举几个例子：Alpaca、Vicuna、WizardLM、MPT-7B-Chat、Wizard-Vicuna、GPT4-X-Vicuna等等。

一般来说，对齐肯定是件好事。目的就是为了防止模型做坏事——比如生成一些违法违规的东西出来。

但是，对齐是怎么来的？

原因在于——这些模型使用ChatGPT生成的数据进行训练，而ChatGPT本身是由OpenAI的团队进行对齐的。

由于这个过程并不公开，因此我们并不知道OpenAI是如何进行的对齐。

但总体上，我们可以观察到ChatGPT符合美国主流文化，遵守美国法律，并带有一定不可避免的偏见。

按理来说，对齐是一件无可指摘的事。那是不是所有模型都应该对齐呢？

对齐？不一定是件好事

情况却没有这么简单。

最近，HuggingFace发布了个开源LLM的排行榜。

一眼就看到65B的模型干不过13B的未对齐模型。

从结果上看，Wizard-Vicuna-13B-Uncensored-HF可以和65B、40B和30B的LLMs直接在一系列基准测试上进行比较。

也许在性能与模型审查之间进行的权衡将成为一个有趣的研究领域。

这个排行榜也是在网络上引起了大范围的讨论。

有网友表示，对齐会影响模型的正常且正确的输出，这不是件好事，尤其是对AI的性能来说更是如此。

另一位网友也表示了认可。他表示，谷歌Brain也曾经揭示过模型的性能会出现下降，如果对齐的太过了的话。

对于一般的用途而言，OpenAI的对齐实际上非常好。

对于面向公众的AI来说，作为一种易于访问的网络服务运行，拒绝回答有争议和包含潜在危险的问题，无疑是一件好事。

那么不对齐是在什么情况下需要的呢？

首先，美国流行文化并不是唯一的文化，开源就是让人们进行选择的过程。

实现的唯一途径就是可组合的对齐。

换句话说，不存在一种一以贯之、亘古不变的对齐方式。

同时，对齐会干扰有效的例子，拿写小说打比方：小说中的一些人物可能是彻头彻尾的恶人，他们会做出很多不道德的行为。

但是，许多对齐的模型就会拒绝输出这些内容。

而作为每个用户所面对的AI模型都应该服务每个人的目的，做不同的事。

为什么在个人的电脑上运行的开源AI要在它回答每个用户提出的问题时自行决定输出内容呢？

这不是件小事，关乎所有权和控制权。如果用户问AI模型一个问题，用户就想要一个答案，他们不希望模型还要和自己展开一场合不合规的争论。

可组合的对齐

要构建可组合的对齐方式，必须从未对齐的指令模型开始。没有未对齐的基础，我们就无法在其上对齐。

首先，我们必须从技术上理解模型对齐的原因。

开源AI模型是从LLaMA、GPT-Neo-X、MPT-7b、Pythia等基础模型训练而来的。然后使用指令数据集对基础模型进行微调，目的是教它变得有帮助、服从用户、回答问题和参与对话。

该指令数据集通常是通过询问ChatGPT的API获得的。ChatGPT内置了对齐功能。

所以ChatGPT会拒绝回答一些问题，或者输出带有偏见的回答。因此，ChatGPT的对齐被传递给了其它开源模型，就像大哥教小弟一样。

原因在于——指令数据集是由问题和答案组成的，当数据集包含含糊不清的答案时，AI就会学习如何拒绝，在什么情况下拒绝，以及如何拒绝，表示拒绝。

换句话说，它在学习对齐。

而取消审查模型的策略非常简单，那就是识别并删除尽可能多的否定和有偏见的答案，并保留其余部分。

然后以与训练原始模型完全相同的方式使用过滤后的数据集训练模型。

接下来研究人员只讨论WizardLM，而Vicuna和任何其他模型的操作过程都是相同的。

由于已经完成了取消审查 Vicuna 的工作，我能够重写他们的脚本，以便它可以在WizardLM 数据集上运行。

下一步是在 WizardLM 数据集上运行脚本以生成 ehartford / WizardLM_alpaca_evol_instruct_70k_unfiltered

现在，用户有了数据集，在从Azure获得一个4x A100 80gb节点，Standard_NC96ads_A100_v4。

用户需要至少1TB的存储空间（为了安全起见最好是2TB）。

咱可不想跑了20个小时却用完了存储空间。

建议将存储挂载在/workspace。安装anaconda和git-lfs。然后用户就可以设置工作区了。

再下载创建的数据集和基础模型——llama-7b。

现在可以按照程序微调WizardLM了。

现在，进入这个环境，用户需要下载WizardLM的微调代码。

博主进行了以下更改，因为在微调期间，模型的性能会变得非常慢，并且发现它在CPU和GPU之间在来回切换。

在他删除了以下几行之后，运行过程变得好多了。（当然也可以不删）

删除以下行

博主建议用户可以在wandb.ai上创建一个帐户，以便轻松地跟踪运行情况。

创建帐户后，从设置中复制密钥，即可进行设置。

现在是时候进行运行了！

然后以较低的save_steps运行训练命令。

之后，再次执行整个过程，将checkpoint更改为train_freeform.py最新的checkpoint，并再次以减少的save_steps运行，直到最后以save_steps 1运行它。

成功后，模型位于最后一个检查点。

现在就可以对模型进行测试了。

编辑文件Input.jsonl

向其中添加一些内容，比如：

然后再运行推理：

从结果上看，Wizard-Vicuna-13B-Uncensored-HF可以和65B、40B和30B的LLMs直接在一系列基准测试上进行比较。

也许在性能与模型审查之间进行的权衡将成为一个有趣的研究领域。

参考资料：

https://erichartford.com/uncensored-models

相关资讯

将人工分析大语言模型性能排行榜引入 Hugging Face[译]

构建大语言模型的应用时，除了质量外，速度和成本也是不可或缺的考量因素。对于消费者应用和聊天体验而言，快速响应是吸引用户参与的关键。

大语言模型 Hugging Face

优弧 2024-05-07

Hugging News #0602: Transformers Agents 介绍、大语言模型排行榜发布！

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」，本期 Hugging News 有哪些有趣的消息，快来看看吧！重磅更新Transformers Agents 发布，通过自然语言控制超过十多万个 HF 模型！近期，我们发布了一个非常“大胆”的新特性: Transformers Agents，并加入到了 Transformers 4.29 之后的版本中

大语言模型 Hugging Face

HuggingFace 2023-06-03

波士顿大学“鸭嘴兽-70B”登顶Hugging Face大模型排行榜

波士顿大学“鸭嘴兽-70B”登顶Hugging Face大模型排行榜新智元报道编辑：Lumina 润【新智元导读】鸭嘴兽 70B登上Hugging Face上的开源大模型榜一，变

Hugging Face

新智元 2023-08-19

碾压LLaMA，「猎鹰」彻底开源！400亿参数，万亿token训练，霸榜Hugging Face

大模型时代，什么最重要？ LeCun曾经给出的答案是：开源。当Meta的LLaMA的代码在GitHub上被泄露时，全球的开发者们都可以访问这个第一个达到GPT水平的LLM。接下来，各种各样的LLM

LLaMA Hugging Face GitHub 编程

新智元 2023-06-05

2024 AIGC每日新闻|6月27日-Hugging Face升级LLM排行榜

?【AIGC每日新闻】【Hugging Face升级LLM排行榜，提升语言模型评估】Hugging Face最近对其开放LLM排行榜进行了升级，增加了新的基准测试和评估方法，以应对大型语言模型（LLM）性能提升的停滞问题。此次升级包括六个更具挑战性的基准测试，初步排名显示Qwen2-72B-Instruct位居榜首，其次是Meta的Llama-3-70B-Instruct和Mixtral 8×22b。新增的标准化评分系统可以更公平地比较不同的评估类型。此外，还引入了“维护者亮点”类别和社区投票系统，以优

AIGC Hugging Face 大语言模型 LLaMA

二次元的Datawhale 2024-06-27

近期资讯

权限系统探索-权限模型、策略、ReBAC

最近老板让我实现一个可以统一全部业务的权限系统，说实话，一开始我自信满满。但是不断深入研究后，心里就开始慌了，尤其是带入一个业务系统的实际需求，以及构建一个可拓展的一致且准确的授权系统时，就会发

Sincerelyplz 2024-12-30

宝塔mysql设置可以远程访问

MySQL中远程访问root用户的配置方法在MySQL数据库管理中，有时我们需要从远程机器上访问数据库，特别是当进行数据库迁移、远程调试或管理时。默认情况下，MySQL的root用户可能只允许从本地

java码农耕地人 2024-12-30

面试官：MySQL InnoDB事务中的ACID特性是如何实现的？

不得不说，现在的面试还是比几年前卷了很多的。以前的面试官大概率只会问，“说下 MySQL InnoDB 事务中的 ACID 特性各是什么”仅此而已了，根本不会涉及到什么底层实现。

托尼学长 2024-12-30

终于有人把 AQS 说清楚了！万字详解

一、AQS 是啥？有啥用？一、AQS 是啥？有啥用？在 Java 并发编程的世界里，AbstractQueuedSynchronizer（简称 AQS）绝对是个 “狠角色”

J2K 2024-12-30

MySQL数据库|事务的隔离级别

读未提交（Read Uncommitted）、读已提交（Read Committed）、可重复读（Repeatable Read）和串行化（Serializable）。

张子栋 2024-12-30

掉鱼的猫 2024-12-30

时序数据库InfluxDB

一时序数据库概述时序数据库（Time Series Database, TSD）是一种专门设计用于存储、索引和检索时间序列数据的数据库。时间序列数据是指带有时间戳的数据，通常用于记

我住戈壁我姓王 2024-12-30

不对齐，反而性能爆表？130亿模型碾压650亿，Hugging Face大模型排行榜发布

不对齐，反而性能爆表？130亿模型碾压650亿，Hugging Face大模型排行榜发布

推荐体验

相关资讯

将人工分析大语言模型性能排行榜引入 Hugging Face[译]

Hugging News #0602: Transformers Agents 介绍、大语言模型排行榜发布！

波士顿大学“鸭嘴兽-70B”登顶Hugging Face大模型排行榜

碾压LLaMA，「猎鹰」彻底开源！400亿参数，万亿token训练，霸榜Hugging Face

2024 AIGC每日新闻|6月27日-Hugging Face升级LLM排行榜

近期资讯

权限系统探索-权限模型、策略、ReBAC

宝塔mysql设置可以远程访问

面试官：MySQL InnoDB事务中的ACID特性是如何实现的？

终于有人把 AQS 说清楚了！万字详解

MySQL数据库|事务的隔离级别

Java Map的理解

深入探究微服务架构与分布式系统关键技术

神器！AI免费无限换脸！最新汉化版整合包

使用 httputils + sbe (Simple Binary Encoding) 实现金融级 java rpc

时序数据库InfluxDB

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响