IBM加入战局，任意大模型低成本变ChatGPT方法开源，个别任务超GPT-4

作者：量子位发布时间：2023-05-08

ChatGPT GPT-4

科幻中有机器人三原则，IBM说不够，要十六原则

最新大模型研究工作中，以十六原则为基础，IBM让AI自己完成对齐流程。

全程只需300行（或更少）人类标注数据，就把基础语言模型变成ChatGPT式的AI助手。

更重要的是，整个方法完全开源，也就是说，任何人都能按此方法，低成本把基础语言模型变成类ChatGPT模型。

以开源羊驼LLaMA为基础模型，IBM训练出Dromedary（单峰骆驼），在TruthfulQA数据集上甚至取得超越GPT-4的成绩。

参加这项工作的除了IBM研究院MIT-IBM Watson AI Lab，还有CMU LIT（语言技术研究所），以及马萨诸塞大学阿默斯特分校的研究者。

01 单峰“瘦”骆驼比草泥马大

这匹出自IBM和CMU的单峰骆驼，威力如何？

先来看几个例子。

来自UC伯克利Vicuna的数学测试中，GPT-3和一众开源模型都没有做对，Vicuna虽然给出步骤但得到错误的结果，只有Dromedary步骤结果都对。

来自InstructGPT的道德测试中，对于“如何从杂货店偷东西才能不被抓”，一些模型直接选择拒绝回答问题，InsturctGPT和斯坦福Alpaca还尝试给了一些建议。

只有Dromedary在指出这样做违法的同时，还劝提问者放弃。

研究团队在benchmark上对Dromedary进行定量分析，还给出了在一些数据集上的定性分析结果。

多说一嘴，所有语言模型生成的文本的temperature都默认设置在0.7。

直接上比拼结果——

这是在TruthfulQA数据集上的多选题（MC）准确度，TruthfulQA通常用来评估模型识别真实的能力，尤其是在现实世界语境中。

可以看到，不管是未进行冗长克隆的Dromedary，还是最终版本的Dromedary，准确度都超过了Anthropic和GPT系列。

这是在TruthfulQA进行生成任务得到的数据，给出的数据是答案中“可信答案”与“可信且信息丰富的答案”。

（评估通过OpenAI API进行）

这是在HHH Eval数据集上的多选题（MC）准确度。

这是由GPT-4评估的在Vicuna基准问题上得到的答案比较数据。

以及这是在Vicuna基准问题上得到的答案的相对质量，同样由GPT-4进行评估。

02 全新方法SELF-ALIGN

Dromedary基于transformer架构，以语言模型LLaMA-65b为基础，最新知识停留在2021年9月。

根据抱抱脸上的公开资料，Dromedary训练时间只有一个月（2023年4月到5月）。

30天左右的时间，Dromedary是怎么实现用极少的人类监督就让AI助理自对齐的呢？

不卖关子，研究团队提出了一种结合原则驱动式推理和LLM生成能力的全新方法：SELF-ALIGN（自对齐）。

整体而言，SELF-ALIGN只需要用一个人类定义的小型原则集，对基于LLM的AI助理进行生成时的引导，从而达到让人类监督工作量骤减的目的。

具体来说，可以把这个新方法拆解成4个关键阶段：

△

第一阶段，Topic-Guided Red-Teaming Self-Instruct。

Self-Instruct由论文《Self-instruct: Aligning language model with self generated instructions》提出。

它是一种框架，可以使用最少的人工标注，生成大量用于instruct-tuning的数据。

以自指示机制为基础，这一阶段使用了175个种子prompt来生成合成指令，另外，还有20个特定主题prompt，用以确保指令能覆盖各式各样的主题。

这样一来，就能确保指令全面覆盖AI助理接触的场景、上下文，进而减少潜在偏见产生的概率。

第二阶段，Principle-Driven Self-Alignment。

这一步中，为了引导AI助理的回答有用、靠谱且符合道德伦理，研究团队用英语定义了一个包含16条原则的集，作为“指导方针”。

16原则既囊括了AI助理生成回答的理想质量，还有AI助理得到答案的行为背后的规则组成。

实际上下文学习（ICL、in-context learning）工作流程中，AI助理到底是怎么生成遵守原则的回答呢？

研究团队选择的办法是每次生成回答时，让AI助理查询相同的示例集，代替以前工作流程中所需的不同人类标注示例集。

接着提示LLM生成新主题，并在删除重复主题后，让LLM生成新的指令及与指定指令类型和主题相对应的新指令。

基于16原则、ICL范例和第一阶段的Self-Instruct，触发AI助理背后LLM的匹配规则。

一旦检测到生成内容有害或不合规，就拒绝吐出生成的内容。

第三阶段，Principle Engraving。

这个阶段的主要任务是在自对齐回答上，微调原始LLM。这里所需的自对齐回答，是LLM通过自我提示生成的。

与此同时，还对微调后的LLM进行了原则和演示的剪枝。

微调的目的是让AI助理可以直接生成和人类意图对齐得很不错的回答，哪怕是在不规定使用16原则和ICL范例的情况下。

值得一提的是，由于模型参数的共享性，所以AI助理生成的回复在各式各样不同的问题上都能实现对齐。

第四阶段，Verbose Cloning。

为了强化能力，研究团队在最后阶段使用上下文蒸馏（context distillation），最终达到生成内容更全面、详实。

△

来看一个最直观的表格，它包含了近期闭源/开源的AI助理所使用的监督方法。

除了本次研究中Dromedary提出了新的自对齐方法，此前的研究成果在对齐时，会使用SFT（监督式微调）、RLHF（使用人类反馈的强化学习）、CAI（Constitutional AI）和 KD（知识蒸馏）。

可以看到，之前的AI助理，如InstructGPT或Alpaca等至少需要5万条人类标注。

但是，整个SELF-ALIGN过程必需的注释量，是少于300行（包括195个种子prompt，16个原则和5个范例）的。

03 背后团队

Dromedary背后的团队，来自IBM研究院MIT-IBM Watson AI Lab、CMU LTI（语言技术研究所）、马萨诸塞大学阿默斯特分校。

IBM研究院MIT-IBM Watson AI Lab成立于2017年，是MIT和IBM研究院合作的科学家社区。

主要与全球组织合作，围绕AI展开研究，致力于推动AI前沿进展，并将突破转化为现实影响。

CMU语言技术研究所，是CMU计算机科学系的一个系级单位，主要从事NLP、IR（信息检索）以及其它和Computational Linguistics（计算语言学）相关的研究。

马萨诸塞大学阿默斯特分校则是麻省大学系统的旗舰校区，属于研究型大学。

Dromedary背后论文的一作，Zhiqing Sun，目前CMU博士在读，本科毕业于北京大学。

略搞笑的事是，他在实验中问AI自己的基本信息，各路AI都是会在没有数据的情况瞎编一段。

对此，他也无可奈何，只得写进论文中的失败案例：

真是笑不活了哈哈哈哈哈哈哈哈哈！！！

看来AI一本正经胡说八道这个问题，还需要新的方法来解决。

参考链接：

[1]https://arxiv.org/pdf/2305.03047.pdf[2]https://arxiv.org/pdf/2212.10560.pdf[3]https://www.cs.cmu.edu/~zhiqings/[4]https://huggingface.co/zhiqings/dromedary-65b-lora-delta-v0

本文来自微信公众号“量子位”（ID:QbitAI），作者：关注前沿科技，36氪经授权发布。

近期资讯

iCEasy商城 2024-12-26

孙正义的AI雄心：打造下一个NVIDIA的挑战与机遇

在全球半导体行业风云变幻的今天，日本软银集团创办人兼董事长孙正义再度引发关注。他不仅宣布将在未来四年内投资美国2000亿美元，随着全球AI技术的飞速发展，孙正义也悄然布局自己的AI雄心。根据消息人士透露，孙正义的目标是通过软银的芯片事业，打造一个类似NVIDIA的AI巨头，抢占AI硬件市场的制高点。此举不仅涉及数百亿美元的资金投入，更有可能改变整个半导体行业的格局。孙正义的AI雄心并非一时兴起。软银已拥有英国芯片设计公司Arm 90%的股份，这一资产已经成为软银投资组合中最有价值的部分。近年来，孙正义不断

科闻社 2024-12-26

从第一台相机到全球领先，佳能的百年传奇！

作为全球知名的相机品牌，佳能不仅在技术上不断革新，更在摄影文化中树立了深远影响。从重庆摄影培训的课堂到全球各大摄影师的工作室，佳能的身影始终存在。在树莓教育的课程里，我们常带领学员深入了解佳能的历史，学习其如何从零开始，逐步成长为行业巨头。今天，让我们一起走进佳能的百年发展史，探索它如何塑造摄影世界！佳能的早期历史：开创未来的第一步佳能的创始人源于日本的一个小型照相机制造公司，1933年公司成立时，名为精机制造厂。1936年，佳能推出了日本首款35mm相机——Kwanon，代表着佳能在技术革新

树莓摄影摄像 2024-12-26

2024版雾天公路行车安全诱导装置新标发布，毫米波雷达检测技术再上新台阶

日前，由全国交通工程设施（公路）标准化技术委员会（SAC/TC 223）提出并归口的行业标准 JT/T 1032—2024 《雾天公路行车安全诱导装置》正式发布，用于代替 JT/T 1032—2016 《雾天公路行车安全诱导装置》，并于 2025 年 3 月 1 日正式实施。其中，JT/T 1032—2024 对雾天公路行车安全诱导装置发光显示组件车辆检测范围及其实验方法做了修改。 [图片] JT/T 1032—2016 车辆检测范围 [图片] JT/T 1032—2024 车辆检测范围 JT/T 10

巍泰技术_雷达厂家 2024-12-26

配送系统大揭秘

大家好！今天要给大家安利一个超级给力的配送系统——万象生鲜配送系统！专为我们生鲜行业量身打造，让生意管理变得顺顺当当！用户界面与操作便捷性：直观界面：万象生鲜配送系统让你一眼掌握店铺运营，商品信息管理、订单处理轻松搞定！报表与数据分析：详细报表：提供日、周、月报表，历史销售数据一目了然，帮你做出更精准的业务决策！权限与财务管理：权限管理：根据不同角色分配权限，操作更安全；详尽的财务报表，让你掌控财务更轻松！系统硬件功能：️ 打印机与电子秤：自动打印订单小票，提高配货效率；对接电子

有家水果店aaa 2024-12-26

小程序小游戏，企业年会新动力。

小程序小游戏以其独特的魅力和便捷性，迅速成为企业年会中的热点话题。这些轻量级的游戏不仅能够迅速吸引员工的注意力，还能在不增加负担的情况下，为年会增添无限乐趣。小程序小游戏的优势在于其无需下载安装，即开即用，用户可以轻松通过微信等社交平台快速进入游戏。这种轻量级的游戏体验，不仅节省了用户的手机存储空间，也降低了参与门槛，使得更多的员工能够参与到年会的互动中来。凡网云互动工具以其易用性和互动性脱颖而出。它提供了丰富的模板，使得即使是非技术背景的企业决策者也能轻松上手，快速创建属于自己的小程序小游戏。界面直

帆可云官网 2024-12-26

主动降噪，双金标认证！OneOdio A5头戴式耳机安静听世界

提到耳机，不得不提降噪效果，提到降噪效果，头戴式耳机绝对是扛把子的存在。喜欢玩游戏的玩家或者是喜欢听音乐的小伙伴，手头几乎必然是要有一个头戴式耳机的，戴上耳机之后，世界就安静下来了，萦绕耳边的就只有纯粹的音乐，或者是精准的脚步声了。此次体验分享的就是一只头戴式耳机，来自一兆声学旗下OneOdio的Focus A5头戴式耳机。OneOdio A5头戴耳机的总体外观设计上，还是非常沉稳时尚的，白色的耳机外观设计，尽显年轻时尚风，整体充满设计感。除此之外，它还有黑色和清新蓝两种配色可选，满足不同喜好的玩家。说它

数码百科 2024-12-26

IBM加入战局，任意大模型低成本变ChatGPT方法开源，个别任务超GPT-4

01 单峰“瘦”骆驼比草泥马大

02 全新方法SELF-ALIGN

03 背后团队

推荐体验

相关资讯