OpenAI开源了：Transformer自动debug工具上线GitHub

作者：机器之心Pro发布时间：2024-03-12

机器之心报道

编辑：泽南

不用敲代码，就可以快速探索模型结构。

最近时常被吐槽不够开源的 OpenAI，突然开放了一次。

今天一早，OpenAI 机器学习研究员 Jan Leike 宣布，OpenAI 开放了自己内部一直用于分析 Transformer 内部结构的工具。

GitHub 链接：https://github.com/openai/transformer-debugger

该项目开放才几个小时，虽然没有经过太多宣传，star 数量上涨得也挺快。

Transformer Debugger 介绍

Transformer Debugger (TDB) 是 OpenAI 对齐团队（Superalignment）开发的一种工具，旨在支持对小体量语言模型的特定行为进行检查。据介绍，该工具把自动可解释性技术与稀疏自动编码器进行了结合。

具体来说，TDB 能够在需要编写代码之前进行快速探索，并能够干预前向传递，帮助人们查看它是如何影响模型特定行为的。TDB 可用于回答诸如「为什么模型在此提示（prompt）中输出 token A 而不是 token B？」之类的问题或「为什么注意力头 H 会在这个提示下关注 token T？」

它通过识别对行为有贡献的特定组件（神经元、注意力头、自动编码器 latents），显示自动生成的解释来分析导致这些组件最强烈激活的原因，并跟踪组件之间的连接以帮助人们发现联系，以此来帮助人们进行 Transformer 的 debug 工作。

OpenAI 放出了几段视频概述了 TDB 的能力，并展示了如何使用它来进行论文《Interpretability in the Wild: a Circuit for Indirect Object Identification in GPT-2 small》中的工作：

视频链接：https://mp.weixin.qq.com/s/HklR73Bxkcmzm48KaxyG2Q

本次，OpenAI 的开源内容包括：

Neuron viewer：一个 React 应用程序，用于托管 TDB 以及包含有关各个模型组件（MLP 神经元、注意力头和两者的自动编码器 latents）信息的页面。
Activation server：对主题模型进行推理，为 TDB 提供数据的后端服务器。它还从公共 Azure 存储桶读取和提供数据。
Models：GPT-2 模型及其自动编码器的简单推理库，带有捕获激活的 hook。
整理好的激活数据集：包含 MLP 神经元、注意力头和自动编码器 latents 的顶级激活数据集示例。

安装设置

请按照以下步骤安装存储库。请注意，在此之前你需要 python/pip 以及 node/npm。

虽然不是必要，但 OpenAI 建议使用虚拟环境进行操作：

# If you're already in a venv, deactivate it.

deactivate# Create a new venv.

python -m venv ~/.virtualenvs/transformer-debugger# Activate the new venv.

source ~/.virtualenvs/transformer-debugger/bin/activate

设置好环境后，请按照以下步骤操作：

git clone git@github.com:openai/transformer-debugger.gitcd transformer-debugger

# Install neuron_explainer

pip install -e .

# Set up the pre-commit hooks.

pre-commit install

# Install neuron_viewer.

cd neuron_viewer

npm installcd ..

要运行 TDB 应用程序，你需要按照说明设置激活服务器后端和神经元查看器前端。

要验证更改，你需要：

运行 pytest；
运行 mypy —config=mypy.ini；
运行激活服务器和神经元查看器，并确认 TDB 和神经元查看器页面等基本功能仍然有效。

Jan Leike 表示，TDB 目前仍然是一个早期阶段的研究工具，OpenAI 希望通过开源的方式让更多人受益，并期待社区在其基础上不断改进。

参考内容：https://twitter.com/janleike/status/1767347608065106387

相关资讯

复旦MOSS大模型开源了！Github和Hugging Face同时上线

丰色萧箫发自凹非寺量子位公众号 QbitAI 复旦大模型 MOSS，正式开源了！作为国内首个开放测试的类ChatGPT产品，MOSS开源地址一放出，又冲上知乎热搜：从官网介绍来

复旦 MOSS Hugging Face ChatGPT GitHub

量子位 2023-04-22

HelloGitHub 2023-11-13

精通Transformer——自动编码语言模型

在上一章中，我们研究了如何使用 Hugging Face 的 Transformers 来应用典型的 Transformer 模型。到目前为止，本书的所有章节都包括了如何使用预训练或预构建模型的说明，

Hugging Face

数据智能老司机 2024-08-15

OpenAI开源了：Transformer自动debug工具上线GitHub

推荐体验

相关资讯

复旦MOSS大模型开源了！Github和Hugging Face同时上线

强到离谱！Github和Hugging Face同时上线！复旦MOSS大模型开源了！

把代码贴进去自动找bug，这个debug神器自动修复仅需几秒

GitHub 官方开源的字体集「GitHub 热点速览」

精通Transformer——自动编码语言模型

近期资讯

「mentech」官宣成为Visma | Lease a Bike车队首个中国官方合作伙伴，品牌全球布局初显

2024年了，电动车还扛不住零下20度？

情绪价值给满，年轻人疯狂下单

再见游戏行业2024：当我们告别幻想

出海速递｜旷视、吉利将展开智能驾驶合作，或会成立一家新合资公司/特斯拉上海储能超级工厂开始试生产

领星WMS，助力海外仓业务增长！

韩国航空业现状与发展：从空难事件看行业全景

TikTok Shop，张一鸣的B计划？

生椰拿铁、香菜面……爆款食品的走红是一夜成名的传说吗？——投资笔记第202期

AI 赋能，业财融合的深度创新与管理升级

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响