清华唐杰新作WebGLM：参数100亿，性能超OpenAI WebGPT

作者：AIGC开放社区发布时间：2023-06-25

清华 OpenAI

清华唐杰团队的新作来了：

WebGLM，一个参数100亿的联网问答聊天机器人（论文入选KDD2023）。

你可以问它任何问题，然后它将列举出网上（例如维基百科、相关官网）相关的文章链接，整理出答案。

论文地址：

https://arxiv.org/abs//2306.07906

GitHub主页：

https://github.com/THUDM/WebGLM

比如：

ChatGPT的核心技术是什么？

或者:

谁提出的Music Transformer？它的原理是什么？

再或者：

原神3.5版本怎么样？

没有高薪工作，怎么在一线城市生活？（手动狗头）

……

它都能给出有理有据的回答。

据介绍，在性能对比测试中，WebGLM的水平已经高于OpenAI 135亿参数的WebGPT，在人类评估中，甚至与1750亿参数的模型不相上下。

那么，它是如何训练的？

可以上网的清华系WebGLM

据介绍，WebGLM的目标是通过Web搜索和检索功能，增强预训练大语言模型，同时可以进行高效的实际部署。

为此，作者基于三种策略进行开发。

首先是大模型增强检索器。

它主要是用于增强模型相关网络内容的检索能力，在给定查询的情况下查找相关引用，以便后面更好地准确回答问题。

它有两个阶段：粗粒度web搜索和细粒度LLM增强密集检索。

其次是自举生成器。

它利用GLM（比如清华之前发布的双语开源预训练模型GLM-130B）的能力为问题生成回复，提供详细的答案。

利用该生成器，作者得到WebGLM-QA——一个LLM自举引用和长程的QA数据集。

它通过上下文学习等策略进行清洗和过滤，最终包括45k的高质量过滤样本和83k的噪声样本。

WebGLM的backbone就是一个在该数据集上训练的GLM模型。

最后是基于人类偏好的打分器。

它通过优先考虑人类偏好而非昂贵的专家反馈来评估生成回复的质量，确保系统能够产生有用和吸引人的内容。

以上三大组件最终按顺序形成WebGLM的pipeline：

可以看到，正好三个模块，对应前面介绍的三部分，其中：

LLM增强检索器会将前五个最相关的页面作为参考源，让自举生成器生成多个答案，最终打分器选出最可能符合人类偏好的那一个作为最终输出。

性能超OpenAI WebGPT

除了WebGLM本身，唐杰团队此次还提出了一个网络增强问答系统的评估标准，评估对象既包括参考文献，也包括最终回答。

其中前者衡量相关性、信息密度、真实性（无事实错误）、毒性（不含暴力色情等信息）和社会偏见程度这5个维度；后者则衡量流畅度、正确性、引用准确性、客观性和冗余程度。

他们用WebGPT（来自OpenAI，基于GPT-3进行微调）演示网站提供的272个问题进行对比评估，并招募了15个学历为硕士的志愿者打分。

最终结果如下：

（“Rel.”、“ Den.”……分别对应上面说的10个指标。）

可以看到，尽管WebGLM的搜索结果略逊于WebGPT-175B，但远好于Perplexity.ai和WebGPT-13B（左边的参考文献评估）。

值得一提的是，WebGLM检索过程只使用了一些传统的基于单词的算法和两个累计参数量不超过300M的Contriever。

此外，WebGLM在计算性能和时间消耗方面也明显优于WebGPT-13B、并与175B不相上下。

而在最终结果方面，WebGLM在流畅度、真实性和冗余度方面均获得最高得分，正确性指标上则接近WebGPT-175B，远高于Perplexity.ai和WebGPT-13B。

作者表示，这表明WebGLM可以以更低的成本获得更高的性能。

部署与训练

WebGLM发布即开源。

要想部署它，需要从SerpAPI官网获得一个密钥，用于在搜索过程中获取搜索结果。

检索器的权重可从清华云上下载。

运行该模型的方式有两种：一是命令行界面，二是Web服务形式，并且包含WebGLM-2B和WebGLM-10B两种可选模型。

你也可以自己训练WebGLM，官方已提供好了生成器和检索器的训练数据供下载～

相关资讯

清华唐杰新作WebGLM：参数100亿、主打联网搜索，性能超OpenAI WebGPT

丰色发自凹非寺量子位公众号 QbitAI 清华唐杰团队的新作来了： WebGLM，一个参数100亿的联网问答聊天机器人（论文入选KDD2023）。你可以问它任何问题，然后

清华 OpenAI

量子位 2023-06-23

清华大学唐杰：大模型与超级智能

以下文章来源于中国计算机学会，作者唐杰本文探讨了大模型的发展历程，介绍了作者团队研发的GLM-4大模型，并针对AGI研究面临的挑战对AGI未来发展提出了一些思考。超大规模预训练模型（也称基础模型、大模型，英文为Foundation Model、Big Model等）快速发展，成为国际人工智能领域研究和应用的前沿焦点。OpenAI ChatGPT和Sora的推出引发了社会和公众的广泛关注，并引起了大模型是否会引发新一轮行业变革甚至新一次工业革命的讨论。大模型作为ChatGPT和Sora等生成式人工智能

清华 AGI 人工智能

ChatGLM 2024-05-31

华裔数学家用GPT-4解数学难题；清华唐杰团队发布WebGLM；全国人大法工委回应“AI换脸”现象丨AIGC大事日报

华裔数学家用GPT-4解数学难题；清华唐杰团队发布WebGLM；全国人大法工委回应“AI换脸”现象丨AIGC大事日报 1、全国人大法工委回应“AI换脸”现象 2、清华唐杰新作WebGLM 性能

GPT-4 清华 AIGC

智东西 2023-06-25

清华系ChatGPT发布！唐杰团队打造，专对中文优化，还能把握最新新闻动态

先看ChatGLM，它是唐杰团队大模型家族时隔半年诞生的一位新成员。它对新信息的掌握度不错，知道推特现在的CEO是马斯克，也知道何恺明3月10日回归学界的事情，但还没发现GPT-4已经发布了。嘉宾就把GLM-…

清华 ChatGPT GPT-4 ChatGLM 马斯克

量子位 2023-03-18

GLM 大加强，清华团队推出 GLM 联网加强版 WebGLM！

大模型生成答案不可靠？一种很直接的思路就是结合传统的搜索引擎的“知识”来对大模型进行一次检索增强。其实早在 InstructGPT 面世以前，OpenAI 就发布了可以用作搜索结果聚合的模型 Web

清华搜索引擎 OpenAI

夕小瑶 2023-06-20

近期资讯

理想官宣：12月31日正式推送高速/城市全场景端到端+VLM

快科技12月29日消息，理想汽车宣布将于12月31日向AD Max用户全量推送7.0车机系统版本，此次OTA更新将引入高速和城市全场景的端到端升级以及VLM功能。据悉，新系统新增AI推理可视化交互、M

王略 2024-12-29

三星晶圆代工再遭重创！台积电将独占二代骁龙8至尊版订单

快科技12月23日消息，据报道，高通原打算在今年的骁龙8至尊版开始执行双代工厂策略，不过由于三星良品率不稳定等原因，最终让高通选择延后执行该计划。不过高通并没有放弃，希望能够在第二代骁龙

鹿角 2024-12-29

第十一届全国青年科普创新实验暨作品大赛启动

12月27日，由中国科协主办、中国科技馆和中国科协青少年科技中心承办的第十一届全国青年科普创新实验暨作品大赛启动。各赛区承办单位代表及关注大赛的各地师生齐聚云端，通过网络直播共同参与启动及交流活动。全国青年科普创新实验暨作品大赛始于2013年，迄今已成功举办十届，全国累计参赛人数约52万，在全国各大中专院校及中学产生了广泛而深远的影响。

北青网 2024-12-29

华为 nova 12 / 13 系列手机获 HarmonyOS NEXT 5.0.0.102 升级

据IT之家此前报道，华为nova12/Pro、nova13/Pro四款手机在本月（12月28日）开启鸿蒙HarmonyOSNEXTBeta版用户招募，报名截止时间为2025年1月10日15:00。本次活动面向开发者及尝鲜用户进行招募，用户需先签署“保密协议”后，方可填写“报名信息”。

IT之家 2024-12-29

“AI+5T”重大技术突破！中控技术携手湖北三宁打造化工行业首套“无人”值守硫酸装置

近日，中控技术携手湖北三宁化工股份有限公司（简称“湖北三宁”）打造的首套“无人”值守硫酸装置取得突破性进展，实现了该装置人工操作频次由过去的最高6000余次、日均1600余次降至现在的最低3次、日均10次以内，进入“无人”值守模式，装置的安全、效益水平和智能化程度获得显著提升，有力推动化工行业的智能工厂进入自主运行新阶段。

全景网 2024-12-29

奔驰车标供应商宣布破产：曾经历拿破仑入侵、两次世界大战

快科技12月29日消息，据报道，德国的格哈迪塑料技术公司近期宣布破产。这家汽车零件供应商拥有1500名员工，为豪华汽车品牌奔驰生产著名的三芒星标志。格哈迪塑料技术公司的历史可追溯至1796年

2024-12-29

手绘长卷｜跨越山海，谱写“一带一路”壮丽篇章

千龙网 2024-12-29

曝TCL明年旗舰沿用万象分区，并搭载RGB-Mini LED技术

近日，有电视行业资深达人透露，TCL即将量产的下一代旗舰X系列新品可能会继续采用万象分区技术，并引入前沿的RGB-MiniLED技术，成为全球首款搭载该技术的量产电视产品。而RGB-MiniLED属于MiniLED显示技术的一种，其通过将背光层的单色灯珠变为三原色灯珠，直接生成彩色背光，能够在一定程度上提升色域和色准。

罗超频道 2024-12-29

宝骏旗舰轿车享境亮相：纯电/插混双动力明年上半年上市

快科技12月29日消息，宝骏品牌首款旗舰车型“宝骏享境”近日在上汽通用五菱的2024年第80万辆新能源车下线现场正式亮相，预计将于2025年上半年上市。该车定位为中大型轿车，提供

2024-12-29

事故频发！加拿大航空一客机降落遇故障并起火

快科技12月29日消息，据报道，在韩国一架客机遭遇碰撞并起火事件后不久，仅仅相隔两个多小时，加拿大航空公司的一架客机也遭遇了突发事故，于降落过程中偏离跑道并突发火灾，这一连串的事件迫使

鹿角 2024-12-29

清华唐杰新作WebGLM：参数100亿，性能超OpenAI WebGPT

推荐体验

相关资讯

清华唐杰新作WebGLM：参数100亿、主打联网搜索，性能超OpenAI WebGPT

清华大学唐杰：大模型与超级智能

华裔数学家用GPT-4解数学难题；清华唐杰团队发布WebGLM；全国人大法工委回应“AI换脸”现象丨AIGC大事日报

清华系ChatGPT发布！唐杰团队打造，专对中文优化，还能把握最新新闻动态

GLM 大加强，清华团队推出 GLM 联网加强版 WebGLM！

近期资讯

理想官宣：12月31日正式推送高速/城市全场景端到端+VLM

三星晶圆代工再遭重创！台积电将独占二代骁龙8至尊版订单

第十一届全国青年科普创新实验暨作品大赛启动

华为 nova 12 / 13 系列手机获 HarmonyOS NEXT 5.0.0.102 升级

“AI+5T”重大技术突破！中控技术携手湖北三宁打造化工行业首套“无人”值守硫酸装置

奔驰车标供应商宣布破产：曾经历拿破仑入侵、两次世界大战

手绘长卷｜跨越山海，谱写“一带一路”壮丽篇章

曝TCL明年旗舰沿用万象分区，并搭载RGB-Mini LED技术

宝骏旗舰轿车享境亮相：纯电/插混双动力明年上半年上市

事故频发！加拿大航空一客机降落遇故障并起火

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响