智谱 AI 推出新一代基座大模型 GLM-4，能力逼近 GPT-4，配备多模态、长文本和智能体

作者：极客公园发布时间：2024-01-16

最接近 OpenAI 的中国追赶者，拿出了逼近 GPT-4 的超强大模型。

作者| 连冉

编辑| 郑玄

1 月 16 日，智谱 AI 在其首届技术开放日（Zhipu DevDay）正式发布了新一代基座大模型 GLM-4。

据智谱 AICEO 张鹏介绍，GLM-4 的整体性能相比上一代大幅提升，逼近 GPT-4。它可以支持更长的上下文，具备更强的多模态能力。同时，它的推理速度更快，支持更高的并发，大大降低推理成本。

除此之外，GLM-4 大幅提升了智能体能力，GLM-4 All Tools 实现自主根据用户意图，自动理解、规划复杂指令，自由调用网页浏览器、Code Interpreter 代码解释器和多模态文生图大模型以完成复杂任务。GLMs 个性化智能体定制功能亦同时上线，用户用简单的提示词指令就能创建属于自己的 GLM 智能体。

演讲中，张鹏回顾了大模型行业和智谱 AI 过去五年的发展历程。他坦言，由于起步晚、算力受限等因素的制约，今天国内大模型与国外最先进的团队还有将近一年的差距。张鹏没有回避智谱 AI 依然是「追赶者」的事实。而拿出性能非常逼近 GPT-4 的 GLM-4，智谱 AI 已经践行了自己去年年初定下的承诺。

GLM-4：

多模态、长文本、智能体

智谱 AI 表示，此次发布的 GLM-4，在多个评测集上性能已接近或超过 GPT-3.5，个别项目上几乎持平 GPT-4。其中以下四个能力更新，是 GLM-4 最大的亮点：

多模态能力：推出了 CogView3 代，效果超过开源 SD 模型，逼近 DALLE-3。
All Tools 能力：GLM-4 能自主理解复杂指令，自由调用 WebGLM 搜索增强、Code Interpreter 代码解释器和多模态生成能力，完成复杂任务。
GLMs 个性化智能体定制：用户可以通过智谱清言官方网站创建属于自己的 GLM 智能体，无需编程基础。
MaaS 平台和API：GLM-4 登陆了 Maas 平台，提供 API 访问，支持开发者内测 Assistant API。

具体来说，GLM-4 可以支持 128k 的上下文窗口长度，单次提示词可以处理的文本可以达到 300 页。同时，在 needle test（大海捞针）测试中，128K 文本长度内 GLM-4 模型均可做到几乎 100% 的精度召回，并未出现长上下文全局信息因为失焦而导致的精度下降问题。同时，多模态能力方面，文生图和多模态理解都得到了增强。

GLM-4 多模态能力展示｜图片来源：智谱 AI

此外，GLM-4 的 All Tools 能力全新发布。得益于 GLM 模型的强大 Agent 能力，GLM-4 实现了自主根据用户意图，自动理解、规划复杂指令，自由调用网页浏览器、Code Interpreter 代码解释器和文生图 CogView3 模型。

同时，GLM-4 通过代码解释器，会自动调用代码解释器进行复杂的方程或者微积分求解。对比 GSM8K、Math 以及 Math23K 三个数据集上的结果，GLM-4 All Tools 取得和 GPT-4 All Tools 相当的效果。GLM-4 的 All Tools 能力完全自动，而且可以处理各种任务，比如包括文件处理、数据分析、图表绘制等复杂任务，支持处理 Excel、PDF、PPT 等格式的文件。

为降低大模型使用门槛，GLMs 个性化智能体定制能力也同步上线。基于 GLM-4 模型的强大能力，用户只要登录智谱清言官方网站，用简单的提示词指令就能创建属于自己的 GLM 智能体。

并且，用户可以通过全新上线的智能体中心分享自己创建的各种智能体。GLM 模型智能体的推出，标志着任何人都能够自由运用 GLM-4 模型并挖掘它的潜力，即使没有任何编程基础，也能够实现大模型的便捷开发，这也是扩大大模型开发者社区生态的一次进步。

这个功能一经推出，就在行业内引起热议。去年 11 月 OpenAI 推出 GPTs 以来，智能体已经成为当下大模型赛道最热门的落地方向，也被认为是打造大模型行业生态的重要基石。

此前，智谱 AI 分别联合 CCF 中国计算机学会、中国中文信息学会社会媒体处理专委会发起了 CCF-智谱大模型基金、SMP-智谱大模型交叉学科基金，用于支持大模型理论、算法、模型、应用等相关研究和跨领域交叉创新。

去年，两支基金为来自全国三十余所高校参与的 41 个研究项目累计提供了超 1000 万元现金和算力资源的科研支持。

2024 年，智谱AI也将发起开源开放的大模型开源基金，该计划包括三个「一千」：

智谱 AI 将为大模型开源社区提供一千张卡，助力开源开发；
提供 1000 万元的现金用来支持与大模型相关的开源项目；
为优秀的开源开发者提供 1000 亿免费 API tokens。

张鹏表示，大模型开源基金的目的在于推动大模型研发的大进展，促进大模型整个开源生态的大繁荣。面对全球的大模型创业者，智谱 AI 也将「Z 计划」进一步升级，联合生态伙伴发起总额 10 亿人民币的大模型创业基金用于支持大模型原始创新，覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。

2024 年是

AGI 元年，但路还长

在上午的演讲中，智谱 AI CEO 张鹏谈到，大模型是当前人工智能研究和应用的热点，被认为是通向通用人工智能的关键途径，也是国际科技竞争的焦点。从 2017 年的 Transformer 架构，到 BERT、GPT 系列等模型的推出，这些年来，大模型在算法创新、模型规模和应用领域都取得了显著进步，刚刚到来的 2024 年是 AGI 元年，但路还很长。

在演讲中，张鹏回顾了大模型行业和智谱，在过去 5 年的发展历程：

智谱 AI CEO 张鹏｜图片来源：智谱 AI

2018-2020：

大模型的算法创新年

2017 年，谷歌提出了 Transformer 机器学习模型架构，迅速席卷了整个人工智能研究领域，成为自然语言处理等相关研究的主要方法，2018 到 2020 年，业内先后出现了 BERT、GPT/GPT-2/GPT-3、T5 等基于大规模无标注数据自监督学习的大规模预训练算法，可以说 2018-2020 年是大模型的算法创新年，在这段时间，智谱 AI 研发了属于自己的算法 GLM。

2020-2022 年：

模型之争开始

2020 到 2022 年，模型之争开始，基于各种预训练模型框架和开源项目，各种模型如雨后春笋般诞生。2020 年的 GPT-3，拥有 1750 亿参数，可以被视作这一战的起点，它开启了基座模型的全新时代，其在语言生成、上下文学习和知识理解等方面展现出惊人能力。

随后全球范围内掀起了一股大模型研究和研发的热潮，谷歌、Meta 等国际领先公司开始不断发布百亿到千亿规模的大型语言模型，例如 Gopher（2021 年）、Chinchilla（2022 年）、PaLM（2022 年）、Claude（2022 年）等等，但是这些模型都不开源，因此开源大语言模型也开始受到关注，比如 META 的 OPT（2022 年）、BLOOM（2022 年）、LLAMA（2023 年）。

智谱 AI 则选择在 2022 年开源了自己的千亿基座模型 GLM-130B，这一工作引起了全世界范围的关注，包括顶尖高校斯坦福，还有公司 google、OpenAI、apple、meta 都对智谱 AI 的模型进行了深入分析和对比。

2023 年：

大模型出圈

2023 年，ChatGPT 推出后，大模型开始火出圈，被公众广为所知。大模型的发展不再仅限于模型的训练，更重要的是如何实现模型的产业化应用落地，大模型开始在各个领域开花并且结果。

智谱 AI 在 2023 年这一年当中基于 GLM-130B 研发了 ChatGLM，历经 3 个版本的迭代，逐步具备了多模态理解、代码解释、网络搜索增强等新功能。随后智谱 AI 联合合作伙伴，在一年来实现了广泛的商业应用落地。

在回顾完过去 5 年来大模型的发展后，张鹏也总结称必须承认的一点是，和国外大模型相比，国内的大模型发展起步晚一些，加上高性能算力的限制和数据质量的差距等等，国内研发的大模型无论规模还是核心能力，与世界先进水平还存在一年左右的差距。

去年年初智谱 AI 承诺，「2023 年底智谱 AI 要实现逼近最先进的 GPT-4 性能的全栈自主创新的 GLM-4」，作为一年前定下的目标，今天可以看到，GLM-4 性能已得到明显的提升，而「从标准的大模型评测角度看，整体上我们已经逼近了 GPT-4」。

*头图来源：智谱

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

极客一问

国产大模型里，

你最看好哪个？

热点视频

刚刚发布的小米新一代机器狗「铁蛋2」都掌握了哪些新技能？来看看雷军在发布会现场是怎样介绍的。

点赞关注极客公园视频号，

观看更多精彩视频

更多阅读

智谱 AI 推出新一代基座大模型 GLM-4，能力逼近 GPT-4，配备多模态、长文本和智能体

推荐体验

相关资讯

智谱AI发布新一代基座大模型GLM-4，“国产GPTs”生态来了？

新一代基座大模型GLM-4来了！智谱AI将发起大模型开源基金

超越Llama3，多模态比肩GPT4V：GLM-4智能体，新一代语言处理利器

智谱AI推出国产大模型GLM-4 中文能力比肩GPT-4

真的？Altman放言GPT-5和AGI都要来了；GPT Store最好的100个提示词长啥样；智谱AI推出新一代基座大模型GLM-4；提示工程实战完整指南 |

近期资讯

快递100旗下百递云快递物流查询API，在新能源汽车厂商的应用落地实例分析

微信再次冲击电商，但送礼这功能打不过天天价格战的同行

产品架构设计必知：企业数字化演进的5个阶段

“玄学”珠宝，拿捏焦虑的年轻人

构建健康的数字习惯：用户体验设计如何缓解技术成瘾

做好24年度工作总结，回答好这5个问题就够了！

本地生活，抖音如何实现流量商业化

GPT-5开发超18个月，困难重重或难产？

2024年AI大事件盘点：谁家的产品破圈了？

玩转「超级用户计划」7▎招募流程详解：公开、动机调研、入职与培训

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响