当前位置：首页|资讯|AI大模型|大语言模型

司南OpenCompass 2.0评测GLM-4稳坐国内榜首，智谱AI大模型实力强悍

作者：科技大事说发布时间：2024-05-23

AI大模型大语言模型

近期，大模型开源开放评测体系司南（OpenCompass 2.0）公布了2024年4月大语言模型最新评测榜单，智谱AI的GLM-4继续保持国产大模型第一的领先身位。

大模型开源开放评测体系司南（OpenCompass 2.0）由上海人工智能实验室发布。其月度榜单从基础能力和综合能力的设计出发，构建了一套高质量的中英文双语评测基准体系，对主流开源模型和商业API模型进行了全面评测分析。评测榜单涉及的大语言模型和多模态大模型超过150个，更有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。

在4月客观评测榜单中，OpenCompass基于语言、知识、推理、数学、代码、智能体六个维度构建了15000余道高质量中英文双语问题，并引入OpenCompass团队首创的循环评估 (Circular Evalution) 策略，系统性分析了国内外大模型的客观性能。其中，GLM-4位列第四名，仅次于GPT-4-Turbo系列与Claude3-Opus，成为国内大模型客观评测月度总榜第一名。在语言维度方面，GLM-4分数达到57.7分表现突出，超过GPT-4-Turbo系列与Claude3-Opus。在知识维度上，GLM-4得到68.9分，超过第二名的GPT-4-Turbo-1106，与第三名Claude3-Opus不相上下。

值得一提的是，GLM-4此前便长期占据OpenCompass 2.0榜单前列，并多次在权威榜单与全球顶级大模型一较高下。清华《SuperBench大模型综合能力评测报告》显示，GLM-4在语义理解等方面的能力表现超过了GPT-4-Turbo等国际一流模型，在代码、智能体等方面，排名国内第一。在SuperCLUE-Fin(SC-Fin)中文原生金融大模型测评基准中，GLM-4斩获一项A+及多项A级评价，在国内大模型中排名第一。

据了解，GLM-4是由智谱AI于今年1月推出的新一代基座大模型。GLM-4整体性能逼近GPT-4，它可以支持更长的上下文，具备更强的多模态能力。同时，它的推理速度更快，支持更高的并发，大大降低推理成本。依托GLM-4 All Tools能力，GLM-4智能体能够实现自主根据用户意图，自动理解、规划复杂指令，自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。

开发者可以通过智谱AI大模型开放平台bigmodel.cn接入GLM-4模型开放API，便捷高效地体验GLM-4的强大能力。

推荐体验

相关资讯

智谱AI推出国产大模型GLM-4 中文能力比肩GPT-4

GLM-4性能相比前一代GLM-3提升60%、中文能力比肩GPT-4。

2024-01-16

智谱AI大模型GLM-4在中文原生金融大模型测评中获A级评价

AI大模型金融

科技数码频道 2024-04-26

智谱AI发布新一代基座大模型GLM-4，“国产GPTs”生态来了？

2024年1月16日，智谱AI在首届技术开放日（ZhipuDevDay）上展示了自己追赶ChatGPT的野心与实力，发布了新一代基座大模型GLM-4和文生图产品CogView3。

蓝鲸财经 2024-01-16

智谱AI推出国产大模型GLM-4，距离OpenAI有多远？CEO：还是追赶者

智谱AI的CEO张鹏介绍，GLM-4的整体性能相比上一代大幅提升，逼近GPT-4。张鹏坦言，由于起步晚、算力受限等因素的制约，今天国内大模型与国外最先进团队还有将近一年的差距，“智谱AI依然是追赶者”。张鹏表示，大模型是当前人工智能研究和应用的热点，被认为是通向通用人工智能的关键途径，也是国际科技竞争的焦点。

OpenAI GPT-4 人工智能

时代周报 2024-01-17

国内外顶尖 ai 对战：chatgpt4-turbo、文心一言4、智谱清言glm-4

本文对三款AI产品进行了深入评测，包括智谱清言glm-4、chatgpt4-turbo和文心一言4。测试涉及多个方面，如括号闭合、语言混合理解、逻辑推理、地理知识和创造性写作。

云牧 2024-03-24

近期资讯

小米16系列配置前瞻：外观尺寸持平上一代，或将首发骁龙8 Elite2

**前言**随着小米15系列的大卖，作为下一代的小米16系列备受期待。根据目前网络所汇总的信息来看，小米16系列将会有一定的升级。特别是在设计、性能和摄像技术方面的都将有新突破。**外观设计：极致视觉体验**小米16系列在外观设计上延续了品牌的精致理念。标准版以6.36英寸的小屏设计，为喜欢单手操作的用户提供了便利；而Pro版本则以6.8英寸的大屏旗舰定位，采用极窄边框设计，正面屏幕边框仅为1.02mm，为用户提供了沉浸式的视觉体验。支持120Hz智能刷新率和4320Hz高频PWM调光，峰值亮度

小8说科技 2024-12-28

视频怎么提取音频？8款视频转音频mp3软件免费集合，小白速看！

当您只想使用本地视频文件中的音频内容时，将视频转换为音频可以帮助节省电脑或Mac上的存储空间。此外，如果您想在只支持音频文件的音乐播放器上播放视频文件，视频转音频也是必要的。因此，通过将视频提取音频，您不仅能节省存储空间，还能在只支持音频的设备上播放这些文件。在本文中，我们将为您推荐8款视频转音频mp3软件免费工具，并教您如何快速、轻松地将视频转换成音频格式，助您轻松搞定音频提取！一、金舟音频转换器对于Mac用户来说，如果您想要从视频中提取音频，金舟音频转换器是个不错的视频转音频mp3软件免费选择。这款软

金舟音频大师 2024-12-28

努力的果实：会有好结果

我密切关注着比赛的这一阶段，很明显她没有松懈，速度比平时快了许多，可以看出她是在努力坚持。我站在远处，对着跑道上的她大声加油：“西西，加油！别放松！”我知道她能听到我的鼓励。过了这个阶段，她的速度明显提升，在我们预计的冲刺点开始加速，这200米是冲刺并取得佳绩的关键阶段，她已经位于前六名之内。“冲刺！冲刺！”我声嘶力竭地呼喊着。在恍惚中，她仿佛“飞”了起来，直奔终点线。“她应该能得到满分！”老师们这样对我说，但我心中仍旧不踏实。我知道，接下来她需要稍作休息，查看成绩，计算总分，整理物品，然后和同

天天向上_24 2024-12-28

基于微服务的校园社团平台系统程序设计（可做毕业设计参考）

[图片] 中文摘要标题：基于微服务的校园社团平台系统毕业设计本文旨在设计并实现一个基于微服务架构的校园社团平台系统，以解决传统单体架构在可扩展性、可维护性和故障隔离等方面的局限性。该系统旨在为高校内的各类社团提供一个集信息发布、活动组织、会员管理、资源共享与交流互动于一体的综合服务平台。首先，通过对校园社团管理现状的调研，明确了系统需具备的功能需求，包括社团信息管理、活动发布与报名、会员注册与积分管理、资源上传与下载以及论坛交流等模块。随后，基于微服务的设计理念，将系统划分为多个独立的服务单元，如

软件设计开发者 2024-12-28

【赵渝强老师】MongoDB的Journal日志

数据是MongoDB的核心，MongoDB通过使用Journal日志保证数据的安全。Journal日志用于记录上一个检查点之后发生的数据更新，并将更新的信息顺序写入Journal日志文件中。通过使用Journal日志能够将数据库从系统异常终止事件中还原到一个有效的状态。通过6.5.1.3小节的介绍了解到，MongoDB使用预写日志机制实现数据的持久化。每个Journal日志文件的大小是100M，并存储在由参数--dbpath指定的下的journal子目录中，如下所示：tree /data/mydata/j

赵渝强老师 2024-12-28

(*´∀`)~♥ 感谢你的喜欢

详情见主页 [图片]

Moeyo 2024-12-28

高中英语核心词汇887个…

很多同学在高三复习的时候，背诵单词没有重点，3500个单词，每个都去背，到最后发现哪个都记不牢，实质上有很多单词同学们只要做到认识就可以，那么还有一部分单词是同学们一定要记住的，就是高考中经常出现的高频单词。这些单词同学们一定要牢记。今天学姐就给大家整理了一份高考最常考的887个高频词汇，附带频次与释意，同学们一定要保存，没事就拿出来看看！并把自己平时记不牢的单词做重点记忆与背诵。

怪力不乱神a 2024-12-28

微信功能被限制怎么解封？5个方法

微信功能被限制使用了怎么办？可以登得上去，但部分功能无法使用，例如社交场景，朋友圈功能等，放置不去理他，并不会自动恢复，必须要主动去处理，针对常见的情况，分享点个人经验与解决的办法，仅供参考 [图片] 第一种：临时辅助只针对临时限制的有效，而其他的类型不适用，让符合条件的好友配合辅助即可解决，如果里面的好友不符合，或不认识，这种情况可以申请换验证方式，再选择合适自己的方式解决，不会的可以来问。 [图片] 第二种：变更类型如果显示的是永久限制，情况不严重或初次遇到的，可以申请变更处罚类型，将永久的降低成

坤琳讲 2024-12-28

勤源FinOps：实现政务云精准成本分摊与高效计费

勤源FinOps：实现政务云精准成本分摊与高效计费在当今数字化和云计算快速发展的环境下，政府的成本管理变得日益复杂。尤其是在云资源的使用和各部门、项目的开支之间，如何进行精确的成本分摊与计费管理，成为了政府财务管理的重要课题。传统的人工分摊和手动计费管理方法已无法满足现代政府对高效、透明、准确的需求。因此，借助智能化的技术手段，优化成本分摊与计费管理，已成为推动政府数字化转型的关键因素。勤源科技（江苏），结合全链路智能运维的理念，推出了高效的政务云成本分摊与计费管理功能，帮助政府精准

勤源全链路运维 2024-12-28

就这么毫无征兆的：六代机横空出世！

最近太忙碌于公司项目沟通上的事，湖南广东两边连轴转，连沈成俩公开试飞这么大的事，都没关注到作为市场调研咨询业的一扎傻黑愤伪军迷有罪哈！26号大过年晚上五角大楼的灯火通明，外卖订单剧增，也验证的确出乎了阿美丽卡的意料，承认原来的评估太保守。原来美国国防部预测，认为六代机在发动机和信息化上，近期中美都不能有大突破，认为中国的六代机要在2030年以后，最快也要2028年。西方的圣诞节，美国网民也被中国空军的消息砸晕了，不敢否认，又不好意思夸，有点尴尬，扭扭捏捏的。其他国家网友对美国开启群嘲，日越都服了，唯

湖南市场调研源点 2024-12-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1