当前位置：首页|资讯|人工智能|大语言模型

人工智能大语言模型哪家强

作者：深圳商报发布时间：2024-02-28

人工智能大语言模型

深圳商报首席记者吴吉

日前，港大经管学院深圳研究院蒋镇辉教授领导的人工智能大模型评测团队发布了《人工智能通用大语言模型评测报告》。报告显示，中文语境下，文心一言4综合表现最佳；而在英文语境下，GPT4-turbo领先优势明显。

报告从用户视角出发，构建了一个新的人工智能大语言模型综合评价体系，主要包括三大核心能力：通用语言能力、专业学科能力以及安全与责任。

经过对14个不同的大模型的测试与评估，在中文语境下的大语言模型能力测试中，文心一言4、GPT4-Turbo和通义千问2综合表现卓越，位列第一梯队，处于领先者的地位。其次是GPT4、讯飞星火v3.0和商汤日日新，位列第二梯队。

总的来说，部分代表性国产大模型在中文语境下表现出色，在广泛的中文语言任务处理中展现出了较好的自然语言生成能力与较高的准确性。

根据研究团队的测试，在通用语言能力方面，尽管是中文语境下的测试，国产大模型仍落后于GPT4-Turbo和GPT4，尤其是在内容生成类任务中差异较为明显。在中文的专业学科测试中，通义千问2正确率最高，文心一言4也超越了GPT系列模型，展示出优异的性能。

此后，在中文语境工作的基础上，评测团队将研究视野扩展至英文语境。在评测中，项目组构建了全新的英文测试集，并在中文报告涵盖的14个大模型的基础上增加了几款国际主流的通用大模型。

经过对16个不同大模型的测试与评估，GPT 4-turbo凭借领先的自然语言和专业学科能力取得了整体优势，成为唯一综合得分超过80分的大模型，处于领先者地位。

Gemini Pro、Llama2、GPT4、文心一言4、Claude2等五款大模型的综合得分集中于73到78之间，表现较为接近，位列第二梯队。作为Google推出的全新大模型，Gemini Pro综合排名第二，且在各项能力上都排在前三位，表现均衡。国产大模型文心一言4.0以出色的表现位列总榜第五，不仅在国产模型中排名最高，而且在整体排名中超越了Claude2和GPT3.5-turbo这两个已投入商用的英文原生大模型，展现了其优越的综合能力及对英文环境的良好适应性。

推荐体验

相关资讯

国内大模型AIGC哪家强

！1. MiniMax 闫俊杰：前商汤科技副总裁、通用智能技术负责人；中科院自动化所·博士杨斌：留学期间曾作为创始成员在UberATG研究院、自动驾驶初创公司Waabi等团队任职；加拿大多伦多大学·博士 …

AIGC 自动驾驶商汤

叶明说电商 2023-08-31

ChatGPT火了！中国高校人工智能专业哪家强？

从近些年的发展以及近期股市的波动可以看出，人工智能备受社会追捧已经是不可否认的事实。人工智能专业的热度连年上涨，已连续三年位于百度专业大数据热榜首位。各院校开设人工智能专业，以及在此基础上的“智能+工

ChatGPT 人工智能百度

思课强基综评 2023-02-20

人工智能服务哪家强？IDC评估报告看过来

作为一项全球领先的机器学习服务，亚马逊云科技AmazonSageMaker能够为客户的数据准备、模型构建、训练、评估、部署、MLOps和可信度提供端到端的完全托管服务，为企业的整个机器学习生命周期提供支持。从…

人工智能亚马逊

趣味科技 2023-02-23

人工智能 | Mistral 大语言模型

Mistral AIMistral AI teamMistral AI 是一家销售人工智能产品的法国公司。它由 Meta Platforms 和 Google DeepMind 的前员工于 2023 年 4 月创立。该公司于 2023 年 10 月筹集了 3.85 亿欧元，2023 年 12 月估值超过 20 亿美元Mistral.AI 愿景与使命我们是一个具有高科学标准的小型创意团队。我们通过突破性的创新打造开放、高效、有用且值得信赖的人工智能模型。我们的使命是让前沿人工智能无处不在，为所有建设者提供量

人工智能大语言模型谷歌

测吧测试开发 2024-09-03

国内大语言模型哪家更好用？

大家好，我是袁庭新。过去一年，AI大语言模型在爆发式增长，呈现百家争鸣之态。国内外相关厂商积极布局，并相继推出自家研发的智能化产品。我在工作中已习惯借助AI来辅助完成些编码、创作、文生图等任务，甚至对它们产生深度依赖。这不仅极大地提高了我的工作效率，还让我能够探索更多创意的可能性。国内的大模型我主要使用三款，分别是：文心一言、通义千问和豆包。哪家大模型更好用呢？向不同厂商的大语言模型问同一个问题：袁庭新是谁？给我介绍下这个人。看各家AI大语言模型的回答。百度的文心一言（https://yiyan

大语言模型文心一言通义千问百度

袁庭新 2024-10-22

近期资讯

新手指南：轻松注册与使用QQ的详细步骤与技巧

好吧，今天咱们聊聊怎么登QQ。QQ这款软件，很多人都在用，特别是咱们这一代人，几乎是从小就开始玩QQ的。虽然现在有很多社交软件，但是QQ依然有自己的魅力，尤其是在聊天和文件传输方面。

新报观察 2024-12-28

掌握圆柱体积计算的基础与实际应用技巧

圆柱的体积怎么算？这个问题看似简单，但在实际学习和应用中，常常会让人感到困惑。今天，我们就来深入聊聊这个话题，顺便解开一些大家心中的疑惑。首先，让我们先了解一下圆柱的基本概念。圆柱是一种三维几何体，具有两个相同的圆形底面和一个侧面。你可以把它想象成一个喝水的杯子，底部是圆形的，侧面则是杯子的壁。

新报观察 2024-12-28

位置定位技术在日常生活中的应用与未来发展探讨

无论是你出门旅行，还是在城市中寻找某个地方，位置定位都扮演着不可或缺的角色。今天我们就来聊聊位置是怎么定位的，背后的一些原理，以及在生活中是如何应用的。

新报观察 2024-12-28

中国电信获得发明专利授权：“网络拓扑结构优化方法、装置、存储介质与电子设备”

证券之星消息，根据天眼查APP数据显示中国电信（601728）新获得一项发明专利授权，专利名为“网络拓扑结构优化方法、装置、存储介质与电子设备”，专利申请号为CN202210976085.1，授权日为2024年12月27日。专利摘要：本公开提供一种网络拓扑结构优化方法、装置、存储介质与电子设备，涉及网络通信技术领域。

证券之星 2024-12-28

英杰电气获得实用新型专利授权：“一种分体式电容充电电源的控制装置”

证券之星消息，根据天眼查APP数据显示英杰电气（300820）新获得一项实用新型专利授权，专利名为“一种分体式电容充电电源的控制装置”，专利申请号为CN202420939487.9，授权日为2024年12月27日。

证券之星 2024-12-28

豪鹏科技获得发明专利授权：“锂离子电池及电子设备”

证券之星消息，根据天眼查APP数据显示豪鹏科技（001283）新获得一项发明专利授权，专利名为“锂离子电池及电子设备”，专利申请号为CN202411371010.6，授权日为2024年12月27日。专利摘要：本申请涉及一种锂离子电池及电子设备。

证券之星 2024-12-28

如何使用苏泊尔电饭煲的预约功能轻松享受美味米饭

尤其是苏泊尔电饭煲，以其智能化的设计和多功能的特点，受到了很多家庭的喜爱。然后，准备好大米和水。确认设置：设置好时间后，按下“确认”按钮，电饭煲会发出提示音，表示预约时间已经设置成功。

新报观察 2024-12-28

格力电器获得发明专利授权：“空调两器的检测方法、计算机可读存储介质和空调系统”

证券之星消息，根据天眼查APP数据显示格力电器（000651）新获得一项发明专利授权，专利名为“空调两器的检测方法、计算机可读存储介质和空调系统”，专利申请号为CN202411165649.9，授权日为2024年12月27日。专利摘要：本申请提供了一种空调两器的检测方法、计算机可读存储介质和空调系统。

证券之星 2024-12-28

充电器的使用方法与注意事项：提升充电效率与设备寿命的技巧分享

无论是手机、平板、笔记本电脑，还是其他电子设备，充电器都是让这些设备保持活力的关键。今天我们就来聊聊充电器的使用方法、注意事项以及一些小技巧，希望能帮助大家更好地使用这个常见的设备。

新报观察 2024-12-28

中远海特获得发明专利授权：“一种吊装路径规划模型构建方法及系统”

证券之星消息，根据天眼查APP数据显示中远海特（600428）新获得一项发明专利授权，专利名为“一种吊装路径规划模型构建方法及系统”，专利申请号为CN202411298084.1，授权日为2024年12月27日。

证券之星 2024-12-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1