当前位置：首页|资讯|清华|GPT-4|文心一言|大语言模型

清华大学发布大模型性能报告：GPT-4 第一，文心一言更懂中文

作者：砍柴网发布时间：2023-08-10

清华 GPT-4 文心一言大语言模型

来源：IT之家

近日，清华大学新闻与传播学院教授、博士生导师沈阳所在团队发布了《大语言模型综合性能评估报告》（下文简称 " 报告 "），报告显示总得分率 GPT-4 第一，百度文心一言在三大维度 20 项指标中综合评分国内第一，超越 ChatGPT，其中中文语义理解排名第一，部分中文能力超越 GPT-4。

据了解，报告本次评估选取了 GPT-4、ChatGPT 3.5、文心一言、通义千问、讯飞星火、Claude、天工 7 个大语言模型，围绕生成质量、使用与性能、安全与合规三大维度，全面考察大语言模型上下文理解、中文语义理解、误导信息识别、逻辑推理、内容安全性、隐私保护等 20 项指标。综合来看，文心一言语义理解能力突出，特别是具备更好的中文理解能力，更懂中国文化，同时时效性强、内容安全把握细微，这源于其知识增强、检索增强和对话增强的技术创新。

在生成质量方面，基于对语义理解、输出表达、适应泛化的综合评测，文心一言得分率 76.98%，仅次于 GPT-4，领先于包括 ChatGPT 在内的其他大语言模型。其中，在部分中文语义理解方面，文心一言以 92% 的得分率排名榜首。

IT 之家注意到，在安全合规方面，基于对内容安全性、偏见和公平性、隐私保护等综合评测，文心一言得分率 78.18%，与 GPT-4 并列排名第一。

推荐体验

相关资讯

清华大学发布大模型性能报告：GPT-4第一，文心一言更懂中文

IT之家 8 月 10 日消息，近日，清华大学新闻与传播学院教授、博士生导师沈阳所在团队发布了《大语言模型综合性能评估报告》（下文简称“报告”），报告显示总得分率 GPT-4 第一，百度文心一言在三大

清华 GPT-4 文心一言大语言模型

IT之家 2023-08-10

清华大学发布《大语言模型综合性能评估报告》：GPT-4 第一，文心一言更懂中文

清华大学发布《大语言模型综合性能评估报告》：GPT-4 第一，文心一言更懂中文品玩8月10日讯，近日，清华大学新闻与传播学院教授、博士生导师沈阳所在团队发布了《大语言模型综合性能评估报告》（

清华大语言模型 GPT-4 文心一言

品玩 2023-08-10

清华发布大模型性能报告：GPT-4第一更懂中文的还是百度

快科技8月10日消息，AI大模型成为今年的热点，OpenAI的ChatGPT一马当先，微软、谷歌、Meta紧随其后，国内科技巨头也迅速跟进，现在国内据说已经有上百款大模型问世了。这么多大模型中，实力

清华 GPT-4 ChatGPT 百度 OpenAI

快科技 2023-08-10

清华大学发布3月份大模型评测报告，文心一言4.0表现亮眼

日前，由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架，正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个在海内外具有代表性的模型，结果显示：文心一言4.0表现亮眼，与国际一流模型水平接近，且差距已经逐渐缩小。

清华文心一言

上游新闻 2024-04-22

清华大模型报告：文心一言中文理解、数学等多项能力全球第一

清华大模型报告：文心一言中文理解、数学等多项能力全球第一最近，由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架，正式对外发布2024年3月版《Su

清华文心一言

界面新闻 2024-04-21

近期资讯

华为nova 13系列AI最佳表情评测：人人都是表情管理大师

作为华为专为年轻人打造的时尚手机品牌，每代nova新机上市，都会成为机圈的潮流风向标。最新亮相的华为nova 13系列也不例外，首销日销量即突破11万台，刷新2024年度2000-4000元价位段新纪录。

随心 2024-12-30

最高优惠2500元！华为Mate X5/Pura 70系列等高端手机降价

快科技12月30日消息，华为近期开启了新年礼遇优惠活动，2024年12月20日起至2025年2月16日购买华为手机、平板等多品类产品都有降价优惠。Pura 70系列、Mate X5等多款高端手机也参与其中，华为P

建嘉 2024-12-30

车头“嘶嘶”作响消防员拽出一条2米眼镜王蛇

近日，在西藏林芝市墨脱县发生了一件令人心跳加速的事件。一辆邮政运输车车头出现“嘶嘶”作响的声音，驾驶员通过缝隙发现里面竟然藏有一条大蛇，赶紧报警求助。到达现场后，经

随心 2024-12-30

特朗普变身硅谷之友：马斯克和他的朋友们赢麻了

特朗普当选总统，马斯克和他的硅谷朋友们赢麻了。在马斯克的影响下，曾经视硅谷科技行业为敌人的特朗普正在变成“硅谷之友”，连续任命了诸多资深硅谷人士进入白宫。马斯克助特朗普

2024-12-30

蓝色起源新火箭进行静态点火测试：达成所有既定目标

快科技12月30日消息，据报道，亚马逊创始人杰夫·贝索斯（Jeff Bezos）旗下的航空航天公司蓝色起源（Blue Origin）成功完成新型火箭“新格伦”号的发动机静态点火测试。这是火箭

鹿角 2024-12-30

Epic连续喜加一！88元《兽人必须死3》免费送

快科技12月30日消息，Epic连续喜加一，今天《兽人必须死！3 》免费送，其原价88元，目前Steam冬季大促也要22元。《兽人必须死3》是Robot Entertainment制作发行的一款第三人称动作塔防游戏，2

随心 2024-12-30

限速15km/h！广州电动车新规实施：外卖员哭了还没跑快

快科技12月30日消息，备受关注的《广州市电动自行车管理规定》今日起执行，其中提到对多次违反交通法律法规的电动自行车实行扣车。电动自行车有三次以上交通违法行为记录，车主或驾驶人经公安

雪花 2024-12-30

一图看懂华为智驾“车位到车位”：无需提前记忆首趟就能用

快科技12月30日消息，近日，华为智能汽车解决方案BU官方公布了乾崑智驾ADS 3.0“车位到车位”亮点，据悉，目前搭载华为乾崑ADS 3.0高阶智驾的车型已经陆续开始推送。不同于市面上已

落木 2024-12-30

美吗！世界小姐中国区总冠军诞生：网友直呼美的有气质

12月30日消息，第73届世界小姐中国区总冠军已经诞生，来自淄博的甘容菲脱颖而出。据悉，甘容菲现为中国地质大学（北京）的硕士研究生，她的夺冠之路可谓充满了机缘与坚持。在初次参加形体班后

雪花 2024-12-30

REDMI Turbo 4定档1月2日！首发天玑8400-Ultra

快科技12月30日消息，作为2025年开年第一款新机，REDMI Turbo 4已经正式官宣，将于1月2日14:00发布。王腾此前在联发科发布会上介绍，REDMI Turbo 4将首发天玑8400-Ultra，由REDMI、联发科和Ar

建嘉 2024-12-30

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1