七大模型全部高考分数出炉：文科能上一本、理科最好是二本

作者：梨花浅歌发布时间：2024-08-12

人工智能 AI大模型阿里巴巴

?七大模型全部高考分数出炉：文科能上一本、理科最好是二本

快科技7月18日消息，日前由上海人工智能实验室旗下司南评测体系OpenCompass，对7个AI大模型进行了高考9个科目的全科目测试，从而能全面评测大模型实力。

此次参与测试的模型分别来自阿里巴巴、零一万物、智谱AI、上海人工智能实验室&商汤、法国Mistral的开源模型，以及OpenAI的闭源模型GPT-4o。

以参加高考人数最多的河南省分数线作为参考，文科成绩最好的AI模型能够达到一本线，而理科成绩最好的模型则只能上二本。

文科状元由阿里通义千问大模型以546分的成绩夺得，而理科状元则是上海人工智能实验室&商汤联合研发的浦语文曲星，得分为468.5分。

OpenAI的GPT-4o在文科上得分531分，排名第三，理科得分为467分，排名第二。

在评测中，AI在文科科目如语文、历史、地理、思想政治等科目上展现了深厚的知识储备和理解能力，但在理科科目中，数理推理能力普遍存在短板。

特别是在面对带图题目时，得分率仅有37.64%，显示出在图片理解和运用能力方面，所有大模型均存在较大提升空间。

阅卷老师指出，尽管大模型在基础知识掌握上表现出色，但在逻辑推理和知识灵活应用方面仍有较大差距。

例如在作答主观题时，大模型常常无法完整理解题干，导致答非所问；在解答数学题时，解题过程机械且逻辑性差。

相关资讯

七大模型全部高考分数出炉：文科能上一本、理科最好二本

快科技7月18日消息，日前由上海人工智能实验室旗下司南评测体系OpenCompass，对7个AI大模型进行了高考9个科目的全科目测试，从而能全面评测大模型实力。此次参与测试的模型分别来自阿里巴巴、

人工智能 AI大模型阿里巴巴

2024-07-18

七款AI大模型“高考成绩”公布：前三名文科过一本，理科过二本

七款AI大模型“高考成绩”公布：前三名文科过一本，理科过二本IT之家2024-07-18 15:01发布于北京IT之家官方账号IT之家 7 月 18 日消息，上海人工智能实验室 17 日公布了针

AI大模型人工智能

IT之家 2024-07-18

豆包文科成绩超了一本线，为什么理科不行？

……从结果中来看，GPT-4o的表现依旧是处于领先状态，而在国产大模型这边，比较亮眼的成绩便属于豆包了。对于国产大模型在未来的发展，我们还需保持持续的关注；但毋庸置疑的一点是，字节的大模型和豆包，定然是最值得…

量子位 2024-07-05

大模型2024高考发榜，豆包等三款国产AI考上文科一本线

本次大模型高考评测与河南省考卷完全相同，河南高考录取分数线显示，文科本科一批录取分数线为521分，豆包等三款国产AI成功冲上一本线。在阅读和语言运用两大项客观问题的考试上，GPT-4o、百小应、通义千问获得8…

通义千问

鞭牛士 2024-06-25

当大模型开始「考上」一本

在此次数学测试中，通义千问和智谱清言由于在PC端产品加入了代码解释器，因此在解题过程中常常陷入死循环，从数学单科分数上看，这也一定程度上拖累了其数学得分。满分90分的生物试卷，表现最优秀的文心4.0和通义千问…

通义千问编程

极客公园 2024-06-26

近期资讯

搞种植、养殖火了之后，为啥这档节目搞农人创业却不行了？

农业综艺年年有，今年似乎特别多。

读娱 2024-12-26

销售面积回到2009年，现房销售还有多远？

持续用力推动房地产市场止跌回稳

丁祖昱评楼市 2024-12-26

抖音推出送礼物红包，大厂再次上演红包大战？

赠送商品礼物“红包”功能挑战传统电商。

Tech星球 2024-12-26

投10个亿，支付宝做短剧，重走拼多多的路？

2024年已经进入倒计时，支付宝想要的内容化实现了吗？

DataEye 2024-12-26

城投公司热烈“拥抱”长租公寓！

城投下场做公寓，谨记相关“注意事项”

空间秘探 2024-12-26

腾B国产动画，其实殊途同归

两种道路，一种未来

犀牛娱乐 2024-12-26

媒体称《双城之战》营收未达预期，拳头回应：短视的人看不懂

“很多人认为我们做这个是为了卖皮肤，但事实恰恰相反。”

手游那点事 2024-12-26

DataEye海外短剧热榜：海外上新进入“瓶颈期”？惊悚、反杀、报复……这一地区最爱“黑暗风”

海外数据独家发布！

DataEye 2024-12-26

大润发和沃尔玛开始走便利店的路了

一切围绕便利、品质、高效展开。

零售商业财经 2024-12-26

票价炒到7.7万，花24万买周边，中老年挤爆刀郎演唱会

“钞能力”碾压年轻人，中老年追星也疯狂。

Tech星球 2024-12-26

七大模型全部高考分数出炉：文科能上一本、理科最好是二本

推荐体验

相关资讯

七大模型全部高考分数出炉：文科能上一本、理科最好二本

七款AI大模型“高考成绩”公布：前三名文科过一本，理科过二本

豆包文科成绩超了一本线，为什么理科不行？

大模型2024高考发榜，豆包等三款国产AI考上文科一本线

当大模型开始「考上」一本

近期资讯

搞种植、养殖火了之后，为啥这档节目搞农人创业却不行了？

销售面积回到2009年，现房销售还有多远？

抖音推出送礼物红包，大厂再次上演红包大战？

投10个亿，支付宝做短剧，重走拼多多的路？

城投公司热烈“拥抱”长租公寓！

腾B国产动画，其实殊途同归

媒体称《双城之战》营收未达预期，拳头回应：短视的人看不懂

DataEye海外短剧热榜：海外上新进入“瓶颈期”？惊悚、反杀、报复……这一地区最爱“黑暗风”

大润发和沃尔玛开始走便利店的路了

票价炒到7.7万，花24万买周边，中老年挤爆刀郎演唱会

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响