当前位置：首页|资讯|阿里巴巴|OpenAI|人工智能

AI高考能考几分？

作者：浮生若夢_Dream发布时间：2024-06-21

阿里巴巴 OpenAI 人工智能

观看本文视频，请点击此处

6月最重要的一件事就是高考，全国人民不管是学生还是家长。都被这场考试牵动着心弦，多少人十年寒窗苦读，为的就是这一天。如果让 AI 参加高考，他们能考多少分呢？

先介绍一下参加本次考试的6位AI考生：阿里巴巴、零一万物、智谱AI、上海人工智能实验室、法国Mistral的开源模型，以及OpenAI的闭源模型GPT-4o。

今年的高考后，司南评测体系OpenCompass选取了6款AI大模型，进行了语文、数学和英语的全卷能力测试。

为了确保评测的公正性，评测团队特别选择了开源模型，并且仅以GPT-4o作为商用闭源模型的参考。这种选择不仅保证了评测过程的透明度，也避免了利用高考试题训练模型的可能性，有效防止了“作弊”行为的发生。此外，为了保证结果的真实性和可信度。这次评测采用了全国新课标1卷，确保考试的“闭卷”性，成绩则由经验丰富的高考评卷教师进行人工评分。

现在公布考试成绩，我们一起来看看各位AI考生到底考了多少分？

语数外三科加起来的满分为 420 分，在本测试中，阿里巴巴的Qwen2-72B以303分稳居榜首，紧随其后的是OpenAI的GPT-4o，取得了296分。以0.5分微弱差距位列第三的是上海人工智能实验室的书生浦语2.0，总分295.5。评测结果显示，大模型在语文和英语方面普遍表现优异，尤其是阿里巴巴的Qwen2-72B和OpenAI的GPT-4o在这两科目上有着显著的成绩。然而，让人略感意外的是，这些大模型在数学推理能力上普遍显得力不从心。最高分仅为75分，由书生浦语2.0文曲星获得，GPT-4o的数学成绩也仅为73分。

阅卷老师点评指出，大模型在语文科目上对于一些语言中的“潜台词”还难以完全理解。而在数学科目上，大模型在回答主观题时表现得相对凌乱，其解题过程也往往令人困惑。

这场“AI高考”不仅让我们看到了AI技术的进步与潜力，也揭示了其在复杂推理能力上的短板。未来的挑战与机遇并存，让我们拭目以待，期待这些“AI学霸”们能在下次考试中取得更好的成绩。

点击观看此视频

推荐体验

相关资讯

ChatGPT：高考写诗，能得几分？

高考学子，奋笔疾书，ChatGPT也不甘落后，今日参加高考答题，赋诗一首《心跳得那么快》。这样的小作文，你们觉得ChatGPT能得几分？

文科妹儿聊科技 2023-06-07

如果人工智能参加高考，能考多少分？

事实上，人工智能这两年还真有模拟参加过高考，科大讯飞就有做过「让机器人参加高考，并考上重点大学」的项目，这个项目投入两年后，最终的进展：在今年的高考中，辽宁省普通高考就使用人工智能(AI)技术进行考试疑似违…

人工智能科大讯飞

十次方 2023-03-06

AI 写的高考作文，你打几分？

又是一年高考时，高考真的是人生的一件大事，毕业这么多年，每次看到高考相关信息，还是会不由自主的点进来，其中语文的作文是每年大伙津津乐道的话题。树先生今天就收到了某条小秘书的【邀请函】，邀请参与「2023 头条高考作文大赛」，树先生是个典型的理工男，文笔实在是不行，以往看到这些消息，都是直接掉~但今年，AI 发展的如火如荼，树先生决定携手 ChatGPT、Claude、文心一言、星火等一众大语言模型追梦高考，回忆青春。（有点装到了，说白了，测测这几个大模型写作文的水平~）选题树先生是安徽人，所以就选安徽高考

ChatGPT Claude 文心一言大语言模型

程序员树先生 2023-06-08

假如ChatGPT也参加高考，你能考得过它吗？

本图来源于网络，如有侵权请联系删除

OSC开源社区 2023-03-01

AI大模型写高考作文，你给打几分？

AI大模型写高考作文，你给打几分？如果我让它写一篇“零分作文”，它也能出色地完成任务。撰文田思奇《看天下》杂志原创出品每年高考后，全网都会热议全国卷及各省市的高考作

Vista成长实验室 2023-07-09

近期资讯

手心输入法更新：自动下载360是三年前遗留

快科技12月29日消息，手心输入法在前不久时隔六年后发布了Windows端v3.1版更新，不过此次更新却引发了用户热议。根据用户反馈，新版本似乎会自动下载360弹窗过滤器，这一行为与手心输入法此前

2024-12-29

宁德时代回应减产磷酸铁锂电池：消息不实需求依旧旺盛

快科技12月29日消息，宁德时代近日对网上关于其计划减少磷酸铁锂产量的传言进行了辟谣，称这些传闻不属实。公司表示，目前新能源市场需求旺盛，宁德时代与供应商保持着良好的合作关系，共同推

2024-12-29

韩国载181人客机起火爆炸：179人遇难 2人生还

快科技12月29日消息，据央视最新报道，韩国全罗南道消防厅在务安机场，对济州航空7C2216航班乘客家属表示，事故客机上除2人幸存以外，其余人员全部遇难。此前消息称有3名获救人员，但其中1人已

2024-12-29

韩国载有181人客机失事起火：机型为波音737-800 机龄15年

快科技12月29日消息，综合央视等报道，当地时间今日上午9时7分左右，一架韩国济州航空飞机在全罗南道的务安国际机场降落过程中偏离跑道，撞上机场围墙后起火。视频发生事故的飞机是从泰国曼

2024-12-29

雷克萨斯行驶中起火烧成壳！女车主：起火后全车车标被扣走

快科技12月29日消息，日前，有雷克萨斯女车主发布视频维权称，自己的车辆质保期内行驶中起火，事故发生后全车车标被扣走，4S店对起火一事不管不问。女车主介绍，这辆混动雷克萨斯UX 260H是去年

2024-12-29

资深机长解读韩国737客机失事原因：机长竟然没放起落架！

快科技12月29日消息，29日上午9时7分许，由泰国曼谷起飞的济州航空7C2216号航班在位于全罗南道的务安机场降落时坠落，和机场围栏等发生碰撞后起火爆炸，机上有175名乘客和6名机组人员，共计181人

2024-12-29

鸿蒙 ArkUI实现地图找房

常用的地图找房功能，是在地图上添加区域、商圈、房源等一些自定义 marker，然后配上自己应用的一些筛选逻辑构成，在这里使用鸿蒙 ArkUI 简单实现下怎么添加区域/商圈、房源等 Marker.

儿歌八万首 2024-12-28

今晚开播：比亚迪王传福与科大讯飞刘庆峰同台科晚盛典

快科技12月29日消息，央视官方今日宣布，由总台社教节目中心精心筹备的首届《中国科技创新盛典》将于12月29日晚22:30在CCTV-1首播，并于12月30日晚20:30在CCTV-10重播。作为科技企业的杰出代表

2024-12-29

雷军挖了个95后天才少女“AI小萝莉”：开出千万年薪

快科技12月29日消息，小米在大模型赛场，频频按下快进键。先是，“雷军亲自重金挖人，开出千万年薪”的风传。据国内媒体报道，雷军开出千万年薪招揽了一位95后AI天才少女—&

2024-12-29

JavaScript 的作用域

简单来说，作用域就是变量和函数的可访问性和生命周期。它决定了在哪些地方可以访问到某个变量或函数。你可以把它想象成一个“地盘”，变量在这个地盘里有效，出了这个地盘就可能无效或者访问不到了。

KeepCatch 2024-12-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1