当前位置：首页|资讯|人工智能|AI大模型

如果让大模型参加高考能上哪所大学？7款大模型高考总分公布

作者：驱动中国发布时间：2024-07-20

人工智能 AI大模型

日前，上海人工智能实验室以模拟中国高考环境来精确衡量大模型的实际能力，发布了针对七款先进AI大模型的高考模拟测试评估。本次评估依据“司南”评测体系，测试涉及今年高考全科目考核，涵盖了图文并茂的复杂试题，以实现对模型综合能力的全面检验。

参与此次“高考”的大模型阵容强大，除了书生·浦语2.0系列文曲星大模型、阿里通义千问大模型Qwen2-72B与GPT-4o之外，还有来自零一万物的Yi-1.5-34B、Qwen2-57B、智谱的GLM-4-9B以及法国初创企业Mistral的Mixtral 8×22B。所有模型均在高考前公开发布，有效避免了潜在的信息泄露。

在评测过程中，特别邀请了具有丰富高考阅卷经验的教师进行评分，确保评分标准与真实高考尽可能一致。此外，整个测试流程及其结果，包括模型生成的答案代码与最终评分，均对外公开，以确保透明度与公正性。

评估结果显示，综合科目考量下，阿里通义千问Qwen2-72B、GPT-4o与浦语文曲星位列文、理科成绩前三，其中Qwen2-72B以546分摘得文科桂冠，浦语文曲星则以468.5分在理科中领先，二者成绩均超越了非开源的国际模型GPT-4o，而国外的Mixtral 8×22B在平均得分上垫底。

从分数上来看，以今年高考人数最多的河南省的分数线为参考，前三名 AI“考生”的文、理科成绩分别超过了“一本”“二本”线。

然而，尽管AI大模型在基础知识点掌握上表现优秀，但在逻辑推理和知识灵活运用上的不足依旧明显。阅卷教师指出，大模型在处理主观题时，常因未能精准理解题意而导致答非所问；在解决数学问题时，缺乏逻辑连贯性，尤其在几何领域，常作出违背空间逻辑的判断；对物理、化学实验的理解浅薄，难以正确辨识和应用实验设备。

此外，大模型还暴露出伪造虚构内容的倾向，如编造不存在的诗词，即使出现明显的计算失误也不进行自我修正，直接给出猜测答案，这些问题给阅卷工作带来了一定的挑战。

推荐体验

相关资讯

未经训练的ChatGPT参加高考能上211？

ChatGPT参加北京高考，会得多少分，能考上哪所大学？人大附中李永乐老师从2022年的北京高考试卷中选择了一部分，对ChatGPT做了一次高考实验。内容涉及理科的物理、生物，文科的历史、政治，也

书圈 2023-03-09

记者实测：如果ChatGPT参加高考，它能得几分？

似乎在一夕之间，OpenAI发布的一款聊天机器人程序ChatGPT（Chat Generative Pre-trained Transformer）再次火爆全网，短短几天之内，ChatGPT参加了美国高校的入学资格考试（SAT）、简要阐释了经济学理论、用《老友记》主角口吻创作了剧本对白、与人类日常对话等。ChatGPT真的那么全能吗？如果ChatGPT参加中国高考，它的通关...

正观新闻 2023-02-10

如果ChatGPT参加高考，它能得几分？记者实测

似乎在一夕之间，OpenAI发布的一款聊天机器人程序ChatGPT（ChatGenerativePr

正观新闻 2023-02-11

如果人工智能参加高考，能考多少分？

事实上，人工智能这两年还真有模拟参加过高考，科大讯飞就有做过「让机器人参加高考，并考上重点大学」的项目，这个项目投入两年后，最终的进展：在今年的高考中，辽宁省普通高考就使用人工智能(AI)技术进行考试疑似违…

人工智能科大讯飞

十次方 2023-03-06

大模型扎堆参加高考作文，百度、讯飞、ChatGPT哪家强？

大模型扎堆参加高考作文，百度、讯飞、ChatGPT哪家强？ 6月7日，2023年高考正式开考。伴随考试的进行，2023年高考作文题陆续公布。相较于往年网友热议，今年新加了一批场外参与者——人工智

第一财经 2023-06-07

近期资讯

vivo S20系列——美的见证者，自拍与摄影的双重盛宴

在手机影像技术日新月异的今天，vivo S20的推出无疑为摄影爱好者带来了新的惊喜。作为S系列的最新成员，它在影像方面进行了全方位升级，通过旗舰级影像系统和先进算法优化带来旗舰级的拍摄体验。不仅拥有旗舰级性能，影像实力也很强。下面来看看详细情况。vivo S系列创新了多巴胺live动态照片功能，不仅能够记录笑容形成的全过程，捕捉更多情境细节，还能自动为Live内容生成精美的照片边框。可以在抖音、微博、小红书、美图秀秀、美颜相机等平台分享，方便快捷地展现自己的精彩瞬间。另外还有一拍得胶片功能，四套

黑米评测 2024-12-25

一汽-大众汽车有限公司领导班子成员调整

根据工作需要，经中国一汽研究决定，自2024年12月25日起：潘占福同志不再担任一汽-大众董事、党委书记、总经理，调回中国一汽工作，中国第一汽车集团有限公司党委常委、副总经理陈彬同志兼任一汽-大众党委书记、总经理；聂强同志任一汽-大众党委副书记、工会负责人，不再担任一汽-大众副总经理（商务）及销售公司总经理、党委书记，吴迎凯同志接替聂强同志担任一汽-大众副总经理（商务）及销售公司总经理、党委书记。潘占福同志任职期间，汽车产业正值加速变革、乘势而上的新发展阶段。面对芯片严重短缺、新冠疫情反复、多轮价格战等

有事郝说 2024-12-25

不是我说，ColorOS也太懂用户了吧！

不是我说，ColorOS也太懂用户需要什么了吧！临近农历新年，大家肯定要准备年货啥的，但有时工作太忙真的很容易忘记，不过ColorOS 15最近的十二月更新就新增了日历生日/倒数日/纪念日桌面卡片，每天都能看到还剩多少天过年，这样就完全不怕忘记啦。准备过年去旅游的朋友，新增的水印大师也不要忘记用起来，可以给照片、视频添加个性化水印，看上去更有美感。而旅行过程中拍到好看的照片想分享给身边用iPhone的家人、朋友，更新之后也可以用一碰互传，两台手机碰一碰就行，还有新增的手电筒流体云也更方便了。所以大家如果收

糖果公主289 2024-12-25

“阴离子在胶体”中高可逆锌金属阳极的深共晶电解质

[图片] 研究内容作为水系电池有前景的阳极材料，锌金属由于严重的锌枝晶、阴离子相关副反应、析氢反应（HER）以及狭窄的电化学稳定窗口（ESW）而受到限制。为此，设计了一种“胶体中阴离子”的水合深共晶电解质，该电解质由Zn(ClO ) · 6H O、β4 2 2环糊精（β-CD）和H O组成，质量比为7:4.5:3（ACDE-3），以提高锌阳极的稳定性。ACDE-3重新配置了氢键（HB）网络并调节了溶剂化壳。更重要的是，ACDE-3中的羟基丰富的β-环糊精（β-CDs）自组装成胶束，在这些胶束中，相邻β

知行剑侠 2024-12-25

智慧出行进景区：无人驾驶观光车开启新“蓝海”？

未来无人驾驶观光车的成本或将下降至20万元以内。文｜低速无人驾驶编辑部近年来，随着旅游业的持续发展和游客出行方式的不断演变，景区交通工具正迎来一场深刻的变革。特别是无人驾驶作为一项集人工智能、大数据、物联网、云计算等前沿技术于一体的高精尖技术，助力智能出行的重大突破，为景区交通提供了丰富多样的解决方案。作为这场变革的先锋，无人驾驶观光车以其先进的技术、卓越的性能和广泛的适应性，在全国各大景区快速落地应用。这一技术不仅推动了交通管理方式的创新，还为景区经营带来了新的商业机会。顺势而为，智慧出行的时代已然到

低速无人驾驶产业联盟 2024-12-25

OPPO A5 Pro上手有多爽？超低温也能爽玩，最强信号红包抢到手软

距离2025年没几天了，没想到OPPO在这个时候还能掏出一款耐用性拉满的机型。要知道，每年冬天一到日常用机就会出现各种问题，尤其是在严寒的北方，不只是冻手，低温导致的充电过慢、电量消耗过快、卡顿、死机等等状况既影响了用机体验，又会降低手机的使用寿命，而这个时候OPPO A5 Pro的出现就很合时宜了。这回直接上手OPPO A5 Pro，给大伙讲讲它的实际体验到底如何。（OPPO A5 Pro）OPPO A5 Pro最出名的就是行业领先的满级防水2.0，据说能防得住包含碳酸饮料、清洁泡沫、肥皂水等等在内的十

快乐小丑0 2024-12-25

来了！BWOS元响 2024MECA中国真实全景声品鉴会

由BWOS元响独家冠名的2024年MECA中国真实全景声品鉴会将于12月28-29日在广州白云国际会展中心举行。本次品鉴会聚焦“全景声”这一前沿音频技术，将在现场全面展现全景声技术在车载与家庭影音领域的极致魅力。 [图片] 亮点一、体验全球首款真实全景声音响改装车 28日，品鉴会将展出由元响设计的全球首款真实全景声音响改装车，其通过先进的音频解析技术与精心设计的音响布局，实现了远超原装车的空间穿越感。亮点二、元响车载主机首次亮相 28日，元响车载全景声主机将在品鉴会上首次曝光。这款主机具备全车型真全景声

元响 2024-12-25

【学员见证】王兴宇老师2024年押题神准

? 2024年的成绩揭晓啦！ ? 亲爱的小伙伴们，大家好！我是你们的王兴宇老师。每一年，我都致力于帮助每一位学员实现他们的目标，而2024年也不例外。这一年，我与一群非常努力、充满热情的学员一起度过了许多难忘的学习时光。 ? 来看看我们共同创造的成绩吧！以下是一些学员在取得优异成绩后，对我表达的感激之情。这些不仅是对我的认可，更是对我们共同努力的最好证明。感谢每一位同学的信任和支持，是你们让我更加坚定地走在教育这条道路上。 [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片]

王老师造价学院 2024-12-25

天冷玩手机怕冻手？OPPO A5 Pro真实体验，手套模式完全不在怕

都已经年末了怎么OPPO还这么努力，ColorOS 15带来新的升级功能不说，现在又是发布了OPPO A5 Pro，真的是一波惊喜接一波啊。OPPO的A系列一直都是非常的抗摔耐用，这次新机也不列，不过对于这台新机子的实际体验，大家应该还不是非常了解吧，今天就带大家看看OPPO A5 Pro实际上手体验是什么感受。（OPPO A5 Pro真机上手）说到耐用大家先想到的肯定是手机电量吧，OPPO A5 Pro内置了一块6000mAh的大容量电池，支持80W有线快充技术。我实测在重度使用情况下，手机依然能够保持

八月长安果 2024-12-25

中国专利答审 | 审查背后的逻辑 - 审查员为什么大量使用公知常识

熟悉中国专利答审的读者都知道，针对公知常识的审查意见，申请人有权利要求审查员提供证据。既然如此，为什么审查员还是会大量使用公知常识作为评述理由，而不是直接给出证据呢？想要弄清楚这一问题，就需要剖析公知常识背后的审查逻辑。 01为什么大量使用公知常识？根据《审查指南》第二部分第四章3.2.1.1节，中国审查员在判断创造性时，是需要遵循“三步法”的：步骤1、确定最接近的现有技术；步骤2、确定发明的区别特征和发明实际解决的技术问题；步骤3、判断要求保护的发明对本领域的技术人员来说是否显而易见。其中，针对步骤3，

知产观察力 2024-12-25

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1