近日,上海人工智能实验室组织了一场AI模型的高考能力测试,涵盖了语文、数学和英语三门科目。
在这次全卷测试中,共有七个AI模型参与,其中包括知名的GPT-4o。测试结果显示,阿里通义千问2-72B以303分的成绩位居榜首,而GPT-4o紧随其后,获得了296分。
虽然各AI模型在语文和英语科目上表现较好,但在数学科目上,它们的平均得分率仅为36%,几乎全军覆没。看来,即便是高级AI系统,在处理复杂的数学问题时也面临挑战。
因此,人类学生在面对数学难题时不必过于自责,不是不努力,而是真的太难了~
机器之心发布机器之心编辑部让考生头皮发麻的高考数学,可难倒了顶尖AI大模型。一年一度的高考即将落幕,衷心希望各位考生都超常发挥,考出满意的好成绩!而在数学考试测试中,除了基本的计算能力、对数学知识的掌握,更能体现大模型在逻辑推理、抽象思维和问题解决方面的高级能力。
AI大模型
机器之心Pro 2024-06-11
具体而言,在满分73分、及格线为43.8分(60%)的情况下,六家大模型产品的分数结果分别为:GLM-4-0520(63分)>智谱清言(43分)>GPT-4o(41分)>豆包(40分)>文心4(30分)=百川…
中国指挥与控制学会 2024-07-10
上海人工智能实验室选取了7个大模型进行高考“语数外”全卷能力测试,结果表明,阿里通义千问2-72B排名第一,GPT-4o排名第二,书生·浦语2.0排名第三。此次评测没有纳入商用闭源模型,仅引入GPT-4o作为评测参考。
人工智能通义千问
教育台 2024-07-04
数据显示,字节豆包在2024高考数学新II卷客观题正确率达到74.66%,在13家大模型中排名首位,阿里千问和GPT-4o分列二三位。在高考数学新I卷评测排名中,字节豆包也排在前列。据悉,LLMeval是由复…
复旦
大力财经V 2024-06-16
OpenAI发布新模型GPT-4o mini,数学能力比GPT-4o强? 北京时间7月19日凌晨,OpenAI 突然宣布了新模型GPT-4o mini,将全面替代GPT-3.5 Turbo。 [图片] OpenAI在今年5月发布了OpenAI公司迄今为止速度最快、综合能力最强,同样也是最贵的GPT-4o模型,而这次发布的GPT-4o mini则是一个规格更小、更便宜的变体,通过兼具“能力和性价比”,拓展低价位市场的竞争。 根据官网展示的价格: GPT-4o mini的商用价格是每百万输入 tokens 0
OpenAI
302AI 2024-07-19
11月27日,安徽省缺陷产品召回管理技术中心官网发布消息称,安徽省含山民生瓷业有限责任公司召回2024年9月9日生产的5″经典玫瑰面碗,涉及数量为6000只。据介绍,本次召回范围内的5″经典玫瑰面碗,因生产工艺把控不严,导致瓷器的抗热震性不稳定,在热冷交替、温度剧变的情况下,瓷器容易开裂、脆断甚至炸裂,可能造成人身伤害等安全隐患。
新京报 2024-12-31
在《列子·汤问》中,“偃师造人”的故事描绘了一位技艺超群的工匠,创造出一个行走自如、以假乱真的人偶。这个古人制造的“机器人”,是人类对机械和人如何实现交融的浪漫想象与大胆尝试。如今,人形机器人已经加速“进化”,即将走出实验室,走进人类的生产生活。2024年被称为人形机器人商业化元年。
证券之星 2024-12-31
小到药企聘任有AI新技术类背景的高管,大到各地拟打造AI医疗高地、国家政策出台,AI医疗融入生活已成为各方面的共同愿景。AI医疗风向如何?答案是不言而喻的。可以看到的是,二级市场已有行动。今年,AI医疗概念股普涨,AI制药板块在近三个月内已从700点左右涨至900点以上。不论投资者用何投票,AI医疗的风口上,早已有人占了席位。
时代周报 2024-12-31
近年来,北大荒农业股份八五九分公司在特色种植农业方面成绩显著,展现出独特的魅力与活力。通过智慧农业云平台和手机APP,种植户可远程控制无人作业机车,实现“智慧农业、无人农机、精准管理”。同时,在科技园区、水稻浸种催芽基地等关键区域安装物联网、视频监测系统,全面提升农业生产效率和智能管控水平。
央广网 2024-12-31
鲁茨科伊说:“在我们看来,2024年中国科学界最令人关注的成就之一是一种新型高温超导体,其超导体积分数高达86%。”今年7月据悉,复旦大学物理系赵俊教授带领的团队发现了上述高温超导体。
俄罗斯卫星通讯社 2024-12-31
2025年新年将至,“国际暗夜社区”深圳西涌再添新游玩项目——由南澳办事处携手AI与3D技术领军企业——元象科技共同打造天文+VR沉浸式体验项目。该项目,对于期待体验宇宙奥秘与高科技融合的天文迷们来说,是一场集娱乐、教育与科技于一体的沉浸式体验,开创虚拟与现实相结合的大湾区文化场馆科普娱乐的创新样板。
深圳商报 2024-12-31
快科技12月31日消息,博主数码闲聊站爆料,联发科将在2025年上半年推出全新的旗舰平台天玑9350,它可以看作是天玑9300+的升级版,由一加手机搭载,硬刚同期上市的骁龙8sElite处理器。
快科技 2024-12-31
近日,第三方数据机构QuestMobile发布了《中国互联网发展年鉴(2024-2025年度核心趋势洞察)》,报告显示,众多企业和开发者与鸿蒙生态深度合作,华为旗下多个原生应用在所属互联网行业MAU排名中位列第一;依托于鸿蒙生态的全场景智慧营销平台——鲸鸿动能,打造多终端全场景生态营销模式,通过“空间音频”式的立体营销,带来全新的营销境界...
澎湃新闻 2024-12-31
2024年12月31日,为加速推动人工智能技术在医疗领域的深度应用,促进海淀区医疗产业数字化转型与高质量发展,百川智能与北京市海淀区卫健委签署战略合作。
北青网 2024-12-31
2024年12月30日,北碚实验幼儿园教育集团举办“色彩中国,蛇舞新春”2025新年庆祝活动。孩子们与“非遗”面对面,在丰富有趣的活动中,感受中华文明的源远流长,坚定文化自信。活动当天,北碚实验幼儿园里处处张灯结彩,目光所及之处均布满新年的色彩,喜庆的装饰充满了浓浓的新年味。
上游新闻 2024-12-31
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1