近日,上海人工智能实验室组织了一场AI模型的高考能力测试,涵盖了语文、数学和英语三门科目。
在这次全卷测试中,共有七个AI模型参与,其中包括知名的GPT-4o。测试结果显示,阿里通义千问2-72B以303分的成绩位居榜首,而GPT-4o紧随其后,获得了296分。
虽然各AI模型在语文和英语科目上表现较好,但在数学科目上,它们的平均得分率仅为36%,几乎全军覆没。看来,即便是高级AI系统,在处理复杂的数学问题时也面临挑战。
因此,人类学生在面对数学难题时不必过于自责,不是不努力,而是真的太难了~
机器之心发布机器之心编辑部让考生头皮发麻的高考数学,可难倒了顶尖AI大模型。一年一度的高考即将落幕,衷心希望各位考生都超常发挥,考出满意的好成绩!而在数学考试测试中,除了基本的计算能力、对数学知识的掌握,更能体现大模型在逻辑推理、抽象思维和问题解决方面的高级能力。
AI大模型
机器之心Pro 2024-06-11
具体而言,在满分73分、及格线为43.8分(60%)的情况下,六家大模型产品的分数结果分别为:GLM-4-0520(63分)>智谱清言(43分)>GPT-4o(41分)>豆包(40分)>文心4(30分)=百川…
中国指挥与控制学会 2024-07-10
上海人工智能实验室选取了7个大模型进行高考“语数外”全卷能力测试,结果表明,阿里通义千问2-72B排名第一,GPT-4o排名第二,书生·浦语2.0排名第三。此次评测没有纳入商用闭源模型,仅引入GPT-4o作为评测参考。
人工智能通义千问
教育台 2024-07-04
数据显示,字节豆包在2024高考数学新II卷客观题正确率达到74.66%,在13家大模型中排名首位,阿里千问和GPT-4o分列二三位。在高考数学新I卷评测排名中,字节豆包也排在前列。据悉,LLMeval是由复…
复旦
大力财经V 2024-06-16
OpenAI发布新模型GPT-4o mini,数学能力比GPT-4o强? 北京时间7月19日凌晨,OpenAI 突然宣布了新模型GPT-4o mini,将全面替代GPT-3.5 Turbo。 [图片] OpenAI在今年5月发布了OpenAI公司迄今为止速度最快、综合能力最强,同样也是最贵的GPT-4o模型,而这次发布的GPT-4o mini则是一个规格更小、更便宜的变体,通过兼具“能力和性价比”,拓展低价位市场的竞争。 根据官网展示的价格: GPT-4o mini的商用价格是每百万输入 tokens 0
OpenAI
302AI 2024-07-19
软件,承载了无数人的青春记忆。在这个信息快速传播的时代,保持软件的更新和升级变得尤为重要。升级不仅可以让你享受到最新的功能,还能提高安全性,修复一些潜在的bug。那么,QQ怎么升级呢?接下来,我就来给大家详细说说。首先,升级的方式其实挺简单的。你可以在手机应用商店里找到QQ,直接点击更新按钮。
新报观察 2024-12-30
说到安装当贝市场,步骤其实并不复杂,但对于一些不太熟悉智能电视操作的朋友,可能会觉得有点儿棘手。值得一提的是,虽然当贝市场提供了丰富的资源,但在使用过程中,安全性也是一个需要关注的问题。
在现代的演示文稿制作中,动图(GIF)作为一种生动有趣的视觉元素,越来越受到大家的欢迎。无论是在商务汇报、学术演讲,还是在朋友聚会分享中,插入动图都能让你的PPT显得更加生动,更能吸引观众的注意力。如果你还不知道怎么在PPT中插入动图,没关系,接下来我会一步步教你,让你的演示文稿焕发新的活力。
水印在我们的日常生活中越来越常见,无论是摄影作品、设计图,还是视频内容,水印的作用不仅仅是为了美观,更是为了保护原创作品,避免被盗用。那么,如何给自己的作品加水印呢?
根据不同的品牌和型号,充电接口可能是MicroUSB、Type-C或者专用接口,具体要看你手上那款鼠标的说明书,找到合适的充电线。充电时,鼠标的指示灯通常会有变化,常见的情况是充电时指示灯会亮起,有的鼠标在充电时会显示不同的颜色来指示电量状态。
在日常生活中,无论是写论文、撰写报告还是编写书籍,目录都是一个不可或缺的部分。那么,目录到底是怎么生成的呢?
很多人都在微信上建立了群聊,不论是为了工作、学习,还是单纯的兴趣交流,微信群的作用不可小觑。那么,微信怎么建群呢?
无论是工作上的讨论,还是朋友间的聚会安排,微信群都发挥着不可或缺的作用。微信群主要分为两种:一种是你自己创建的群,另一种是别人创建的群。
锂电池,这个词在我们的生活中越来越常见。它们的出现,彻底改变了我们的生活方式,让我们享受到了更便捷的科技体验。那么,锂电池到底怎么样呢?相比于传统的铅酸电池,锂电池的充电速度快得多。
无论是短视频平台上那些精彩的剪辑,还是YouTube上长篇的深度内容,视频不仅是我们获取信息的渠道,更是我们表达自我的一种方式。
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1