近日,上海人工智能实验室组织了一场AI模型的高考能力测试,涵盖了语文、数学和英语三门科目。
在这次全卷测试中,共有七个AI模型参与,其中包括知名的GPT-4o。测试结果显示,阿里通义千问2-72B以303分的成绩位居榜首,而GPT-4o紧随其后,获得了296分。
虽然各AI模型在语文和英语科目上表现较好,但在数学科目上,它们的平均得分率仅为36%,几乎全军覆没。看来,即便是高级AI系统,在处理复杂的数学问题时也面临挑战。
因此,人类学生在面对数学难题时不必过于自责,不是不努力,而是真的太难了~
机器之心发布机器之心编辑部让考生头皮发麻的高考数学,可难倒了顶尖AI大模型。一年一度的高考即将落幕,衷心希望各位考生都超常发挥,考出满意的好成绩!而在数学考试测试中,除了基本的计算能力、对数学知识的掌握,更能体现大模型在逻辑推理、抽象思维和问题解决方面的高级能力。
AI大模型
机器之心Pro 2024-06-11
上海人工智能实验室选取了7个大模型进行高考“语数外”全卷能力测试,结果表明,阿里通义千问2-72B排名第一,GPT-4o排名第二,书生·浦语2.0排名第三。此次评测没有纳入商用闭源模型,仅引入GPT-4o作为评测参考。
人工智能通义千问
教育台 2024-07-04
具体而言,在满分73分、及格线为43.8分(60%)的情况下,六家大模型产品的分数结果分别为:GLM-4-0520(63分)>智谱清言(43分)>GPT-4o(41分)>豆包(40分)>文心4(30分)=百川…
中国指挥与控制学会 2024-07-10
数据显示,字节豆包在2024高考数学新II卷客观题正确率达到74.66%,在13家大模型中排名首位,阿里千问和GPT-4o分列二三位。在高考数学新I卷评测排名中,字节豆包也排在前列。据悉,LLMeval是由复…
复旦
大力财经V 2024-06-16
OpenAI发布新模型GPT-4o mini,数学能力比GPT-4o强? 北京时间7月19日凌晨,OpenAI 突然宣布了新模型GPT-4o mini,将全面替代GPT-3.5 Turbo。 [图片] OpenAI在今年5月发布了OpenAI公司迄今为止速度最快、综合能力最强,同样也是最贵的GPT-4o模型,而这次发布的GPT-4o mini则是一个规格更小、更便宜的变体,通过兼具“能力和性价比”,拓展低价位市场的竞争。 根据官网展示的价格: GPT-4o mini的商用价格是每百万输入 tokens 0
OpenAI
302AI 2024-07-19
快科技11月17日消息,乐道汽车总裁艾铁成透露,乐道L60的订单已安排至明年一季度,目前总交付量已超过7000辆,目标是12月单月交付量破万,明年3月破两万。他强调,乐道汽车在提升产能的同时,
2024-11-17
11月17日是国际肺癌日。吸烟被公认是肺癌最重要的危险因素,烟草在燃烧过程中会产生多种致癌化学物,比如多环芳烃、芳香族及其胺类、亚硝胺等,烟草本身含有砷、镍、铬等无机致癌物。吸烟除了
快科技11月17日消息,近日,全球知名财经杂志《财富》在其官网上推出了一项AI语音播报功能,有网友发现,其中文朗诵的口音有浓重“河南味”。该AI语音播报功能提供了英语、德语、法
本文首先对hadoop中的核心组件HDFS和MapReduce`进行了深入的分析和介绍,在此基础上我们利用相关知识构建出一个简易版的分布式文件处理程序。希望上述的讲解对你入门理解大数据有所帮助。
毅航 2024-11-17
快科技11月17日消息,据媒体报道,近日全球范围内的苹果用户报告称,他们收到了多年前参与以旧换新计划的iPhone所购买的AppleCare+服务费退款。这些退款涵盖了从iPhone 11 Pro到iPhone 14 Pro
快科技11月17日消息,日前,路特斯CEO冯擎峰接受媒体采访时谈到了出口美国的看法:美国是全球第一大豪车市场,这样的豪车市场我们永远不会放弃,近期路特斯在美国的销量表现也非常好,这也与我
快科技11月17日消息,全新一代MINI COOPER家族已于11月16日正式上市,以进口方式销售。此次上市的包括三门、五门及JCW车型,官方售价区间为23.38-31.08万元,限时礼遇价为20.88-30.58万元。
快科技11月17日消息,星途汽车近日发布了其全新MPV车型星纪元E08的量产版官图。该车型由上海和欧洲的设计团队联合打造,采用“新经典美学”设计理念。星纪元E08的One Box一体
【本文正在参加金石计划附加挑战赛——第一期命题】 在2024年10月8日,Spring AI再次进行了更新,尽管当前版本仍为非稳定版本(1.0.0-M3),但博主将持续关注这些动态,并从流行的智能体视
努力的小雨 2024-11-17
你是否也有过类似的心理状态:明明不想做的事,为了让别人满意,硬着头皮答应了;和其他人交流时小心谨慎,生怕说错了话让别人不开心;日常穿衣服、换发型都要担心自己在别人眼里是不是&l
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1