GPT-4用四个高考数学题就彻底打败国内大模型

作者：书圈发布时间：2024-06-19

GPT-4

做了4个高考数学题，GPT-4就完胜国内大模型Kimi和智谱清言，GPT-4得分100，Kimi得分25，智谱清言得分50，而且GPT-4性能好（速度快），逻辑清楚。

下面就让我们逐一看看这四个数学题，它们是如何分析和答题的。

（第1题都答对了，正确答案是A）

（第2题，国内两大模型都答错了，纠正Kimi几次，都答不对，答了A、B、D；正确答案是C）

（第3题，Kimi答错了，智谱清言答对了，正确答案是D）

（第4题，Kimi答错了，智谱清言干脆不答了，正确答案是A）

相关资讯

讯飞AI大模型“领跑国内”？做数学题堪比GPT-4！

前两天，科大讯飞开了场发布会。在这个时段开发布会的互联网公司，大家用脚指头想，都能想到，发布的肯定又是一个大模型了。一开始我还没太在意，结果今天转头就看到科大讯飞在发喜报了。

AI大模型 GPT-4 科大讯飞

2023-05-11

林达华：国内大模型与GPT-4的差距是“高考数学最后一题”

林达华：国内大模型与GPT-4的差距是“高考数学最后一题” 国内头部大语言模型与ChatGPT、GPT-4相比，孰强孰弱？多模态大模型的技术发展趋势是什么？昨天（3月24日）举行的2024

GPT-4 ChatGPT 大语言模型

上观新闻 2024-03-25

近期资讯

影像灭霸2.0！vivo X200 Ultra发布时间曝光：硬刚苹果

快科技12月25日消息，博主数码闲聊站爆料，vivo X200 Ultra最快会在3月登场，最晚是4月发布。与X200和X200 Pro相比较而言，X200 Ultra最大变化之一是搭载高通骁龙8至尊版移动平台，是vivo最强

振亭 2024-12-25

乒乓球竟不能带上火车没错但说对了一半

快科技12月25日消息，近日，一位乒乓球爱好者在过安检时被告知其携带的乒乓球不能带上车。这引起了不少人的疑问：乒乓球这么小巧圆润的东西，为何不能上火车呢？中国铁路官方对此进行了科

随心 2024-12-25

心里烦就打12356！

内心烦恼，无人倾诉？现在好了，你可以直接拨打“12356”，咨询心理健康的相关知识，自有人替你排忧解难。据国家卫生健康委，12356是全国统一心理援助热线电话号码，向群众提供更加

上方文Q 2024-12-25

乘联会：12月1-22日乘用车市场零售169.2万辆新能源近50%

快科技12月25日消息，根据乘用车市场信息联席会（乘联会）的最新数据。今年12月1日至22日，乘用车市场零售量达到169.2万辆，较去年同期增长25%，与上月同期相比增长14%。今年以来，累计

王略 2024-12-25

前11月MPV销量榜：别克GL8王者归来超赛那、腾势D9夺第一

快科技12月25日消息，易车榜基于终端销量数据整理，发布了今年1-11月国内MPV累计销量排行榜。榜单显示，别克GL8系列王者归来，前11月累计销量80096辆，超过丰田赛那和腾势D9，成为国内MPV销冠

若风 2024-12-25

2025年什么样的车企才能活下来

2024年的新能源汽车市场给了我们太多的惊喜和无奈。随着哪吒汽车换帅、极越汽车“原地解散”等消息爆出，给2024年的汽车行业带来了更多的不确定性，新造车的年关注定难过。2024上

2024-12-25

九州风神推出FL12R系列机箱反叶风扇：36颗第二代ARGB灯珠

快科技12月25日消息，据报道，九州风神宣布推出FL12R系列机箱反叶风扇，提供了黑色和白色版本。售价139元起。FL12R机箱反叶风扇搭载了36颗第二代ARGB灯珠，环绕在扇叶周围，带来了全新渐变环绕

鹿角 2024-12-25

柔宇资产二拍降价2.5亿又流拍！每月维护费用都要500万

快科技12月25日消息，柔宇显示公司资产12.3亿元起拍流拍后，又进行了降价二拍，起拍价仅9.8亿，目前已经结束，再次流拍。从目前的状况来看，下一次拍卖将进一步降价，这也算是正常的拍卖流程。

建嘉 2024-12-25

涨薪30%之后京东再给2万名员工涨工资：全员平均涨薪2个月

快科技12月25日消息，据国内媒体报道，京东集团宣布，再次升级客服人员薪酬福利。据了解，超2万名京东客服月固定工资将大幅提升，实现全员平均涨薪2个月。这也是继今年2月京东客服全员平均涨薪

朝晖 2024-12-25

OPPO A5 Pro上手：防水性能离谱

在OPPO丰富的手机产品线中，A系列作为入门款机型，一直以耐用为核心竞争力，深受消费者喜爱。如今，OPPO A5 Pro正式发布，官方称其首发耐用科技3.0，在防水、抗摔、耐用等方面实现了重大突破，被

2024-12-25

GPT-4用四个高考数学题就彻底打败国内大模型

推荐体验

相关资讯

讯飞AI大模型“领跑国内”？做数学题堪比GPT-4！

林达华：国内大模型与GPT-4的差距是“高考数学最后一题”

韦神出初中数学题难倒ChatGPT-4 ？编程都行，初中数学题不行？

“韦神”出数学题，GPT-4挑战失败，初二学生给出标准答案！

看国内外各大AI表演计算小学数学题。

近期资讯

影像灭霸2.0！vivo X200 Ultra发布时间曝光：硬刚苹果

乒乓球竟不能带上火车没错但说对了一半

心里烦就打12356！

乘联会：12月1-22日乘用车市场零售169.2万辆新能源近50%

前11月MPV销量榜：别克GL8王者归来超赛那、腾势D9夺第一

2025年什么样的车企才能活下来

九州风神推出FL12R系列机箱反叶风扇：36颗第二代ARGB灯珠

柔宇资产二拍降价2.5亿又流拍！每月维护费用都要500万

涨薪30%之后京东再给2万名员工涨工资：全员平均涨薪2个月

OPPO A5 Pro上手：防水性能离谱

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响