GPT-4用四个高考数学题就彻底打败国内大模型

作者：书圈发布时间：2024-06-19

GPT-4

做了4个高考数学题，GPT-4就完胜国内大模型Kimi和智谱清言，GPT-4得分100，Kimi得分25，智谱清言得分50，而且GPT-4性能好（速度快），逻辑清楚。

下面就让我们逐一看看这四个数学题，它们是如何分析和答题的。

（第1题都答对了，正确答案是A）

（第2题，国内两大模型都答错了，纠正Kimi几次，都答不对，答了A、B、D；正确答案是C）

（第3题，Kimi答错了，智谱清言答对了，正确答案是D）

（第4题，Kimi答错了，智谱清言干脆不答了，正确答案是A）

相关资讯

讯飞AI大模型“领跑国内”？做数学题堪比GPT-4！

前两天，科大讯飞开了场发布会。在这个时段开发布会的互联网公司，大家用脚指头想，都能想到，发布的肯定又是一个大模型了。一开始我还没太在意，结果今天转头就看到科大讯飞在发喜报了。

AI大模型 GPT-4 科大讯飞

2023-05-11

林达华：国内大模型与GPT-4的差距是“高考数学最后一题”

林达华：国内大模型与GPT-4的差距是“高考数学最后一题” 国内头部大语言模型与ChatGPT、GPT-4相比，孰强孰弱？多模态大模型的技术发展趋势是什么？昨天（3月24日）举行的2024

GPT-4 ChatGPT 大语言模型

上观新闻 2024-03-25

近期资讯

巩义网站建设：如何打造一个成功的企业网站

巩义网站建设是企业发展中至关重要的一环。一个成功的企业网站不仅仅是一个展示产品和服务的平台，更是企业形象和品牌的代表。在建设企业网站时，首先要考虑用户体验。网站的设计应简洁明了，易于导航，让用户能够快速找到他们需要的信息。其次，网站内容要具有吸引力和独特性，能够吸引用户停留并了解企业的核心价值。同时，网站的响应速度也至关重要，快速加载能提升用户体验。另外，企业网站也需要考虑搜索引擎优化（SEO）。通过优化网站内容和结构，使其更容易被搜索引擎收录和排名，从而提升网站的曝光度和流量。此外，移动端适配也是不可忽

做网站建设设计小程序 2024-12-28

奇妙的伪素数

奥数在线 2024-12-28

努力的果实：会有好结果

我密切关注着比赛的这一阶段，很明显她没有松懈，速度比平时快了许多，可以看出她是在努力坚持。我站在远处，对着跑道上的她大声加油：“西西，加油！别放松！”我知道她能听到我的鼓励。过了这个阶段，她的速度明显提升，在我们预计的冲刺点开始加速，这200米是冲刺并取得佳绩的关键阶段，她已经位于前六名之内。“冲刺！冲刺！”我声嘶力竭地呼喊着。在恍惚中，她仿佛“飞”了起来，直奔终点线。“她应该能得到满分！”老师们这样对我说，但我心中仍旧不踏实。我知道，接下来她需要稍作休息，查看成绩，计算总分，整理物品，然后和同

天天向上_24 2024-12-28

【赵渝强老师】MongoDB的Journal日志

数据是MongoDB的核心，MongoDB通过使用Journal日志保证数据的安全。Journal日志用于记录上一个检查点之后发生的数据更新，并将更新的信息顺序写入Journal日志文件中。通过使用Journal日志能够将数据库从系统异常终止事件中还原到一个有效的状态。通过6.5.1.3小节的介绍了解到，MongoDB使用预写日志机制实现数据的持久化。每个Journal日志文件的大小是100M，并存储在由参数--dbpath指定的下的journal子目录中，如下所示：tree /data/mydata/j

赵渝强老师 2024-12-28

高中英语核心词汇887个…

很多同学在高三复习的时候，背诵单词没有重点，3500个单词，每个都去背，到最后发现哪个都记不牢，实质上有很多单词同学们只要做到认识就可以，那么还有一部分单词是同学们一定要记住的，就是高考中经常出现的高频单词。这些单词同学们一定要牢记。今天学姐就给大家整理了一份高考最常考的887个高频词汇，附带频次与释意，同学们一定要保存，没事就拿出来看看！并把自己平时记不牢的单词做重点记忆与背诵。

怪力不乱神a 2024-12-28

2026经济学考研名校百家行之武汉大学

2026经济学考研名校百家行之武汉大学 [图片]

研职经济学考研 2024-12-28

NDM下载器免费高速支持windows和mac

简介ndm下载器其全称为Neat Download Manager，是一款免费、轻量、高速的下载工具，它和idm（Internet Download Manager）类似，界面简洁都具备多线程下载、断点续传、浏览器集成、嗅探资源、支持 HTTP、HTTPS 和 FTP 协议等特点，区别在于idm是付费产品且只支持windows系统，而ndm下载器则为免费的跨平台产品，支持windows和mac系统。该软件的官方版本仅支持英文界面。为了让国人使用起来更加方便，在此准备了ndm 下载器汉化补丁（仅支持wind

墨宇星辰888 2024-12-28

勤源FinOps：实现政务云精准成本分摊与高效计费

勤源FinOps：实现政务云精准成本分摊与高效计费在当今数字化和云计算快速发展的环境下，政府的成本管理变得日益复杂。尤其是在云资源的使用和各部门、项目的开支之间，如何进行精确的成本分摊与计费管理，成为了政府财务管理的重要课题。传统的人工分摊和手动计费管理方法已无法满足现代政府对高效、透明、准确的需求。因此，借助智能化的技术手段，优化成本分摊与计费管理，已成为推动政府数字化转型的关键因素。勤源科技（江苏），结合全链路智能运维的理念，推出了高效的政务云成本分摊与计费管理功能，帮助政府精准

勤源全链路运维 2024-12-28

B站托福词汇量必备神器！！！赶紧来

?挑战托福单词速记！十天冲击 4000 词不是梦 ✨ 托福备考，筑牢基础方能稳操胜券。背托福单词时是不是反复遗忘，陷入死循环？别慌，这里有托福词汇突破秘籍——超高效托福必考词默写宝册！ ?这本默写宝册堪称托福词汇复习神器，严选托福必考核心词汇，直击考试要点。 ✍ 运用它时，依照词汇序列逐一默写，即可强化记忆效果，单词牢固扎根于脑海。助力托福备考，开启词汇记忆新篇！ [图片] [图片] [图片]

托福上岸锦鲤 2024-12-28

(*´∀`)~♥ 感谢你的喜欢

详情见主页 [图片]

Moeyo 2024-12-28

GPT-4用四个高考数学题就彻底打败国内大模型

推荐体验

相关资讯

讯飞AI大模型“领跑国内”？做数学题堪比GPT-4！

林达华：国内大模型与GPT-4的差距是“高考数学最后一题”

韦神出初中数学题难倒ChatGPT-4 ？编程都行，初中数学题不行？

“韦神”出数学题，GPT-4挑战失败，初二学生给出标准答案！

看国内外各大AI表演计算小学数学题。

近期资讯

巩义网站建设：如何打造一个成功的企业网站

奇妙的伪素数

努力的果实：会有好结果

【赵渝强老师】MongoDB的Journal日志

高中英语核心词汇887个…

2026经济学考研名校百家行之武汉大学

NDM下载器免费高速支持windows和mac

勤源FinOps：实现政务云精准成本分摊与高效计费

B站托福词汇量必备神器！！！赶紧来

(*´∀`)~♥ 感谢你的喜欢

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响