做了4个高考数学题,GPT-4就完胜国内大模型Kimi和智谱清言,GPT-4得分100,Kimi得分25,智谱清言得分50,而且GPT-4性能好(速度快),逻辑清楚。
下面就让我们逐一看看这四个数学题,它们是如何分析和答题的。
(第1题都答对了,正确答案是A)
(第2题,国内两大模型都答错了,纠正Kimi几次,都答不对,答了A、B、D;正确答案是C)
(第3题,Kimi答错了,智谱清言答对了,正确答案是D)
(第4题,Kimi答错了,智谱清言干脆不答了,正确答案是A)
前两天,科大讯飞开了场发布会。在这个时段开发布会的互联网公司,大家用脚指头想,都能想到,发布的肯定又是一个大模型了。一开始我还没太在意,结果今天转头就看到科大讯飞在发喜报了。
AI大模型GPT-4科大讯飞
2023-05-11
林达华:国内大模型与GPT-4的差距是“高考数学最后一题” 国内头部大语言模型与ChatGPT、GPT-4相比,孰强孰弱?多模态大模型的技术发展趋势是什么?昨天(3月24日)举行的2024
GPT-4ChatGPT大语言模型
上观新闻 2024-03-25
北大“韦神”出的初中数学难题让人工智能领域的ChatGPT-4犯了难,这说明了什么呢?这件事情并不能说明ChatGPT-4的能力问题,因为它的主要功能是对话生成,而不是数学问题求解。ChatGPT
ChatGPT编程北大人工智能
王帅说动漫 2023-03-30
近日北京大学北京国际数学研究中心推出的一道数学题获得了数学爱好者的广泛关注出题的是北京大学数学科学学院研究员第49届、第50届国际数学奥林匹克竞赛满分金牌得主人称“韦神”的韦东奕
GPT-4
洞庭湖边那些事儿 2023-03-30
50平方厘米的圆形面积,直径是多少? chatGPT 3.5 [图片] 文心一言 [图片] 讯飞星火 [图片] Claude [图片] 通义千问 [图片] 必应 [图片]
ChatGPT文心一言Claude通义千问
潜水在东汉 2023-10-29
快科技12月25日消息,博主数码闲聊站爆料,vivo X200 Ultra最快会在3月登场,最晚是4月发布。与X200和X200 Pro相比较而言,X200 Ultra最大变化之一是搭载高通骁龙8至尊版移动平台,是vivo最强
振亭 2024-12-25
快科技12月25日消息,近日,一位乒乓球爱好者在过安检时被告知其携带的乒乓球不能带上车。这引起了不少人的疑问:乒乓球这么小巧圆润的东西,为何不能上火车呢?中国铁路官方对此进行了科
随心 2024-12-25
内心烦恼,无人倾诉?现在好了,你可以直接拨打“12356”,咨询心理健康的相关知识,自有人替你排忧解难。据国家卫生健康委,12356是全国统一心理援助热线电话号码,向群众提供更加
上方文Q 2024-12-25
快科技12月25日消息,根据乘用车市场信息联席会(乘联会)的最新数据。今年12月1日至22日,乘用车市场零售量达到169.2万辆,较去年同期增长25%,与上月同期相比增长14%。今年以来,累计
王略 2024-12-25
快科技12月25日消息,易车榜基于终端销量数据整理,发布了今年1-11月国内MPV累计销量排行榜。榜单显示,别克GL8系列王者归来,前11月累计销量80096辆,超过丰田赛那和腾势D9,成为国内MPV销冠
若风 2024-12-25
2024年的新能源汽车市场给了我们太多的惊喜和无奈。随着哪吒汽车换帅、极越汽车“原地解散”等消息爆出,给2024年的汽车行业带来了更多的不确定性,新造车的年关注定难过。2024上
2024-12-25
快科技12月25日消息,据报道,九州风神宣布推出FL12R系列机箱反叶风扇,提供了黑色和白色版本。售价139元起。FL12R机箱反叶风扇搭载了36颗第二代ARGB灯珠,环绕在扇叶周围,带来了全新渐变环绕
鹿角 2024-12-25
快科技12月25日消息,柔宇显示公司资产12.3亿元起拍流拍后,又进行了降价二拍,起拍价仅9.8亿,目前已经结束,再次流拍。从目前的状况来看,下一次拍卖将进一步降价,这也算是正常的拍卖流程。
建嘉 2024-12-25
快科技12月25日消息,据国内媒体报道,京东集团宣布,再次升级客服人员薪酬福利。据了解,超2万名京东客服月固定工资将大幅提升,实现全员平均涨薪2个月。这也是继今年2月京东客服全员平均涨薪
朝晖 2024-12-25
在OPPO丰富的手机产品线中,A系列作为入门款机型,一直以耐用为核心竞争力,深受消费者喜爱。如今,OPPO A5 Pro正式发布,官方称其首发耐用科技3.0,在防水、抗摔、耐用等方面实现了重大突破,被
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1