做了4个高考数学题,GPT-4就完胜国内大模型Kimi和智谱清言,GPT-4得分100,Kimi得分25,智谱清言得分50,而且GPT-4性能好(速度快),逻辑清楚。
下面就让我们逐一看看这四个数学题,它们是如何分析和答题的。
(第1题都答对了,正确答案是A)
(第2题,国内两大模型都答错了,纠正Kimi几次,都答不对,答了A、B、D;正确答案是C)
(第3题,Kimi答错了,智谱清言答对了,正确答案是D)
(第4题,Kimi答错了,智谱清言干脆不答了,正确答案是A)
前两天,科大讯飞开了场发布会。在这个时段开发布会的互联网公司,大家用脚指头想,都能想到,发布的肯定又是一个大模型了。一开始我还没太在意,结果今天转头就看到科大讯飞在发喜报了。
AI大模型GPT-4科大讯飞
2023-05-11
林达华:国内大模型与GPT-4的差距是“高考数学最后一题” 国内头部大语言模型与ChatGPT、GPT-4相比,孰强孰弱?多模态大模型的技术发展趋势是什么?昨天(3月24日)举行的2024
GPT-4ChatGPT大语言模型
上观新闻 2024-03-25
北大“韦神”出的初中数学难题让人工智能领域的ChatGPT-4犯了难,这说明了什么呢?这件事情并不能说明ChatGPT-4的能力问题,因为它的主要功能是对话生成,而不是数学问题求解。ChatGPT
ChatGPT编程北大人工智能
王帅说动漫 2023-03-30
近日北京大学北京国际数学研究中心推出的一道数学题获得了数学爱好者的广泛关注出题的是北京大学数学科学学院研究员第49届、第50届国际数学奥林匹克竞赛满分金牌得主人称“韦神”的韦东奕
GPT-4
洞庭湖边那些事儿 2023-03-30
50平方厘米的圆形面积,直径是多少? chatGPT 3.5 [图片] 文心一言 [图片] 讯飞星火 [图片] Claude [图片] 通义千问 [图片] 必应 [图片]
ChatGPT文心一言Claude通义千问
潜水在东汉 2023-10-29
世界银行称,对房地产业的政策支持将小幅提振住房需求,有助于降低库存,行业好转预计要到2025年底会出现
财经五月花 2024-12-26
动力技术不断突破
车市睿见 2024-12-26
装饰器模式详解 定义 装饰器模式(Decorator Pattern)是一种结构型设计模式,允许动态地向对象添加新功能,而不改变其结构。装饰器模式通过将对象放入包含行为的新对象中,解决了继承的局限性。
超爱吃士力架 2024-12-26
引言 如今,技术圈流行的术语和“最佳实践”层出不穷,但我们需要关注更基础的问题:开发人员在阅读代码时的困惑程度。 困惑会浪费时间和金钱,而困惑的根源是高认知负荷。这并不是某种高深抽象的概念,而是人类认
Y11_推特同名 2024-12-27
如果你能通过简单的代码,在网页上创建一个逼真的3D地球,让你的访客无需离开座位就能探索这个蓝色星球的每一个角落。
AAA酒席代吃刘哥包顺礼金 2024-12-26
淘汰赛前的整备。
嘉宾商学 2024-12-26
今天是星期四,一提到星期四就有不少掘友想到KFC疯狂星期四,要去吃肯德基了,所以有没有人能V我50,我也要去吃肯德基。偷偷说一句,虽然肯德基涨了2%,但你只需要V我50就可以了,剩下那1块钱我自己掏
少年姜太公 2024-12-26
前两天工作上出现了纰漏,感兴趣的可以往前翻翻,大致情况是拼命干,结果干得越多错得越多,出了纰漏背了不少黑锅。 最近一直在调整工作状态,复盘以前错误的工作方式。 多和团队沟通解决方案 以前我都是一个人单
小兵张健 2024-12-26
小小潮玩,跨越国界
明晰野望 2024-12-26
陈根谈科技 2024-12-26
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1