做了4个高考数学题,GPT-4就完胜国内大模型Kimi和智谱清言,GPT-4得分100,Kimi得分25,智谱清言得分50,而且GPT-4性能好(速度快),逻辑清楚。
下面就让我们逐一看看这四个数学题,它们是如何分析和答题的。
(第1题都答对了,正确答案是A)
(第2题,国内两大模型都答错了,纠正Kimi几次,都答不对,答了A、B、D;正确答案是C)
(第3题,Kimi答错了,智谱清言答对了,正确答案是D)
(第4题,Kimi答错了,智谱清言干脆不答了,正确答案是A)
前两天,科大讯飞开了场发布会。在这个时段开发布会的互联网公司,大家用脚指头想,都能想到,发布的肯定又是一个大模型了。一开始我还没太在意,结果今天转头就看到科大讯飞在发喜报了。
AI大模型GPT-4科大讯飞
2023-05-11
林达华:国内大模型与GPT-4的差距是“高考数学最后一题” 国内头部大语言模型与ChatGPT、GPT-4相比,孰强孰弱?多模态大模型的技术发展趋势是什么?昨天(3月24日)举行的2024
GPT-4ChatGPT大语言模型
上观新闻 2024-03-25
北大“韦神”出的初中数学难题让人工智能领域的ChatGPT-4犯了难,这说明了什么呢?这件事情并不能说明ChatGPT-4的能力问题,因为它的主要功能是对话生成,而不是数学问题求解。ChatGPT
ChatGPT编程北大人工智能
王帅说动漫 2023-03-30
近日北京大学北京国际数学研究中心推出的一道数学题获得了数学爱好者的广泛关注出题的是北京大学数学科学学院研究员第49届、第50届国际数学奥林匹克竞赛满分金牌得主人称“韦神”的韦东奕
GPT-4
洞庭湖边那些事儿 2023-03-30
50平方厘米的圆形面积,直径是多少? chatGPT 3.5 [图片] 文心一言 [图片] 讯飞星火 [图片] Claude [图片] 通义千问 [图片] 必应 [图片]
ChatGPT文心一言Claude通义千问
潜水在东汉 2023-10-29
冬天的仪式感,就是天空中飘来第一场雪,整个城市焕然一新,变得银装素裹。在天文研究者的眼睛里,雪花是什么样的呢?翻开《仰望天空的少年》系列中的《去北方看雪》一册,寒星和影月在一场
2024-12-30
很多人担心发胖或是担心升血糖,晚上碳水类的主食吃得很少,甚至不吃,靠肉类来充饥,但这种模式真的有利预防肥胖和疾病吗?一些最新的研究证据提示,事实可能并非如此......研究解读一篇
2024年12月29日,CR450动车组样车正式发布,我国新一代时速400公里动车组研制获得重大突破。其中,“CR”是中国铁路英文缩写,“450”为速度等级代码,代表试验时速可达4
12月29日,凯盛集团旗下中建材玻璃新材料研究总院、蚌埠中光电联合自主研发的世界首片8.6代OLED玻璃基板产品,在安徽蚌埠成功下线。在“十四五”国家重点研发计划“OLED显示玻
快科技12月29日消息,Intel、AMD都在准备新一代高端游戏本平台,其中AMD的代号Fire Range,从桌面版锐龙9000系列移植而来,和已有的锐龙7000HX如出一辙。GeekBench AI测试中出现了一款AMD新
快科技12月29日消息,Intel正在准备一款代号“Twin Lake”的处理器新品,但不属于新的酷睿Ultra 200系列,甚至不属于马甲的酷睿200系列,而是将近两年前的Alder Lake-N系列的继任者,
舒玉龙:有四个重点,第一是强烈的个人魅力;第二是讲故事的能力;第三是始终能够带着听众视角去讲,而不是自说自话;最后一个,是始终带有信息增量的意识,即能够给听众提供一些他不知道的东西,听众会有收获。
第一财经 2024-12-30
计算机系统有限公司、抖音有限公司等科技巨头也积极布局AI眼镜项目。
金融界 2024-12-30
软件上,设置自动回复也是很方便的。进入设置,找到“隐私”,可以设置一些自动的欢迎语,但要注意,这并不是完全的自动回复。打开QQ,点击右上角的头像,选择“设置”,然后找到“消息提醒”中的“自动回复”。
新报观察 2024-12-30
在正式开始之前,由于时间稍微过去有些远了,咱们还是先给各位来个前景提要。上个月华为不是召开秋季发布会,发布了包括 Mate 70、Mate X6、MatePad Pro 在内的一系列新品嘛,其中这里面还包括
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1