快科技7月18日消息,日前由上海人工智能实验室旗下司南评测体系OpenCompass,对7个AI大模型进行了高考9个科目的全科目测试,从而能全面评测大模型实力。此次参与测试的模型分别来自阿里巴巴、...【查看原文】
快科技7月18日消息,日前由上海人工智能实验室旗下司南评测体系OpenCompass,对7个AI大模型进行了高考9个科目的全科目测试,从而能全面评测大模型实力。 此次参与测试的模型分别来自阿里巴巴、零一万…
人工智能AI大模型阿里巴巴
梨花浅歌 2024-08-12
七款AI大模型“高考成绩”公布 :前三名文科过一本,理科过二本IT之家2024-07-18 15:01发布于北京IT之家官方账号IT之家 7 月 18 日消息,上海人工智能实验室 17 日公布了针
AI大模型人工智能
IT之家 2024-07-18
……从结果中来看,GPT-4o的表现依旧是处于领先状态,而在国产大模型这边,比较亮眼的成绩便属于豆包了。对于国产大模型在未来的发展,我们还需保持持续的关注;但毋庸置疑的一点是,字节的大模型和豆包,定然是最值得…
量子位 2024-07-05
本次大模型高考评测与河南省考卷完全相同,河南高考录取分数线显示,文科本科一批录取分数线为521分,豆包等三款国产AI成功冲上一本线。在阅读和语言运用两大项客观问题的考试上,GPT-4o、百小应、通义千问获得8…
通义千问
鞭牛士 2024-06-25
在此次数学测试中,通义千问和智谱清言由于在PC端产品加入了代码解释器,因此在解题过程中常常陷入死循环,从数学单科分数上看,这也一定程度上拖累了其数学得分。满分90分的生物试卷,表现最优秀的文心4.0和通义千问…
通义千问编程
极客公园 2024-06-26
人人都是产品经理 昨天
全天候科技 昨天
IT之家 昨天
36氪 昨天
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1