复旦高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o

作者：鹿角发布时间：2024-06-12

复旦

快科技6月12日消息，近日，复旦大学NLP（自然语言处理）实验室LLMEVAL团队发布了2024年高考数学大模型评测的结果。在这次评测中，阿里千问和讯飞星火分别获得了2024高考数学新I卷的第一名和第...【查看原文】

相关资讯

讯飞星火高考中英文作文双料第一，力压GPT-4o

总体而言，这篇文章较好地完成了写作任务，提供了具体的内容，也展现了作者对中国发展的关注和个人见解。”由此来看，在这波AI大模型高考“大练兵”中，讯飞星火凭借其优越的语言理解、文本生成、逻辑推理能力，在语文、英…

AI大模型

科记汇 2024-06-18

复旦测评13家大模型高考数学成绩，字节豆包II卷超GPT-4o夺冠

数据显示，字节豆包在2024高考数学新II卷客观题正确率达到74.66%，在13家大模型中排名首位，阿里千问和GPT-4o分列二三位。在高考数学新I卷评测排名中，字节豆包也排在前列。据悉，LLMeval是由复…

复旦

大力财经V 2024-06-16

全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

榜单采用专业用户投票方式，结合了用户对各款大模型的真实体验，更具客观性和说服力，可谓是含金量十足。飞星火以Elo-1078和Elo-1081的高分连续三周位列前三，并两次获得第二，显示出其在大模型领域的强劲竞争力。

快科技 2024-08-02

CompassArena大模型投票出炉，GPT-4o第一，讯飞星火第二

科大讯飞星火大模型在OpenCompass（司南）周榜上持续排名前三，阿里通义千问和百度文心一言位居前列，国产大模型第一梯队。

科大讯飞百度通义千问文心一言

酷科技kkj 2024-11-21

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。在测试中，搜狐科技选取了高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。三…

通义千问文心一言 ChatGPT AI大模型百度

搜狐科技 2023-06-08

近期资讯

从前端到Android：揭秘Fragment与Activity的生命周期

如果你是一位前端开发者，正在探索Android开发的世界，那么你一定会对Android的生命周期管理感到既熟悉又陌生。今天，我们将深入探讨Android中Fragment和Activity的生命周期，

火车叼位 2024-12-26

模仿 SU7 网页特效实现3D旋转地球

随着小米 SU7 的发布，不少网友发现了一个小米su7的展示网页，那是相当的酷炫：当你体验一遍后，会看到各种炫酷的效果，包括隧道穿梭、波浪动画等，并且还有些细节也值得注意，如地面的反射效果。

加减法原则 2024-12-25

深入理解JDK设计模式，让你的Java开发更高效

在软件开发中，设计模式是提高代码质量、可维护性以及扩展性的有效工具。Java开发中，JDK的源码中包含了许多经典的设计模式，这些模式不仅为我们提供了有力的编程规范，还能帮助开发者在实际项目中解决常见问

齐朋 2024-12-26

vue 实现多个关键词高亮显示功能

在现代网页开发中，常常需要实现高亮显示关键词的功能。例如，在一个搜索结果页面，用户可能输入某个关键词，并希望看到该关键词在相关内容中的高亮显示。下面我们将探讨如何通过 JavaScript 来实现这一

婷婷婷婷 2024-12-26

【Flutter入门】1. 从零开始的flutter跨平台开发之旅（概述、环境搭建、第一个Flutter应用）

想快速掌握现代移动应用开发吗？本文带你走进Google推出的开源UI工具包——Flutter的世界。你将学会如何在Windows和macOS上搭建开发环境，并创建一个简单的app应用。

西辰Knight 2024-12-26

js中的事件流

什么是事件流事件流（Event Flow）是指在文档对象模型（DOM）中，当用户交互（如点击、键盘输入等）触发一个事件时，这个事件如何在 DOM 树中传播的过程。

写不出代码真君 2024-12-26

雪花算法 Snowflake 原理与 Java 实现

雪花算法 Snowflake 一种由 Twitter 开发的分布式全局唯一 ID 生成算法，它生成的 ID 是一个 64 位的整数。

秋刀鱼梦 2024-12-26

Android 动效初探

前言我们知道在 Android 中实现动画效果，可以通过补间动画、帧动画和属性动画。对于一些简单的动画效果，用上述方式实现没啥问题。但是对于复杂的动画，无论从动态效果展示和动画资源大小，还是支持动态

码上搬砖 2024-12-26

Flutter Warning: SDK processing. This version only understands SDK XML versions

一、简介执行 flutter run 的时候，提示警告： Warning: SDK processing. This version only understands SDK XML version

卡尔特斯 2024-12-26

Linux内核"bug"导致Android无法获取meminfo的问题定位

背景最近在做某个需求的性能测试时发现：采集的内存数据时而会跌落到0，导致内存准入无法判断（其实这个问题也同样会影响到线上的内存数据采集）。采集的截图主要就下面2种case：时而跌落到 0，时而又恢

0x264 2024-12-26

复旦高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o

推荐体验

相关资讯

讯飞星火高考中英文作文双料第一，力压GPT-4o

复旦测评13家大模型高考数学成绩，字节豆包II卷超GPT-4o夺冠

全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

CompassArena大模型投票出炉，GPT-4o第一，讯飞星火第二

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

近期资讯

从前端到Android：揭秘Fragment与Activity的生命周期

模仿 SU7 网页特效实现3D旋转地球

深入理解JDK设计模式，让你的Java开发更高效

vue 实现多个关键词高亮显示功能

【Flutter入门】1. 从零开始的flutter跨平台开发之旅（概述、环境搭建、第一个Flutter应用）

js中的事件流

雪花算法 Snowflake 原理与 Java 实现

Android 动效初探

Flutter Warning: SDK processing. This version only understands SDK XML versions

Linux内核"bug"导致Android无法获取meminfo的问题定位

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响