全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

作者：快科技发布时间：2024-08-02

快科技8月2日消息，根据国内权威大模型评估平台OpenCompass（司南）近日公布的CompassArena周榜，GPT-4o和科大讯飞的星火大模型分别占据了排行榜的前两位。

榜单采用专业用户投票方式，结合了用户对各款大模型的真实体验，更具客观性和说服力，可谓是含金量十足。

OpenCompass的评测体系涵盖了学科、语言、知识、理解、推理等多个维度，能够全面评估大模型的综合能力。

在最新三期的评选中，讯飞星火以Elo-1078和Elo-1081的高分连续三周位列前三，并两次获得第二，显示出其在大模型领域的强劲竞争力。

值得注意的是，科大讯飞在今年6月27日发布的星火V4.0版本上，已完成了对GPT-4 Turbo的整体超越。

根据八个国际主流测试集的横向评测，讯飞星火V4.0排名第一，在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面完成了整体超越。

此前，讯飞星火在《麻省理工科技评论》的横评中也获得了高分，凭借领先的语言能力、数学、理综等多项核心能力，斩获国产主流大模型榜首席位。

目前，讯飞星火的安卓端APP累计下载量已超过1.31亿次，位列国内工具类通用大模型APP第一，持续领跑国内大模型第一梯队。

相关资讯

全靠用户投票！GPT-4o、讯飞星火分列CompassArena前二

快科技8月2日消息，根据国内权威大模型评估平台OpenCompass（司南）近日公布的CompassArena周榜，GPT-4o和科大讯飞的星火大模型分别占据了排行榜的前两位。榜单采用专业用户投票方式，结合了用

科大讯飞

2024-08-02

CompassArena大模型投票出炉，GPT-4o第一，讯飞星火第二

科大讯飞星火大模型在OpenCompass（司南）周榜上持续排名前三，阿里通义千问和百度文心一言位居前列，国产大模型第一梯队。

科大讯飞百度通义千问文心一言

酷科技kkj 2024-11-21

讯飞星火4.0 Turbo发布！对标GPT-4o，要让大模型更好用？

今年流行的多模态交互及超拟人虚拟人交互能力也来了，诸如教育、医疗、科研、司法、政务等领域行业大模型及更多落地应用产品也得到了升级展示，不妨现在就跟着我的脚步，一起去看看吧。从官方的演示来看，星火多语音大模型主…

教育医疗

雷科技 2024-10-29

复旦高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o

快科技6月12日消息，近日，复旦大学NLP（自然语言处理）实验室LLMEVAL团队发布了2024年高考数学大模型评测的结果。在这次评测中，阿里千问和讯飞星火分别获得了2024高考数学新I卷的第一名和第

复旦

鹿角 2024-06-12

用户投出来的大模型榜单-GPT4o、讯飞星火位居前列

讯飞星火在大模型榜单中排名靠前。

龚进辉 2024-10-08

近期资讯

浙江蓝德能源取得一种隔膜白油喷淋萃取装置专利，隔膜残油量低

金融界2024年12月30日消息，国家知识产权局信息显示，浙江蓝德能源科技发展有限公司取得一项名为“一种隔膜白油喷淋萃取装置”的专利，授权公告号CN222218685U，申请日期为2024年5月。

金融界 2024-12-30

有效管理数据：文件压缩的技巧与常见问题解决方法

随着我们日常生活中产生的数据量不断增加，如何有效地管理这些数据，尤其是如何进行文件压缩，成为了一个值得关注的话题。

新报观察 2024-12-30

电脑清理方法：提升性能与使用体验的有效指南

电脑就像我们的生活一样，随着时间的推移，难免会积累一些“垃圾”。这些“垃圾”不仅占据了存储空间，还可能让你的电脑运行得越来越慢。今天，就来聊聊怎么有效地清理电脑，让它焕然一新。首先，咱们得从最基本的开始。打开电脑，看看桌面上那些图标。是不是一堆堆的？有些可能已经很久没用过了，干脆直接删除吧。

新报观察 2024-12-30

中国一项“超级工程”，在海底建发电站，日本感叹中国太牛

人们关于资源的利用开始越来越多，而早期的一些不可再生资源也开始越来越紧缺，电力作为现在人们生活当中最常用的一种资源，也受到了多方面的挑战，我国在技术的进步之下，现在又有了一大超级工程。

基建不倒翁 2024-12-30

年底买电脑应该怎么选？一文讲透华为智慧PC选购攻略

【CNMO科技消息】不知不觉中，2024年已经进入尾声，而崭新的2025正在迎接我们。现在，华为智慧PC感恩回馈季正式开启，如果大家有选购电脑的需求，不妨来看看，一文讲透华为智慧PC选购攻略，相信可以帮助大家新年选到最趁手的生产力工具。

手机中国 2024-12-30

小米 REDMI 14C 手机上架：120Hz 屏、Helio G81-Ultra，499 元起

此外，该机带有侧边指纹，配备5160毫安时电池，支持18W有线充电，支持Wi-Fi5，配备3.5mm音频接口，官方称该机使用1216G超线性扬声器，至高可达到150%外放音量。

IT之家 2024-12-30

人形机器人：2024 年融资超 110 亿前景广阔

【2024年人形机器人领域获重大突破】2024年1至10月，全球人形机器人行业发生69起融资事件，公布的融资总额超110亿元人民币。高盛报告预测，到2035年全球人形机器人出货量将达140万台，市场规模约380亿美元。高盛还预测，人形机器人最早应用到工厂的时间为2024至2027年，应用到消费市场的时间为2028至2031年。

和讯网 2024-12-30

美国电网：AI需求或致崩溃危机重重

：AI热潮下，美国电网面临严峻挑战】今年，人工智能热潮带动美股市场及相关领域狂飙，投资者热情高涨，但AI未来喜忧参半。有报告称，为满足人工智能计算需求，美国数据中心激增，对当地电网或为坏消息。这种“扭曲”电力供应或破坏接电，增加电气火灾脆弱性，导致限电和停电，AI数据中心问题更大，因其能源需求不稳定。

和讯网 2024-12-30

CR450，终于见面了！

中国铁道科学研究院集团有限公司首席研究员赵红卫介绍：“CR450动车组突破了更高速安全运行、减阻降耗、减振降噪、全要素轻量化、智能化融合设计等技术，构建了时速400公里动车组的技术体系，实现了理论、技术、装备、标准、管理模式的全面创新。”

极目新闻 2024-12-30

vivo内部MR团队已达500人，原型机体验明年9月上线

钛媒体App12月30日消息，vivo执行副总裁胡柏山称，vivo的MR团队已经达到500人规模，预计将在2025年9月份在全国十几个城市上线高保真原型机体验，产品已经在部分指标体验上会超越了苹果。在商业化进展上，则要根据内容生态的匹配情况。

钛媒体快报 2024-12-30

全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

推荐体验

相关资讯

全靠用户投票！GPT-4o、讯飞星火分列CompassArena前二

CompassArena大模型投票出炉，GPT-4o第一，讯飞星火第二

讯飞星火4.0 Turbo发布！对标GPT-4o，要让大模型更好用？

复旦高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o

用户投出来的大模型榜单-GPT4o、讯飞星火位居前列

近期资讯

浙江蓝德能源取得一种隔膜白油喷淋萃取装置专利，隔膜残油量低

有效管理数据：文件压缩的技巧与常见问题解决方法

电脑清理方法：提升性能与使用体验的有效指南

中国一项“超级工程”，在海底建发电站，日本感叹中国太牛

年底买电脑应该怎么选？一文讲透华为智慧PC选购攻略

小米 REDMI 14C 手机上架：120Hz 屏、Helio G81-Ultra，499 元起

人形机器人：2024 年融资超 110 亿前景广阔

美国电网：AI需求或致崩溃危机重重

CR450，终于见面了！

vivo内部MR团队已达500人，原型机体验明年9月上线

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响