复旦高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o

作者：鹿角发布时间：2024-06-12

复旦

快科技6月12日消息，近日，复旦大学NLP（自然语言处理）实验室LLMEVAL团队发布了2024年高考数学大模型评测的结果。在这次评测中，阿里千问和讯飞星火分别获得了2024高考数学新I卷的第一名和第...【查看原文】

相关资讯

讯飞星火高考中英文作文双料第一，力压GPT-4o

总体而言，这篇文章较好地完成了写作任务，提供了具体的内容，也展现了作者对中国发展的关注和个人见解。”由此来看，在这波AI大模型高考“大练兵”中，讯飞星火凭借其优越的语言理解、文本生成、逻辑推理能力，在语文、英…

AI大模型

科记汇 2024-06-18

复旦测评13家大模型高考数学成绩，字节豆包II卷超GPT-4o夺冠

数据显示，字节豆包在2024高考数学新II卷客观题正确率达到74.66%，在13家大模型中排名首位，阿里千问和GPT-4o分列二三位。在高考数学新I卷评测排名中，字节豆包也排在前列。据悉，LLMeval是由复…

复旦

大力财经V 2024-06-16

全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

榜单采用专业用户投票方式，结合了用户对各款大模型的真实体验，更具客观性和说服力，可谓是含金量十足。飞星火以Elo-1078和Elo-1081的高分连续三周位列前三，并两次获得第二，显示出其在大模型领域的强劲竞争力。

快科技 2024-08-02

CompassArena大模型投票出炉，GPT-4o第一，讯飞星火第二

科大讯飞星火大模型在OpenCompass（司南）周榜上持续排名前三，阿里通义千问和百度文心一言位居前列，国产大模型第一梯队。

科大讯飞百度通义千问文心一言

酷科技kkj 2024-11-21

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。在测试中，搜狐科技选取了高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。三…

通义千问文心一言 ChatGPT AI大模型百度

搜狐科技 2023-06-08

近期资讯

交通运输部东海航海保障中心召开2024年江苏辖区新闻发布会

截至目前，江苏辖区航标数量共计1305座，相较去年新增81座，全年航标正常率、维护正常率、DGNSS信号可利用率、AIS基站正常率等均高于部颁标准，持续为过往船舶提供高质量导助航服务。

扬子晚报 2024-12-25

雷军刚刚官宣！与蔚来、小鹏、理想合作

12月25日，小米汽车宣布将携手蔚来、小鹏、理想，正式开始充电补能网络合作。根据上述协议，自11月15日起，阿维塔用户可通过阿维塔APP，在全国范围查找并使用蔚来能源的充电桩，享受智能化的充电服务，充电体验和效率全面升级。

中国品牌 2024-12-25

首席气候官｜专访曼恩能源方案高级副总裁、亚太区负责人沙柏能：人工智能+人类智能是脱碳关键，2050年后海运业燃料格局将迎巨变

根据联合国贸易和发展会议（UNCTAD）发布的《2024年海运述评》报告，航运业占全球温室气体排放的3%，目前全球超过80%的贸易量依赖海上运输。曼恩能源方案集团高级副总裁、亚太区负责人沙柏能在接受21世纪经济报道专访时表示，以陆地和海运为代表的交通运输行业，要继续加快推进传统燃料转型。

21世纪经济报道 2024-12-25

腾讯QQ打击网络水军四季度处置违规内容超4.7万条

快科技12月25日消息，今日，QQ安全中心发文称，通过多维度的专项治理行动，持续加大对各类有害信息的打击力度。在非法暴利的驱动下，网络水军问题屡禁不止，这种行为不仅扭曲了网络舆论的真实性，破坏市场的公正竞争，侵害广大用户的知情权和选择权。

快科技 2024-12-25

“小新”上岗！焦作高新区“AI智能+政务服务”开启新模式

12月24日，在焦作高新区政务服务中心，市民张先生说。去年以来，焦作高新区以数字赋能政务服务，以智能擦亮营商品牌，开创“人工智能+互联网+政务服务”新模式，建成投用“区域领先、全省一流”智慧化政务服务大厅，叫响“高新事·高效办”营商服务品牌，被省网信办评为“2024年河南省提升全面数字素养与技能精品案例”。

河南日报 2024-12-25

全球单机功率最大的纯氢发电机组首次点火成功

钛媒体App12月25日消息，近日，全球首台30MW级纯氢燃气轮机“木星一号”整机试验首次点火成功。此次点火的纯氢燃气轮机是目前全球单机功率最大的纯氢发电机组，纯氢点火试验取得预期效果，验证了纯氢燃气轮机系统可靠性和安全性，标志着我国大功率氢燃气轮机和氢储能技术取得重大进展，新型长时储能有了新技术、新产品。

钛媒体快报 2024-12-25

祥鑫科技等多公司剧透人形机器人业务布局情况

日前，人形机器人备受关注，引各路资本纷纷布局。在此背景下，多家上市公司剧透公司在人形机器人领域的布局情况。祥鑫科技近日接受机构调研时透露，人形机器人是公司未来重要的战略布局方向之一，公司能够根据不同客户的需求，为客户提供从模具到结构件的产品整体解决方案。

证券时报 2024-12-25

微信新功能“蓝包”正进行灰度测试，业内：或利好小程序电商业务

仔细观察不难发现，“送礼物”功能与微信的“发红包”有相似之处。根据公告，除珠宝、教育培训两大类目外，其他类目微信小店、原价不超过1万元的商品，都将默认支持“送礼物”功能。

蓝鲸新闻 2024-12-25

赛道Hyper | 这公司竟以高端影像力震撼全场？

尽管国产智能手机商的影像能力（主要指静态摄影）已全面碾压苹果公司，但荣耀却是“例外”，或者说，荣耀的影像能力相对较弱。但在12月23日，荣耀以新发布的保时捷设计“荣耀Magic7RSR”的实际影像表现，终于成功跻身国产高端旗舰影像一流阵营。

华尔街见闻 2024-12-25

消息称苹果正加紧研发AI芯片以减少对第三方的依赖

【CNMO科技消息】12月25日，有报道称，苹果公司正加速开发自家的AI芯片，旨在减少对第三方开发者的依赖，此举或将终结其与英伟达多年来的不甚融洽的合作关系。尽管目前苹果仍在与英伟达携手，为AppleIntelligence的诸多功能提供技术支持，但苹果并未直接采购英伟达的芯片，而是选择从亚马逊和微软的云服务中租赁使用权限。

手机中国 2024-12-25

复旦高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o

推荐体验

相关资讯

讯飞星火高考中英文作文双料第一，力压GPT-4o

复旦测评13家大模型高考数学成绩，字节豆包II卷超GPT-4o夺冠

全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

CompassArena大模型投票出炉，GPT-4o第一，讯飞星火第二

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

近期资讯

交通运输部东海航海保障中心召开2024年江苏辖区新闻发布会

雷军刚刚官宣！与蔚来、小鹏、理想合作

首席气候官｜专访曼恩能源方案高级副总裁、亚太区负责人沙柏能：人工智能+人类智能是脱碳关键，2050年后海运业燃料格局将迎巨变

腾讯QQ打击网络水军四季度处置违规内容超4.7万条

“小新”上岗！焦作高新区“AI智能+政务服务”开启新模式

全球单机功率最大的纯氢发电机组首次点火成功

祥鑫科技等多公司剧透人形机器人业务布局情况

微信新功能“蓝包”正进行灰度测试，业内：或利好小程序电商业务

赛道Hyper | 这公司竟以高端影像力震撼全场？

消息称苹果正加紧研发AI芯片以减少对第三方的依赖

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响