复旦高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o

作者：鹿角发布时间：2024-06-12

复旦

快科技6月12日消息，近日，复旦大学NLP（自然语言处理）实验室LLMEVAL团队发布了2024年高考数学大模型评测的结果。在这次评测中，阿里千问和讯飞星火分别获得了2024高考数学新I卷的第一名和第...【查看原文】

相关资讯

讯飞星火高考中英文作文双料第一，力压GPT-4o

总体而言，这篇文章较好地完成了写作任务，提供了具体的内容，也展现了作者对中国发展的关注和个人见解。”由此来看，在这波AI大模型高考“大练兵”中，讯飞星火凭借其优越的语言理解、文本生成、逻辑推理能力，在语文、英…

AI大模型

科记汇 2024-06-18

复旦测评13家大模型高考数学成绩，字节豆包II卷超GPT-4o夺冠

数据显示，字节豆包在2024高考数学新II卷客观题正确率达到74.66%，在13家大模型中排名首位，阿里千问和GPT-4o分列二三位。在高考数学新I卷评测排名中，字节豆包也排在前列。据悉，LLMeval是由复…

复旦

大力财经V 2024-06-16

全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

榜单采用专业用户投票方式，结合了用户对各款大模型的真实体验，更具客观性和说服力，可谓是含金量十足。飞星火以Elo-1078和Elo-1081的高分连续三周位列前三，并两次获得第二，显示出其在大模型领域的强劲竞争力。

快科技 2024-08-02

CompassArena大模型投票出炉，GPT-4o第一，讯飞星火第二

科大讯飞星火大模型在OpenCompass（司南）周榜上持续排名前三，阿里通义千问和百度文心一言位居前列，国产大模型第一梯队。

科大讯飞百度通义千问文心一言

酷科技kkj 2024-11-21

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。在测试中，搜狐科技选取了高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。三…

通义千问文心一言 ChatGPT AI大模型百度

搜狐科技 2023-06-08

近期资讯

提升摄影作品质量的技巧：模糊背景处理方法与注意事项总结

要达到这种效果，有几种方法可以尝试，不管是使用相机还是后期处理软件，都能实现模糊背景的效果。如果你有一支大光圈的镜头，比如f/1.8或f/2.8的镜头，效果会更明显。

新报观察 2024-12-29

实地探访“数字普陀”，海纳小镇Citywalk展示智慧城市新成果

12月26日至27日，“数字寻踪·普陀印象”海纳小镇城市数字化转型体验Citywalk活动举办。一支由各界人士组成的考察团沿着“海纳新城”与“普陀新篇”两条线路，实地探访了普陀区内多个具有代表性的智慧城市建设优秀案例。

东方网 2024-12-29

网安公司也中招！多家公司Chrome扩展被攻击对用户投毒

快科技12月29日消息，据媒体报道，近日，多家公司的Chrome浏览器扩展功能遭到黑客攻击，导致用户敏感数据面临泄露风险。其中，美国加州的数据安全初创公司Cyberhaven成为受害者之一，该公司已对外证实遭受恶意网络攻击。

快科技 2024-12-29

高德地图新增三大功能！直连北斗卫星无网求救

快科技12月29日消息，今年8月28日，高德地图卫星求救功能上线，在2025年到来前，高德地图宣布卫星求救新增三大功能，分别为北斗卫星短报文求救、位置同显和救援小结。此外，在进入救援聊天室时，对于求救者来说，地图页面上会直观的显示你当前的位置、与救援队的距离以及位置的最后更新时间。

驱动之家 2024-12-29

HMD Ridge 5G 手机曝光：展锐 T760 + 6G + 128G

IT之家12月29日消息，拥有良好爆料记录的消息源HMDMeme（smashx_60）目前曝光了HMDRidge5G手机，该机号称是HMD首款可负担的5G手机，虽然曝光图看起来像是折叠手机，不过实际上该机并非折叠手机，据称定价低于180欧元（IT之家备注：当前约1370元人民币）。

IT之家 2024-12-29

AI教父辛顿发声：30年内AI致人类灭亡几率达10%-20%

快科技12月29日消息，2024年诺贝尔物理学奖得主、素有“AI教父”之称的辛顿（GeoffreyHinton）表示，AI有10%-20%可能性在未来30年内导致人类灭亡。他认为，建立AGI（通用人工智能）或比人类更聪明的系统，可能导致该技术躲过人类控制而构成人类生存威胁。

快科技 2024-12-29

PS5可能延续PS4生命周期：将在2027年推出

西野指出，与技术的进步和能够实施这些技术的时间表密切相关，该公司希望在现有硬件继续提供娱乐的同时，也能推出新技术，并逐步扩展整个生态系统。他还表示，在考虑何时推出产品以满足市场需求时，会权衡技术、价格和时机等因素。此外，他认为家庭游戏主机仍将是索尼业务的核心，尽管PC等不同类型的平台正在增多。

中关村在线 2024-12-29

国家安全部：关注智能手机使用安全把好手机“保密关”

值得注意的是，随着技术的飞速发展，手机安全问题也日益凸显，可能造成信息泄露，对国家安全构成威胁。

千龙网 2024-12-29

美团：将逐步取消骑手超时扣款

12月27日，据红星资本局消息，美团表示，推进算法公开常态化。美团还表示，将在2025年底前逐步取消骑手超时扣款，推动从负向处罚向正向激励的转变。值得一提的是，此前，12月17日，有网传通知显示，美团骑手过度跑单，将被平台强制下线。通知称，为保障安全，外卖平台对于跑单时长累计过长的骑手将采取强制下线。

光明网 2024-12-29

第四代自升自航式风电安装船“铁建风电2000”在烟台交付

2024年12月28日，第四代自升自航式风电安装船“铁建风电2000”在中集来福士山东烟台建造基地交付。该船装备了起吊能力达2000吨的全回转起重机，可在水深80米的海域进行20兆瓦以上各型海上风机的安装施工，满足了海上风电行业深远海、大兆瓦的趋势，实现了该领域“国船国造国用”的目标。

金台资讯 2024-12-29

复旦高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o

推荐体验

相关资讯

讯飞星火高考中英文作文双料第一，力压GPT-4o

复旦测评13家大模型高考数学成绩，字节豆包II卷超GPT-4o夺冠

全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

CompassArena大模型投票出炉，GPT-4o第一，讯飞星火第二

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

近期资讯

提升摄影作品质量的技巧：模糊背景处理方法与注意事项总结

实地探访“数字普陀”，海纳小镇Citywalk展示智慧城市新成果

网安公司也中招！多家公司Chrome扩展被攻击对用户投毒

高德地图新增三大功能！直连北斗卫星无网求救

HMD Ridge 5G 手机曝光：展锐 T760 + 6G + 128G

AI教父辛顿发声：30年内AI致人类灭亡几率达10%-20%

PS5可能延续PS4生命周期：将在2027年推出

国家安全部：关注智能手机使用安全把好手机“保密关”

美团：将逐步取消骑手超时扣款

第四代自升自航式风电安装船“铁建风电2000”在烟台交付

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响