快科技6月12日消息,近日,复旦大学NLP(自然语言处理)实验室LLMEVAL团队发布了2024年高考数学大模型评测的结果。在这次评测中,阿里千问和讯飞星火分别获得了2024高考数学新I卷的第一名和第...【查看原文】
总体而言,这篇文章较好地完成了写作任务,提供了具体的内容,也展现了作者对中国发展的关注和个人见解。”由此来看,在这波AI大模型高考“大练兵”中,讯飞星火凭借其优越的语言理解、文本生成、逻辑推理能力,在语文、英…
AI大模型
科记汇 2024-06-18
数据显示,字节豆包在2024高考数学新II卷客观题正确率达到74.66%,在13家大模型中排名首位,阿里千问和GPT-4o分列二三位。在高考数学新I卷评测排名中,字节豆包也排在前列。据悉,LLMeval是由复…
复旦
大力财经V 2024-06-16
榜单采用专业用户投票方式,结合了用户对各款大模型的真实体验,更具客观性和说服力,可谓是含金量十足。飞星火以Elo-1078和Elo-1081的高分连续三周位列前三,并两次获得第二,显示出其在大模型领域的强劲竞争力。
快科技 2024-08-02
科大讯飞星火大模型在OpenCompass(司南)周榜上持续排名前三,阿里通义千问和百度文心一言位居前列,国产大模型第一梯队。
科大讯飞百度通义千问文心一言
酷科技kkj 2024-11-21
搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。在测试中,搜狐科技选取了高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。三…
通义千问文心一言ChatGPTAI大模型百度
搜狐科技 2023-06-08
数据中心、边缘机房、教育科研和个人开发者都在关注。
36氪品牌 2024-12-26
随着Gemini家族的日趋完善、阵容的发展壮大,谷歌大模型将可代表用户完成更多现实工作。
极客邦科技InfoQ 2024-12-26
低空产业火爆。
投资界 2024-12-26
五大电商平台趋势、七大消费趋势、三大品类新品趋势,一键洞察增长先机
Flywheel飞未 2024-12-26
“你对上海的认知,一定是过时的。”
36氪的朋友们 2024-12-26
相较于传统四足机器人,轮足式四足机器人在实用性方面优势明显。
时代周报 2024-12-26
OpenAI大战特斯拉?
雷科技 2024-12-26
具身智能产业的发展,或将进入实际应用的新阶段。
紫金财经 2024-12-26
这是面向未来消费者的一封情书。
查阅更多出海好文章,请移步出海官网 letschuhai.com。
36氪出海 2024-12-26
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1