快科技6月12日消息,近日,复旦大学NLP(自然语言处理)实验室LLMEVAL团队发布了2024年高考数学大模型评测的结果。在这次评测中,阿里千问和讯飞星火分别获得了2024高考数学新I卷的第一名和第...【查看原文】
总体而言,这篇文章较好地完成了写作任务,提供了具体的内容,也展现了作者对中国发展的关注和个人见解。”由此来看,在这波AI大模型高考“大练兵”中,讯飞星火凭借其优越的语言理解、文本生成、逻辑推理能力,在语文、英…
AI大模型
科记汇 2024-06-18
数据显示,字节豆包在2024高考数学新II卷客观题正确率达到74.66%,在13家大模型中排名首位,阿里千问和GPT-4o分列二三位。在高考数学新I卷评测排名中,字节豆包也排在前列。据悉,LLMeval是由复…
复旦
大力财经V 2024-06-16
搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。在测试中,搜狐科技选取了高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。三…
通义千问文心一言ChatGPTAI大模型百度
搜狐科技 2023-06-08
2024年全国高考甫一结束,司南评测体系OpenCompass选取Mixtral8x22B、Yi-1.5-34B(零一万物)、GLM-4-9B(智谱)、InternLM2-20B-WQX(书生·浦语)、Qwe…
IT时报 2024-06-27
之前小编也让文心一言、讯飞星火、GPT-4秀了一把作文能力。我们分别测试了GPT-4、通义千问、文心一言、讯飞星火四个大模型,其中GPT-4得分最高为36分,讯飞星火得分最低为19分。其中,通义千问答对了全部…
ChatGPT文心一言通义千问GPT-4
创投精选 2023-06-09
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1