当前位置：首页|资讯|阿里巴巴|通义千问

性能媲美Llama3，阿里巴巴通义千问开源 Qwen1.5-110B 模型

作者：网界发布时间：2024-04-28

阿里巴巴通义千问

阿里巴巴日前宣布，开源 Qwen1.5 系列首个千亿参数模型 Qwen1.5-110B。据称，此款新模型在各项性能指标上都展现出了显著的能力，特别是在与业界领先的Meta-Llama3-70B模型的对比中，其基础能力不遑多让。

Qwen1.5-110B沿用了Qwen1.5系列一贯的Transformer解码器架构，并引入了分组查询注意力(GQA)机制，使得模型在推理时更加高效。值得一提的是，该模型支持长达32K tokens的上下文长度，并且具备多语言支持能力，涵盖英、中、法、西、德、俄、日、韩、越、阿等语言。

据了解，阿里巴巴将Qwen1.5-110B模型与目前最优秀的语言模型Meta-Llama3-70B以及Mixtral-8x22B进行了详细的性能对比。对比结果显示，新推出的110B模型在基础能力上至少与业界标杆Llama-3-70B模型旗鼓相当。阿里巴巴方面表示，此次性能的提升主要得益于模型规模的扩大，而并非预训练方法的重大改变。

在Chat评估方面，阿里巴巴采用了MT-Bench和AlpacaEval 2.0基准进行了测试。结果显示，与先前发布的72B模型相比，110B模型在两个Chat模型的基准评估中均表现更为出色。这一持续改善的评估结果表明，即便没有大幅改变训练方法，更大规模、更强大的基础语言模型也能显著提升Chat模型的性能。

阿里巴巴强调，Qwen1.5-110B不仅是Qwen1.5系列中规模最大的模型，更是该系列首个参数超过1000亿的模型。其出色的性能不仅与最近的SOTA模型Llama-3-70B不相上下，而且明显优于先前的72B模型。

推荐体验

相关资讯

通义千问推出千亿级参数模型Qwen1.5-110B

通义千问首次推出千亿级参数模型Qwen1.5-110B，在MMLU、TheoremQA、GPQA等多个基准测评中展现出卓越性能。目前Qwen1.5系列已累计开源10款大模型，通义千问开源模型下载量超过700万。

金融界 2024-04-29

通义千问Qwen1.5-110B：突破1000亿参数的新成员

通义千问Qwen1.5-110B来了！这个Qwen1.5系列的新成员创下了一个里程碑：拥有超过1000亿参数的庞大规模！模型亮点：架构：用了一种叫Transformer解码器的架构，还有个叫分组查询注意力（GQA）的东西。性能：无论是标准测试还是聊天模型测试，都厉害得很。多语言支持：说多少种语言都行，而且还能处理长篇大论！[图片] 详细：https://reurl.cc/qVOong 或搜同名号：AIFOX [图片]

AI_Fox 2024-04-27

通义千问开源Qwen2.5，旗舰模型Qwen2.5-72B性能超越Llama 405B

Qwen2.5-Coder在多达5.5Ttokens的编程相关数据上作了训练，当天开源1.5B和7B版本，未来还将开源32B版本；Qwen2.5-Math支持使用思维链和工具集成推理（TIR）解决中英双语的数…

通义千问 LLaMA 编程

猎云网 2024-09-25

通义千问Qwen2.5宣布开源，Qwen2.5-72B性能超越Llama 405B

钛媒体App9月19日消息，2024云栖大会上，阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5，其中，旗舰模型Qwen2.5-72B性能超越Llama405B。Qwen2.5涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，每个尺寸都有基础版本、指令跟随版本、量化版本，总计上架100多个模型。

通义千问 LLaMA 大语言模型编程

钛媒体快报 2024-09-19

2024 AIGC每日新闻|4月21日-阿里巴巴推出Qwen 1.5-110B

?【AIGC每日新闻】【OpenAI DALL-E 2不再向新用户开放】OpenAI DALL-E 2不再向新用户开放，也不再接受积分购买，已经购买了积分的可以在 2025 年 5 月 1 日或购买后一年内使用。参考博客链接：https://petapixel.com/2024/04/18/openai-will-close-its-first-ai-image-generator-dall-e-2/【VBench：支持评估图像转视频（I2V）模型】VBench 是一款人工智能模型评估平台，最新更新中

AIGC 阿里巴巴 OpenAI DALL·E 人工智能

二次元的Datawhale 2024-04-21

近期资讯

周鸿祎：每个家庭都会新增 “几十口人”！

快科技12月27日消息，今日360集团创始人、董事长周鸿祎发文预测，未来每个家庭都会新增 “几十口人”，因为家里所有的家电和硬件将一夜之间变为真正智能的AI伙伴。他还提到了英伟达

2024-12-27

聪明的钱 | 中欧基金：重点关注政策加码，抓住投资AI三大机会

未来利率中枢有望下行，看多算力与AI软硬件应用。

黄绎达 2024-12-27

【算法】课程表 II

难度：中等题目现在你总共有 numCourses 门课需要选，记为 0 到 numCourses - 1。给你一个数组 prerequisites ，其中 prerequisites[i] = [

时清云 2024-12-27

Apifox 12月更新｜接口的测试覆盖情况、测试场景支持修改记录、迭代分支能力升级、自定义项目角色权限、接口可评论

Apifox 新版本上线啦！看看本次版本更新主要涵盖的重点内容，有没有你所关注的功能特性：接口支持查看测试覆盖率测试场景新增「历史记录」功能「迭代分支」优化升级新增主分支保护机制支持迭代分

Apifox 2024-12-27

【OpenHarmony】鸿蒙 UI开发之DanmakuFlameMaster

DanmakuFlameMaster是一款弹幕框架，支持发送纯文本弹幕、设置弹幕在屏幕的显示区域、控制弹幕播放状态等功能

塞尔维亚大汉 2024-12-27

为什么说品牌不仅是商场的核心内容，更是运营创新的指引灯塔？

品牌不仅是商品和服务的提供者，它们更代表着不同的生活方式、价值观念和美学追求。

RET睿意德 2024-12-27

航运运价迎集中上调，2025年的航运市场将如何运行？

展望2025年，地缘政治依旧是行业最大的变量，在动荡复杂的局势中，保持对市场资讯的持续关注，将是航运赛道的关键。

满投财经 2024-12-27

12月第二周消费热门事件榜

刺激消费、关注安全、科技热点升温。

世研大消费指数 2024-12-27

制造日本最先进半导体！台积电熊本一厂开始量产

快科技12月27日消息，据媒体报道，熊本县知事木村敬在27日的例行记者会上表示，台积电熊本工厂运营子公司JASM已通知，熊本工厂已于本月开始量产。木村敬指出，为了监控工厂废水，要求JASM在开

2024-12-27

洞悉变局中的机会品牌出海构建向上生长之道 | 2024全球化新锐品牌数字营销峰会回顾

中国企业出海增长路径及品牌全球化策略。

未来一氪 2024-12-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1