通义千问系列AI开源模型升至Qwen2：5个尺寸，最高 128K tokens

作者：IT之家发布时间：2024-06-07

IT之家 6 月 7 日消息，通义千问（Qwen）今天宣布经过数月的努力，Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级，并已在 Hugging Face 和 ModelScope 上同步开源。

IT之家附上 Qwen 2.0 主要内容如下：

5 个尺寸的预训练和指令微调模型，包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 以及 Qwen2-72B
在中文英语的基础上，训练数据中增加了 27 种语言相关的高质量数据；
多个评测基准上的领先表现；
代码和数学能力显著提升；
增大了上下文长度支持，最高达到 128K tokens（Qwen2-72B-Instruct）。

模型基础信息

Qwen2 系列包含 5 个尺寸的预训练和指令微调模型，其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。

模型 Qwen2-0.5BQwen2-1.5BQwen2-7BQwen2-57B-A14BQwen2-72B参数量 0.49B1.54B7.07B57.41B72.71B 非 Embedding 参数量 0.35B1.31B5.98B56.32B70.21BGQATrueTrueTrueTrueTrueTieEmbeddingTrueTrueFalseFalseFalse上下文长度 32K32K128K64K128K

在 Qwen1.5 系列中，只有 32B 和 110B 的模型使用了 GQA。这一次，所有尺寸的模型都使用了 GQA，以便让大家体验到 GQA 带来的推理加速和显存占用降低的优势。

模型评测

相比 Qwen1.5，Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。

在针对预训练语言模型的评估中，对比当前最优的开源模型，Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型，如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。

IT之家附上参考地址

相关资讯

阿里开源！通义千问系列AI开源模型Qwen2今日发布!

[图片] 通义千问是阿里巴巴开源的一系列大语言模型。Qwen系列大模型最高参数量720亿，最低18亿，覆盖了非常多的范围，其各项评测效果也非常好。而昨天，Qwen团队的开发人员向HuggingFacel的transformers)库上提交了一段代码，包含了Qwen2的相关信息。就在今天，通义干问(Qwen)宣布经过数月的努力，Qwen系列模型从Qwen1.5到Qwen2的重大升级，并已在Hugging Face和ModelScope上同步开源。 Qwen 2.0 主要内容如下： 5 个尺寸的预训练和指令微

通义千问 Hugging Face 阿里巴巴大语言模型

AI-GitHub 2024-06-07

驱动中国 2024-06-12

阿里发布最强开源大模型通义千问Qwen2，国产最好用的LLM

前言近年来，大模型技术发展迅速，开源模型的出现为AI研究和应用带来了新的活力。在这一背景下，阿里云通义千问团队发布了全新升级的Qwen2系列开源模型，为国内外开发者提供了更强大的工具和更丰富的选择。

通义千问

努力犯错玩AI 2024-06-11

通义千问系列AI开源模型升至Qwen2：5个尺寸，最高 128K tokens

推荐体验

相关资讯

阿里开源！通义千问系列AI开源模型Qwen2今日发布!

阿里通义千问Qwen2大模型发布并同步开源

阿里云开源通义千问Qwen2 开源策略改变行业格局

阿里云通义千问Qwen2大型模型正式发布同步开源

阿里发布最强开源大模型通义千问Qwen2，国产最好用的LLM

近期资讯

美农生物获得实用新型专利授权：“一种防止变形爆裂的旋转制粒机筛网”

中国电信获得发明专利授权：“媒体流迁移方法、装置、电子设备及存储介质”

掌握导入文件技巧，提升工作学习效率的实用指南

格力电器获得发明专利授权：“风机系统、空调器以及出风控制方法”

微信实名制的重要性与隐私挑战：安全与便利的平衡之道

掌握笔记本电脑BIOS进入技巧，优化性能与解决问题的必备指南

掌握Photoshop中扣印章的技巧与步骤，轻松提升作品专业度

金洲管道获得实用新型专利授权：“一种连接管件”

中国电信获得发明专利授权：“数据加密方法、装置、存储介质及处理器”

微波炉烧烤功能详解：使用技巧与美味食谱分享

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响