阿里云发布全球最强开源LLM“Qwen2”：性能超越众多闭源模型、火速登顶HuggingFace

作者：OSC开源社区发布时间：2024-06-18

Hugging Face 通义千问编程

通义千问最新开源LLM——比中国闭源模型们更强的开源模型来了！

6月7日凌晨，阿里云更新技术博客：重磅发布全球性能最强的开源模型——Qwen2-72B，据称性能超过美国最强的开源模型Llama3-70B，也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。

所有人均可在魔搭社区和Hugging Face免费下载通义千问最新开源模型。

Qwen2 刚发布就已登顶 HuggingFace Open LLM 榜首：

Qwen2亮点省流总结：

- 5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B；

- 在中文英语的基础上，训练数据中增加了27种语言相关的高质量数据；

- 多个评测基准上的领先表现；

- 代码和数学能力显著提升；

- 增大了上下文长度支持，最高达到128K tokens（Qwen2-72B-Instruct）。

相比2月推出的通义千问Qwen1.5，Qwen2实现了整体性能的代际飞跃。

在权威模型测评榜单OpenCompass中，此前开源的Qwen1.5-110B已领先于文心4.0等一众中国闭源模型。刚刚开源的Qwen2-72B，整体性能相比Qwen1.5-110B又取得了大幅提升。

通义千问Qwen2系列模型大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。

在MMLU、GPQA、HumanEval、GSM8K、BBH、MT-Bench、Arena Hard、LiveCodeBench等国际权威测评中，Qwen2-72B一举斩获十几项世界冠军，超过美国的Llama3。

通义千问团队在技术博客中披露，Qwen2系列包含5个尺寸的预训练和指令微调模型，Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B，其中Qwen2-57B-A14B为混合专家模型（MoE）。

Qwen2所有尺寸模型都使用了GQA（分组查询注意力）机制，以便让用户体验到GQA带来的推理加速和显存占用降低的优势。

在中英文之外，模型训练数据中增加了27种语言相关的高质量数据，提升了模型的多语言能力。Qwen2还增大了上下文长度支持，Qwen2-72B-Instruct能够完美处理128k上下文长度内的信息抽取任务。

Reference

https://qwenlm.github.io/zh/blog/qwen2/

https://modelscope.cn/models/qwen/Qwen2-72B/

https://modelscope.cn/models/qwen/Qwen2-72B-Instruct/summary

END

相关资讯

阿里云发布开源模型Qwen2，性能超越众多中国闭源模型

6月7日，阿里云更新技术博客：重磅发布开源模型Qwen2-72B，性能超过美国最强的开源模型Llama3-70B，也超过众多中国闭源大模型。所有人均可在魔搭社区和HuggingFace免费下载通义千问最新开源模型。在权威模型测评榜单OpenCompass中，此前开源的Qwen1.5-110B已领先于很多中国闭源模型。

源大模型 Hugging Face

扬子晚报 2024-06-07

阿里云发布最强开源模型Qwen2

此外，还将把Qwen2扩展成多模态模型，融入视觉及语音的理解。据阿里云通义千问团队披露，Qwen2系列包含5个尺寸的预训练和指令微调模型，Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B，其中Qwen2-57B-A14B为混合专家模型（MoE）。

通义千问

中国证券报 2024-06-07

阿里云发布最强开源大模型Qwen2，干翻Llama 3，比闭源模型还强

先是今年4月Meta发布的Llama3-70B赶超GeminiPro1.5等一众闭源模型，被当作“开源模型将一举翻越GPT-4高峰”的标志；然后是今日阿里云推出的Qwen2-72B再次屠榜，不仅赶超Llama…

LLaMA GPT-4

智东西 2024-06-21

最强开源大模型面世：阿里发布Qwen2

SiliconCloud是集合主流开源大模型的一站式云服务平台，为开发者提供更快、更便宜、更全面的模型API，为生成式AI应用带来更高效的用户体验。

生成式AI

OneFlow一流科技 2024-06-27

阿里发布最强开源大模型通义千问Qwen2，国产最好用的LLM

前言近年来，大模型技术发展迅速，开源模型的出现为AI研究和应用带来了新的活力。在这一背景下，阿里云通义千问团队发布了全新升级的Qwen2系列开源模型，为国内外开发者提供了更强大的工具和更丰富的选择。

通义千问

努力犯错玩AI 2024-06-11

阿里云发布全球最强开源LLM“Qwen2”：性能超越众多闭源模型、火速登顶HuggingFace

推荐体验

相关资讯

阿里云发布开源模型Qwen2，性能超越众多中国闭源模型

阿里云发布最强开源模型Qwen2

阿里云发布最强开源大模型Qwen2，干翻Llama 3，比闭源模型还强

最强开源大模型面世：阿里发布Qwen2

阿里发布最强开源大模型通义千问Qwen2，国产最好用的LLM

近期资讯

手机的诞生与背后故事：科技、材料与工艺的复杂结合

掌握QQ消息撤回技巧，提升社交沟通自信与灵活性

聚飞光电获得发明专利授权：“半导体封装器件、发光装置及半导体集成电路的制作方法”

手机打不开的原因与解决办法：保持冷静，轻松应对常见问题

美股异动 | 盟云全息(HOLO.US)盘前涨超110% 业务涵盖全息投影技术的多个领域

厦门钨业获得发明专利授权：“一种从萃余液中回收萃取剂的设备和方法”

手机恢复出厂设置的意义与注意事项：如何让手机焕发新生？

工商银行获得发明专利授权：“准入模型的变量处理方法及装置”

亿纬锂能获得实用新型专利授权：“电芯热失控的试验装置”

如何轻松绘制气球：增添生活乐趣与创意的艺术技巧

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响