当前位置：首页|资讯|通义千问

通义千问开源320亿参数大模型开源“葫芦娃”家族全部凑齐

作者：IT时报发布时间：2024-04-09

通义千问开源320亿参数大模型开源“葫芦娃”家族全部凑齐

作者：郝俊慧来源：IT时报

4月7日，阿里云通义千问开源320亿参数模型Qwen1.5-32B，加上此前已经开源的5亿、18亿、40亿、70亿、140亿和720亿参数的六款大语言模型，截至目前，通义千问共开源了7款大语言模型，至此凑齐阿里云的开源“葫芦娃”家族。　　

参数，意指大模型在训练中不断调整的变量和权重。简单理解，AI的训练过程就是一个不断接近和仿真真实世界的过程，在输入大量真实数据后，大模型不断调整参数从而逐步提高结果的准确性。某种意义上，参数越多，AI的结果越有可能具备“智能”，但相应的算力成本也越高。　　

据阿里云透露，7款大模型中，几款小尺寸模型可便捷地在端侧部署。3月28日，阿里云和联发科联合宣布，通义千问18亿、40亿参数大模型已成功部署进天玑9300移动平台，这是通义大模型首次完成芯片级的软硬适配，即使在离线状态下，仅靠手机芯片的算力，用户也可以通过通义千问完成多轮AI对话，实现AI推理。　　

720亿参数模型是目前通义千问大家族中参数规模最大的开源大模型，于去年12月1日正式开源，并在12月8日登顶全球最大的开源大模型社区HuggingFace的开源大模型排行榜。　　

不过，也有专家认为，达到性能质变的奇点后，参数规模与模型性能之间的关系将不再完全正相关。　　

这一点在通义千问32B和72B两个不同参数规模大模型的能力对比方面似乎得到部分印证。

据阿里云透露，基础能力方面，通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异，性能接近通义千问720亿参数模型。

Chat模型方面，Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分，与Qwen1.5-72B-Chat之间的差距相对较小；多语言能力方面，通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言，在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。　　

通义千问团队希望32B开源模型能为下游应用提供更好的解决方案，在性能、效率和内存占用之间实现更理想的平衡。例如，相比14B模型，32B在智能体场景下能力更强；相比72B，32B的推理成本更低。

推荐体验

相关资讯

通义千问开源320亿参数大模型阿里云集齐开源“葫芦娃”

4月7日，阿里云通义千问开源320亿参数模型Qwen1.5-32B，加上此前已经开源的5亿、18亿、40亿、70亿、140亿和720亿参数的六款大语言模型，截至目前，通义千问共开源了7款大语言模型，至此凑齐阿…

通义千问大语言模型

IT时报 2024-04-15

通义千问开源320亿参数模型

4月7日，阿里云通义千问开源320亿参数模型Qwen1.5-32B，此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型，上述大模型均已升级至1.5版本。此次开源的320亿参数模型相比通义千问14B开源模型，在智能体场景下能力更强，相比通义千问72B开源模型，推理成本更低。

通义千问大语言模型

北京商报 2024-04-07

通义千问开源320亿参数模型，已实现7款大语言模型全开源

4月7日消息，阿里云通义千问开源320亿参数模型Qwen1.5-32B，可最大限度兼顾性能、效率和内存占用的平衡，为企业和开发者提供更高性价比的模型选择。目前，通义千问共开源了7款大语言模型，在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本，其中，几款小尺寸模型可便捷地在端侧部署，720亿参数模型则拥有业界领先的性能，多次登上HuggingFace等模型榜单。此次开源的320亿参数模型，将在性能、效率和内存占用之间实现更理想的平衡，例如，相比14B模型，32B在智能体场景下能力更强；相比72B，32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。基础能力方面，通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异，性能接近通义千问720亿参数模型，远超其他300亿级参数模型。Chat模型方面，Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分，与Qwen1.5-72B-Chat之间的差距相对较小。多语言能力方面，通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言，在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问 Hugging Face 大语言模型

2024-04-07

阿里通义千问开源 320 亿参数模型，已实现 7 款大语言模型全开源

阿里通义千问开源 320 亿参数模型，已实现 7 款大语言模型全开源 IT之家 4 月 8 日消息，4 月 7 日，阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到

通义千问大语言模型

IT之家 2024-04-08

阿里云开源70亿参数通义千问大模型

两款模型均已上线AI模型社区魔搭 ModelScope ，且两款模型都是开源、免费、可商用的。

LAN 2023-08-04

近期资讯

一个超有用的投资评估指标

回归年化收益率

狐狸君raphael 2024-12-30

「纽邦生物」获数千万元B轮融资，加速创新型膳食营养补充剂原料开发｜36氪首发

纽邦生物已打造全链条创新能力，每年推出5-10个膳食营养补充剂创新原料，拥有40余项To B“要素品牌”。

胡香赟 2024-12-30

李想画起饼来，比马斯克还科幻

理想汽车的使命又变了？

雪豹财经社 2024-12-30

不想给人生“加杠杆”的00后，放弃考研了

我原谅了“自毁前程”的自己。

表外表里 2024-12-30

区街镇产城品牌如何才能升格成为大城市超级IP

区街镇的小标签小符号小品牌正成为大城市的超级IP小切口？区街镇在所属城市IP产业名片打造过程中，往往面临资源不足、方向模糊等问题，自身本就不高的品牌势能、产业动能和文化效能容易淹没在城市品牌大战浪潮中，区街镇这些产城品牌又该如何破局呢？

石章强品牌营 2024-12-30

AI零食真能吃吗？我们买了AI薯条尝了尝，结果很意外

AI，正在成为新的工业驱动器。

智能Pro 2024-12-30

男人最爱的龙头，卷不动了

真被低估了吗？

格隆汇 2024-12-30

药品说明书为什么字小又难懂？

药品说明书上的字能否印大？

36氪的朋友们 2024-12-30

热潮继续，中国市场2024运动鞋服行业的6点趋势

消费降级加上运动热，如何影响到运动鞋服行业？

懒熊体育 2024-12-30

股神巴菲特出手抄底？股市扫货的巴菲特意欲何为？

巴菲特增持能源股，传递接班权。

江瀚视野 2024-12-30

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1