4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,其希望32B开源模型能为企业和开发者提供更高性价比的模型选择。
基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。
Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。
目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
此前报道,3月22日,阿里通义千问大模型迎来重磅升级,将向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。
阿里云方面称,目前通义千问的文档处理容量和能力,已超越ChatGPT等全世界市场上所有的AI应用。
来源:读创财经