原标题:通义千问开源320亿参数模型
北京商报讯(记者 魏蔚)4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型,上述大模型均已升级至1.5版本。此次开源的320亿参数模型相比通义千问14B开源模型,在智能体场景下能力更强,相比通义千问72B开源模型,推理成本更低。
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
通义千问Hugging Face大语言模型
2024-04-07
北京商报讯(记者魏蔚)12月1日,阿里云开源了通义千问720亿参数模型Qwen-72B。根据10个权威基准测评结果,Qwen-72B性能超越开源标杆Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。当天,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
通义千问
北京商报 2023-12-01
阿里通义千问开源 320 亿参数模型,已实现 7 款大语言模型全开源 IT之家 4 月 8 日消息,4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到
通义千问大语言模型
IT之家 2024-04-08
速途网4月7日消息(报道:李楠)今日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
速途网 2024-04-07
12月1日,阿里云开源通义千问720亿参数模型Qwen-72B。据了解,该版本模型的性能超过Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
南方都市报 2023-12-01
在 Webpack 中使用 babel-loader 处理 JavaScript 文件时,其处理链路可以分解为以下详细步骤: 1. Webpack 构建启动: Webpack 根据配置文件 (webp
小小小小宇 2024-12-29
本文主要思考下技术面应该如何去面试,既能体现面试官的素质和专业性,又能考察候选人的技术能力和工作经验和项目经验是否匹配。同时候选人也可以通过阅读本文来查漏补缺,揣摩面试官的意图。
牛奶 2024-12-29
1.介绍 文件系统结构重点关注目录如何以层次方式组织和管理文件。本综合指南探讨了目录结构、它们的实现和管理技术,这些构成了现代文件系统的架构。 2.目录结构基础 目录结构的核心概念: 分级组织: 文件
电赛小陈找出路 2024-12-29
本文将从部署开始,详细讲一下如何使用 llamafactory 对开源模型进行指令微调了,并且在微调过程中我是如何一次一次地进行参数调整的,我也跟各位分享一下。
Kida的技术小屋 2024-12-29
在多媒体应用中,实时传输协议(RTSP)用于流媒体服务,特别是音视频监控系统。通过 C# 和 RTSPClient 库,可以轻松实现简易的音视频解码和播放功能。
小码编匠 2024-12-29
前言 在 Easysearch / Elasticsearch / Opensearch 管理系统中,对于不同集群不同指标数据进行采集是一个常规任务。但是采集过程中不仅会对采集系统 CPU 和访问性能
极限实验室 2024-12-29
Material Design 是由 Google 开发的一套设计指南,提供统一的设计语言,使用户界面更加直观、美观和一致。
根据俄新社12月25日的报道,一架客机在偏离原本航线数百公里之后,在哈萨克斯坦的阿克套市的郊区坠毁。从当地市民发布在社交媒体上的视频可以看到,客机在触地之后发生爆炸,并形成巨大火球。该客机是一架由巴西航空工业公司制造的190客机。莫斯科时间12月25日早上6点50分,该飞机从阿塞拜疆的巴库起飞,预计8点20在俄罗斯的格罗慈尼降落。机上一共载有67名乘客和5名机组人员。其中15人来自阿塞拜疆、9人来自俄罗斯,两名来自吉尔吉斯斯坦。截止到发稿前,该空难事件已经造成已造成38人死亡,32人幸存。不过值
兵说 2024-12-29
1.介绍 文件系统是操作系统的基本组件,用于管理数据存储和检索。本文探讨了文件系统的基本概念和实现细节,重点关注构成复杂文件系统结构的基础文件概念 2.文件系统核心概念 基本要素: 文件 解释:文件是
经过Vue3的洗礼,最近初始React18,还是觉得有必要对比一下两者进行通信的方式。 主要以 ‘父子通信’,‘兄弟通信’,‘跨域通信’ 后文章有点长,可以收藏起来,慢慢看~~ 但是不要让这篇文章吃灰
ys指风不买醉 2024-12-29
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1