原标题:通义千问开源320亿参数模型
北京商报讯(记者 魏蔚)4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型,上述大模型均已升级至1.5版本。此次开源的320亿参数模型相比通义千问14B开源模型,在智能体场景下能力更强,相比通义千问72B开源模型,推理成本更低。
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
通义千问Hugging Face大语言模型
2024-04-07
北京商报讯(记者魏蔚)12月1日,阿里云开源了通义千问720亿参数模型Qwen-72B。根据10个权威基准测评结果,Qwen-72B性能超越开源标杆Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。当天,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
通义千问
北京商报 2023-12-01
阿里通义千问开源 320 亿参数模型,已实现 7 款大语言模型全开源 IT之家 4 月 8 日消息,4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到
通义千问大语言模型
IT之家 2024-04-08
速途网4月7日消息(报道:李楠)今日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
速途网 2024-04-07
12月1日,阿里云开源通义千问720亿参数模型Qwen-72B。据了解,该版本模型的性能超过Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
南方都市报 2023-12-01
专利摘要显示,本实用新型公开了一种旋转花样机的双底梭驱动机构,包括能转动的旋转座,旋转座安装有第一底梭安装座和第二底梭安装座。第一底梭安装座内设有能转动的第一垂直底梭,第一垂直底梭与第一垂直轴的上端连接,第一垂直轴安装有第一齿轮。第二底梭安装座内设有能转动的第二垂直底梭,第二垂直底梭与第二垂直轴的上端连接,第二垂直轴安装有第二齿轮。
金融界 2024-12-27
在工作中,用对方法能让我们事半功倍。本文分享了用户体验的两种有效工具:用户旅程图和痛点分析,学习好了,能帮我们提升不少效率。
DesignLink 2024-12-27
「手机爹这是给我干哪个圈子来了?」12月9日,科普博主「毕导」在抖音发布了一条瑞典行视频,带领观众沉浸式体验诺贝尔颁奖周现场。评论区不仅有粉丝自嘲「我何德何能...
降噪NoNoise 2024-12-27
金融界2024年12月27日消息,国家知识产权局信息显示,上海富山精密机械科技有限公司取得一项名为“缝纫机上切刀装置”的专利,授权公告号CN222205693U,申请日期为2024年2月。
这几年各个公司都在裁员和优化,叠加大量的毕业生涌入,导致剩下的打工人生存岌岌可危。困在原地的打工人:“付费上班”一年半,消费降级10倍。
财经故事荟 2024-12-27
金融界2024年12月27日消息,国家知识产权局信息显示,舒普智能技术股份有限公司取得一项名为“一种旋转花样机的双底线检测机构”的专利,授权公告号CN222205699U,申请日期为2024年1月。
随着二次元文化的兴起,谷子经济——以动漫、游戏等IP为核心的周边商品市场——正在成为年轻人新的消费热点。本文深入探讨了谷子文化的内涵、市场动态以及年轻人对谷子的狂热追求,揭示了这一新兴市场背后的经济现象和社会趋势。
新零售商业评论 2024-12-27
在数据分析的世界里,区分新手和高手的往往不是工具的使用技巧,而是对业务深度理解的标签积累。本文通过一个店铺分析的实例,揭示了如何通过构建有业务含义的标签来深化数据分析,从而提供更有价值的业务洞察。
接地气的陈老师 2024-12-27
作为中文武侠的泰斗,金庸先生的作品一直广为人知。这篇文章,我们就来学习一下,从武侠人物的塑造,看一下个人IP要如何养成。
学习做创业的契丹王 2024-12-27
毕业11年,经历了2次转行1次转岗,成功从测试转岗为了一名B端产品经理,但没想入行后就遭遇瓶颈。回归空杯心态后通过自我提升,现成功跳槽拿到了7份offer。如果你也想入...
起点课堂 2024-12-27
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1