原标题:通义千问开源320亿参数模型
北京商报讯(记者 魏蔚)4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型,上述大模型均已升级至1.5版本。此次开源的320亿参数模型相比通义千问14B开源模型,在智能体场景下能力更强,相比通义千问72B开源模型,推理成本更低。
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
通义千问Hugging Face大语言模型
2024-04-07
北京商报讯(记者魏蔚)12月1日,阿里云开源了通义千问720亿参数模型Qwen-72B。根据10个权威基准测评结果,Qwen-72B性能超越开源标杆Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。当天,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
通义千问
北京商报 2023-12-01
阿里通义千问开源 320 亿参数模型,已实现 7 款大语言模型全开源 IT之家 4 月 8 日消息,4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到
通义千问大语言模型
IT之家 2024-04-08
速途网4月7日消息(报道:李楠)今日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
速途网 2024-04-07
12月1日,阿里云开源通义千问720亿参数模型Qwen-72B。据了解,该版本模型的性能超过Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
南方都市报 2023-12-01
朱克力博士/文AI大模型技术近两年呈现迅猛迭代之势,一个突出的问题是,超级应用迟迟未能出现,这让整个行业陷入深深的焦虑之中。大模型是生产要素配置的新质工具,根据生产函数关系理论,只有当生产要素通过应用转化为实际的生产力时,才能真正创造出经济价值。
经济观察报 2024-11-19
英特尔全新一代Ultra处理器也上市有一段时间了,这一代桌面端处理器使用了全新的ArrowLake架构,更换了底座,有着超高的能耗比以及强大的多线程能力。不少手持第十代第十一代i7处理器的DIY玩家想要升级CPU会继续选Ultra7,但挑选主板却犯了难,既要承受超频带来的高压又不至于性能过剩。
3DM游戏 2024-11-19
去年各大厂商开始推出8TB容量的固态硬盘,首发的1.5万元左右的上市价格令人望而却步。而最近,雷克沙AERS战神系列固态硬盘也推出了8TB版本新品,价格下探到5999元。IT之家已经拿到了这款新品,接下来就给大家带来开箱图赏。
IT之家 2024-11-19
11月19日消息,由北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学(LehighUniversity)组成的研究团队,最新推出了LLaVA-o1,这是首个具备自发性(Spontaneous,具体解释可参考文末)、类似于GPT-o1的系统性推理视觉语言模型。
砍柴网 2024-11-19
11月19日,全市科技大会暨科学技术奖励大会召开。中国科学院计算技术研究所研究员赵屹等人研发的“长链非编码基因系统发现及分子特性和功能的理论研究”项目,荣获2023年度北京市科学技术奖自然科学奖一等奖。“它展示了信息科学与生命科学的交叉合作,利用先进的计算技术揭示基因的复杂功能。”
北京日报 2024-11-19
11月18日下午,大飞机规模化中部区域动员会暨2024湖南航空制造业合作对接会在长沙举行,深入践行习近平总书记“大飞机事业一定要办好”的殷殷嘱托,高水平科技创新,高效能提升产能,携手推动大飞机规模化发展。国产大飞机从零起步,完成了“总装下线”“飞上蓝天”“实现商飞”的历史性跨越,是科技强国的里程碑、制造强国的助推器、交通强国的支撑点。
长沙晚报 2024-11-19
搜狐号小秘书 2024-11-19
金融界2024年11月19日消息,国家知识产权局信息显示,西安铭实机电设备有限公司取得一项名为“一种高灵敏度声磁同步定点仪”的专利,授权公告号CN222014278U,申请日期为2024年2月。
金融界 2024-11-19
大赛由绍兴市上虞区总工会主办、绍兴市上虞区e游小镇管委会承办,自9月初启动,总共收到104组报名作品,最终评审出团队组获奖作品6组,个人组获奖作品14组。大赛的举办也激发了职工们的学习热情和创造激情,为上虞的文艺事业注入了新的活力。
金台资讯 2024-11-19
今日(11月19日),2024中国5G+工业互联网大会在武汉召开。工业和信息化部党组成员、副部长张云明在会上表示,我国今年还将发布第二批高水平的5G工厂400个,推动5G+工业互联网在钢铁、装备、电子、采矿、港口等重点行业率先发展。
南方都市报 2024-11-19
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1