通义千问Qwen1.5-110B来了!这个Qwen1.5系列的新成员创下了一个里程碑:拥有超过1000亿参数的庞大规模! 模型亮点:架构:用了一种叫Transformer解码器的架构,还有个叫分组查询注意力(GQA)的东西。性能:无论是标准测试还是聊天模型测试,都厉害得很。多语言支持:说多少种语言都行,而且还能处理长篇大论![图片] 详细:https://reurl.cc/qVOong 或搜同名号:AIFOX [图片]...【查看原文】
通义千问首次推出千亿级参数模型Qwen1.5-110B,在MMLU、TheoremQA、GPQA等多个基准测评中展现出卓越性能。目前Qwen1.5系列已累计开源10款大模型,通义千问开源模型下载量超过700万。
通义千问
金融界 2024-04-29
阿里巴巴日前宣布,开源 Qwen1.5 系列首个千亿参数模型 Qwen1.5-110B。据称,此款新模型在各项性能指标上都展现出了显著的能力,特别是在与业界领先的Meta-Llama3-70B模型的对
阿里巴巴通义千问
网界 2024-04-28
鞭牛士12月1日消息,在通义千问发布会现场,财经网消息阿里云宣布开源通义千问720亿参数模型Qwen-72B。此外,通义千问当天还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
鞭牛士 2023-12-01
速途网4月7日消息(报道:李楠)今日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
通义千问大语言模型
速途网 2024-04-07
据阿里云官方消息,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。
2023-09-25
放不放男人进来。
娱乐硬糖 2024-12-27
大脑与AI的结合
新智元 2024-12-27
为进一步推进全球化战略布局,宁德时代宣布赴港上市,或可达到不多于30日的快速审批标准
中国基金报 2024-12-27
SpaceX超越字节跳动,成为全球市值最高的私营公司。
硅谷101 2024-12-27
技术突破
巨潮 WAVE 2024-12-27
餐饮成功三要素:产品力、单店盈利模型、扩张节奏。
红餐网 2024-12-27
Lilium是继亿航和Joby后第三家在美上市的电动航空企业,但资金链一直紧张。
雷帝触网 2024-12-27
冬季的新茶饮,开店难。
茶咖观察 2024-12-27
盲盒经济走到哪里都是通的
真故研究室 2024-12-27
本次广汽集团打造的人形机器人融合了四轮足、两轮足两种模式。有观点认为,汽车生产车间不缺机器人,但人形机器人进车间仍需加深场景理解,突破更多的技术边界。
36氪的朋友们 2024-12-27
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1