通义千问Qwen1.5-110B来了!这个Qwen1.5系列的新成员创下了一个里程碑:拥有超过1000亿参数的庞大规模! 模型亮点:架构:用了一种叫Transformer解码器的架构,还有个叫分组查询注意力(GQA)的东西。性能:无论是标准测试还是聊天模型测试,都厉害得很。多语言支持:说多少种语言都行,而且还能处理长篇大论![图片] 详细:https://reurl.cc/qVOong 或搜同名号:AIFOX [图片]...【查看原文】
通义千问首次推出千亿级参数模型Qwen1.5-110B,在MMLU、TheoremQA、GPQA等多个基准测评中展现出卓越性能。目前Qwen1.5系列已累计开源10款大模型,通义千问开源模型下载量超过700万。
通义千问
金融界 2024-04-29
阿里巴巴日前宣布,开源 Qwen1.5 系列首个千亿参数模型 Qwen1.5-110B。据称,此款新模型在各项性能指标上都展现出了显著的能力,特别是在与业界领先的Meta-Llama3-70B模型的对
阿里巴巴通义千问
网界 2024-04-28
鞭牛士12月1日消息,在通义千问发布会现场,财经网消息阿里云宣布开源通义千问720亿参数模型Qwen-72B。此外,通义千问当天还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
鞭牛士 2023-12-01
速途网4月7日消息(报道:李楠)今日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
通义千问大语言模型
速途网 2024-04-07
据阿里云官方消息,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。
2023-09-25
ETF为啥不与港股交易时间同步
36氪的朋友们 2024-12-27
官方机构下场、主打免费和便利,政府版“房产超市”对现有的房产交易行业,会是很大的冲击吗?
未来城不落 2024-12-27
国企退休前夕,我卖掉一套房子独自去留学
一条 2024-12-27
腾讯网易终于甩开了米哈游。
徐翔家族资本市场还有多少布局?
野马财经 2024-12-27
据不完全统计,已有24家券商积极拥抱AI大模型,在投研、投顾、风控、运营等多个领域展开了深入探索和应用。
得专业内容者得天下
新播场 2024-12-27
英伟达将于两周后发布基于BlackWell架构的RTX 50系显卡,5090显卡的PCB设计本周浮出水面。
起起伏伏的2024剧集
娱乐独角兽 2024-12-27
食品安全始终是餐饮企业的底线
斑马消费 2024-12-27
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1