通义千问Qwen1.5-110B来了!这个Qwen1.5系列的新成员创下了一个里程碑:拥有超过1000亿参数的庞大规模! 模型亮点:架构:用了一种叫Transformer解码器的架构,还有个叫分组查询注意力(GQA)的东西。性能:无论是标准测试还是聊天模型测试,都厉害得很。多语言支持:说多少种语言都行,而且还能处理长篇大论![图片] 详细:https://reurl.cc/qVOong 或搜同名号:AIFOX [图片]...【查看原文】
通义千问首次推出千亿级参数模型Qwen1.5-110B,在MMLU、TheoremQA、GPQA等多个基准测评中展现出卓越性能。目前Qwen1.5系列已累计开源10款大模型,通义千问开源模型下载量超过700万。
通义千问
金融界 2024-04-29
阿里巴巴日前宣布,开源 Qwen1.5 系列首个千亿参数模型 Qwen1.5-110B。据称,此款新模型在各项性能指标上都展现出了显著的能力,特别是在与业界领先的Meta-Llama3-70B模型的对
阿里巴巴通义千问
网界 2024-04-28
鞭牛士12月1日消息,在通义千问发布会现场,财经网消息阿里云宣布开源通义千问720亿参数模型Qwen-72B。此外,通义千问当天还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
鞭牛士 2023-12-01
速途网4月7日消息(报道:李楠)今日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
通义千问大语言模型
速途网 2024-04-07
据阿里云官方消息,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。
2023-09-25
作为低空经济的重要载体,今年以来,eVTOL一直被热切关注。随之而来的是政策托举、融资升温。
36氪的朋友们 2024-12-30
比音勒芬雄心受挫。
砺石商业评论 2024-12-30
“资源有限的话,智能驾驶和理想同学我也不会二选一,我会削减其他的投入”
电厂 2024-12-30
我的设计确实是性感的,但它不是只表达了性感。
一条 2024-12-30
李想不想只做一棵树,他要的是森林。
中国企业家杂志 2024-12-30
上市成为新茶饮们的最终归宿。
定焦One 2024-12-30
CEO工资竟然不是最高的??
量子位 2024-12-30
解决痛点并非没有办法。
巴伦周刊 2024-12-30
星巴克能进行“下沉”自我救赎?
鲸商 2024-12-30
金饰市场“旺人气不旺量” ,投资产品热度走高
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1