通义千问开源1100亿参数大模型，支持多语种训练

作者：大力财经发布时间：2024-04-29

据头部财经了解，通义千问宣布开源了其1100亿参数模型Qwen1.5-110B，这一举动立即引发了业界的广泛关注。

通义千问1100亿参数模型延续了Qwen1.5系列的Transformer解码器架构，采用了分组查询注意力方法（GQA），使得模型在推理时更加高效。110B模型支持32K上下文长度，具备优秀的多语言能力，支持中、英、法、德、西、俄、日、韩、越、阿拉伯等多种语言。

Qwen1.5-110B的出色表现并非偶然，它延续了Qwen1.5系列的Transformer解码器架构，并采用了先进的分组查询注意力方法（GQA），使得模型在推理时更加高效。同时，该模型支持32K上下文长度，并具备优秀的多语言能力，支持多种语言，展现了其强大的跨语言处理能力。

值得一提的是，Qwen1.5-110B在MMLU、TheoremQA、GPQA等多个基准测评中均取得了优异的成绩。研发团队指出，尽管预训练方法与同系列其他模型并无明显差异，但性能的提升主要得益于参数规模的扩增。这一发现为大模型的研发提供了新的思路，即通过增加参数规模来提升模型性能。

此外，通义千问团队在不到3个月的时间内连续推出了8款大语言模型，模型参数规模从5亿到1100亿不等，展现了其强大的研发实力和高效的工作能力。这些模型在开源社区中收获了热烈反响，吸引了大量开发者的关注和使用。

目前，通义千问的开源模型下载量已经超过了700万，这一数字不仅彰显了其模型的受欢迎程度，也证明了通义千问在开源社区中的影响力。开发者可以在魔搭社区ModelScope和HuggingFace等开源社区轻松下载并使用Qwen1.5-110B，为他们的项目提供强大的支持。

随着通义大模型的落地应用开启加速度，越来越多的企业开始接入通义大模型，探索其在各个领域的应用潜力。从新东方、同程旅行到长安汽车、西部机场集团，再到亲宝宝等多家企业，他们都看中了通义大模型在数据处理、智能客服、风险识别等方面的优势，希望借助大模型的力量提升业务效率和用户体验。

不仅如此，通义大模型还在天文观测、矿山安全等领域取得了突破性的应用。中国科学院国家天文台基于通义千问开源模型开发了新一代天文大模型“星语3.0”，将大模型技术首次应用于天文观测领域，为天文学研究提供了全新的视角和工具。同时，陕煤建新煤矿等十余座矿山也推出了由通义大模型支持的新型矿山重大风险识别处置系统，实现了对矿山安全风险的实时监测和预警，为矿山安全生产提供了有力保障。

来源：https://www.top168.com/news/202404/6016.html

通义千问开源1100亿参数大模型，支持多语种训练

推荐体验

相关资讯

阿里云发布通义千问2.5，开源通义千问1100亿参数模型

通义千问再开源推出最大尺寸1100亿参数模型

通义千问开源720亿参数模型

阿里云开源70亿参数通义千问大模型

通义千问2.5正式发布！1100亿参数开源模型超越Llama 3，通义APP免费开放全栈能力

近期资讯

中国石化获得实用新型专利授权：“一种带式真空过滤机滤布清洗装置”

高效微信群发技巧：提升沟通质量与互动，增强群聊活力与趣味性

中兴通讯获得发明专利授权：“通信方法、通信系统、通信设备及计算机可读存储介质”

高效复制文档的实用技巧与方法分享，助你轻松应对日常需求

莱斯信息获得发明专利授权：“适用于指挥态势图的箭头定位方法及系统”

魔声耳机评测：音质、舒适度与设计的完美结合，是否值得购买？

高效利用电脑：掌握显示桌面的小技巧与操作方法分享

长飞光纤获得实用新型专利授权：“一种偏振玻璃测量载物架及测量装置”

八一钢铁获得实用新型专利授权：“一种应用于摆剪的新型锁紧缸”

在Word中绘制虚线的多种方法与技巧解析

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响