当前位置：首页|资讯|通义千问|GPT-4

阿里云开源通义千问720亿参数模型率先实现大模型“全尺寸、全模态”开源

作者：证券日报发布时间：2023-12-01

通义千问 GPT-4

本报记者张敏见习记者梁傲男

12月1日，阿里云正式宣布，开源通义千问720亿参数模型Qwen-72B。Qwen-72B在10个权威基准测评创下开源模型最优成绩，成为业界最强开源大模型。

通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此，通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型，以及视觉理解、音频理解两款多模态大模型，实现“全尺寸、全模态”开源。

填补中国LLM开源领域空白

Qwen-72B基于3T tokens高质量数据训练，延续通义千问预训练模型一贯以来的强势表现，在10个权威基准测评中夺得开源模型最优成绩，在部分测评中超越闭源的GPT-3.5和GPT-4。

英语任务上，Qwen-72B在MMLU基准测试取得开源模型最高分；中文任务上，Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基准，得分超越GPT-4；数学推理方面，Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力有了质的飞跃。

此前，中国大模型市场还没出现足以对标Llama 2-70B的优质开源模型。Qwen-72B填补了国内空白，以高性能、高可控、高性价比的优势，提供不亚于商业闭源大模型的选择。基于Qwen-72B，大中型企业可开发商业应用，高校、科研院所可开展AI for Science等科研工作。

多模态探索业界领先

通义千问在多模态大模型领域的探索也领先业界一步，当天，阿里云首次开源音频理解大模型Qwen-Audio。

Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频，要求模型给出对音频的理解，甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。

通义大模型能“听”也能“看”。通义千问8月开源出视觉理解大模型Qwen-VL，迅速成为国际开源社区最佳实践之一。本次发布会又宣布了Qwen-VL的重大更新，大幅提升通用OCR、视觉推理、中文文本理解基础能力，还能处理各种分辨率和规格的图像，甚至能“看图做题”。不论从权威测评成绩还是真人体验的效果看，Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通义千问闭源模型也在持续进化，一个月前发布的通义千问2.0版闭源模型，最近已进阶至2.1版，上下文窗口长度扩展到32k，代码理解生成能力、数学推理能力、中英文百科知识、幻觉诱导抵抗能力分别提升30%、10%、近5%和14%。用户可以在通义千问APP免费体验最新版本的闭源模型。

（编辑郭之宸）

推荐体验

相关资讯

通义千问720亿参数模型开源，率先实现“全尺寸全模态”开源

12月1日通义千问发布会，阿里云开源通义千问720亿参数模型Qwen-72B。Qwen-72B在10个权威基准测评中创下开源模型最优成绩，成为业界最强开源大模型，性能超越开源标杆Llama2-70B和大部分商用闭源模型，可适配企业级、科研级的高性能应用。

极目新闻 2023-12-01

阿里云宣布通义千问开源720亿参数模型实现“全尺寸、全模态”开源

至此，通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型，以及视觉理解、音频理解两款多模态大模型，实现“全尺寸、全模态”开源。据介绍，Qwen-72B可以处理最多32k的长文本输入，在长文本…

通义千问大语言模型

中国网科技 2023-12-04

通义千问720亿参数模型开源实现“全尺寸全模态”开源

【CNMO新闻】12月1日消息，在通义千问发布会上，阿里云开源通义千问720亿参数模型Qwen-72B，此外，18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio也一同开源，阿里云在业界率先实现“全尺寸、全模态”开源。

手机中国 2023-12-01

阿里云通义千问720亿参数模型开源

12月1日，阿里云开源通义千问720亿参数模型Qwen-72B。据了解，该版本模型的性能超过Llama2-70B和大部分商用闭源模型，可适配企业级、科研级的高性能应用。此外，通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio，实现“全尺寸、全模态”开源。

南方都市报 2023-12-01

阿里云宣布通义千问 720 亿参数模型开源

IT之家12月1日消息，阿里云宣布开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B及音频大模型Qwen-Audio，目前已上线阿里魔搭社区。本次开源的模型中除预训练模型外，还同步推出了对应的对话模型，面向72B、1.8B对话模型提供了4bit/8bit量化版模型，便于开发者们推理训练。

IT之家 2023-12-01

近期资讯

四川超迪电器取得多工位夹取机械手专利，增加牢固性降低夹持稳定性问题

金融界2024年12月26日消息，国家知识产权局信息显示，四川超迪电器实业有限公司取得一项名为“一种多工位夹取机械手”的专利，授权公告号CN222200587U，申请日期为2024年4月。

金融界 2024-12-26

四川电保姆申请变压器后端油冷却智能减耗控制系统专利，实现变压器油冷的智能控制和无人值守

金融界2024年12月26日消息，国家知识产权局信息显示，四川电保姆电力服务有限公司申请一项名为“变压器后端油冷却智能减耗控制系统”的专利，公开号CN119179288A，申请日期为2024年10月。

金融界 2024-12-26

广东盛控达取得机械手取料装置专利，保证物件移送时的稳定性

金融界2024年12月26日消息，国家知识产权局信息显示，广东盛控达智能科技有限公司取得一项名为“一种机械手取料装置”的专利，授权公告号CN222200583U，申请日期为2024年5月。专利摘要显示，本实用新型涉及机械手技术领域，尤其涉及一种机械手取料装置。

金融界 2024-12-26

数渡信息科技申请一种参数化的可减少DFT使用引脚数量的控制器专利，该控制器引脚数量少硬件成本低

金融界2024年12月26日消息，国家知识产权局信息显示，北京数渡信息科技有限公司申请一项名为“一种参数化的可减少DFT使用引脚数量的控制器”的专利，公开号CN119179294A，申请日期为2024年11月。

金融界 2024-12-26

蓝京新能源取得圆柱电池抓取装置专利，有利于降低设备成本

金融界2024年12月26日消息，国家知识产权局信息显示，蓝京新能源（嘉兴）有限公司取得一项名为“一种圆柱电池的抓取装置”的专利，授权公告号CN222200582U，申请日期为2024年4月。

金融界 2024-12-26

宜昌千鸿再生资源取得多方向转动式手抓机专利，此装置能够将器件输送到多个方向，便于将器件输送到合适位置

金融界2024年12月26日消息，国家知识产权局信息显示，宜昌千鸿再生资源有限公司取得一项名为“一种多方向转动式手抓机”的专利，授权公告号CN222200585U，申请日期为2024年5月。

金融界 2024-12-26

中晟半导体申请目标控制信号生成相关专利，产生连续平滑控制信号

金融界2024年12月26日消息，国家知识产权局信息显示，中晟半导体（上海）有限公司申请一项名为“目标控制信号生成方法、装置及计算机可读存储介质”的专利，公开号CN119179293A，申请日期为2024年11月。

金融界 2024-12-26

江西省交通工程集团申请混凝土拌合站信息自动采集专利，能够确保混凝土拌合站信息自动采集获取完整数据

金融界2024年12月26日消息，国家知识产权局信息显示，江西省交通工程集团有限公司申请一项名为“一种混凝土拌合站信息自动采集方法及系统”的专利，公开号CN119179292A，申请日期为2024年11月。专利摘要显示，本发明实施例涉及混凝土拌合技术领域，具体公开了一种混凝土拌合站信息自动采集方法及系统。

金融界 2024-12-26

上海逸赫自动化设备取得仪表刻度盘装配夹具专利，防止零件在移动时掉落损坏

金融界2024年12月26日消息，国家知识产权局信息显示，上海逸赫自动化设备有限公司取得一项名为“仪表刻度盘装配夹具”的专利，授权公告号CN222200584U，申请日期为2024年5月。

金融界 2024-12-26

南京和邦能源科技申请用于智能透平控制器的协同控制方法专利，提高了系统的稳定性和精度

金融界2024年12月26日消息，国家知识产权局信息显示，南京和邦能源科技有限公司申请一项名为“用于智能透平控制器的协同控制方法”的专利，公开号CN119179291A，申请日期为2024年11月。

金融界 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1