当前位置：首页|资讯|通义千问|大语言模型

720亿、千亿级参数大模型接连开放国产开源大模型进入参数时代

作者：封面新闻发布时间：2023-12-01

通义千问大语言模型

封面新闻记者欧阳宏宇

围绕开源大模型打响的混战正演变为参数之争。

12月1日，阿里云宣布开源通义千问720亿参数模型Qwen-72B，18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此，通义大模型共开源18亿、70亿、140亿、720亿参数的四款大语言模型，以及视觉理解、音频理解两款多模态大模型，完成了“全尺寸、全模态”开源。

全球互联网科技大厂掀起“百模大战”以来，越来越多的通用大模型走向开源，主要的开源AI大模型参数也越来越大。

今年6月，搜狗创始人王小川创立的百川智能公司宣布推出70亿参数量的中英文预训练大模型baichuan-7B，同时宣布开源。昆仑万维在上月开源了自研大语言模型“天工”Skywork-13B，开源参数规模突破百亿级。几天后，李开复创办的零一万物宣布开源发布大模型 Yi-34B，又将参数规模进一步扩大；元象XVERSE还宣布开源了650亿参数高性能通用大模型XVERSE-65B。

事实上，720亿参数也不是国内参数规模最大的开源大模型。就在几天前，浪潮信息还发布了“源2.0”基础大模型，并宣布全面开源，包含1026亿、518亿、21亿三种参数规模。

据中国科学技术信息研究所数据显示，国内已经发布了超80个大模型，超半数大模型已实现开源。在AI模型开源社区魔搭上，已有超20个开源大模型免费提供给开发者使用，目前，AI模型下载量已突破1亿。

伴随参数之争愈发“白热化”，背后是大模型供应厂商期待通过大规模的参数训练形成质变。在清华大学计算机系教授唐杰看来，万亿参数大模型只是一个开始，他透露已在大模型上观察到了以往小模型上所不曾有过的现象；不过，他也承认，单靠增加训练数据量或模型参数规模不足以实现“智能”。

不过，AI大模型需要多大的参数规模才够用行业还无定论。OpenAI CEO阿尔特曼表示，规模越大并不一定意味着模型越好，而可能只是为了追求一个数字而已。还有研究者指出，在大模型达到性能质变的奇点后，参数规模与模型性能之间的关系将不再完全正相关。

推荐体验

相关资讯

阿里巴巴开源720亿参数大模型，助力AI创新

阿里巴巴集团CEO吴泳铭在2023年世界互联网大会乌镇峰会上透露，阿里巴巴将开源一款规模达到720亿参数的大模型，是国内参数规模最大的开源大模型。阿里巴巴此前已经开源了两个模型，分别是拥有140亿参数的通义千问(Qwen-14B)和拥...

阿里巴巴通义千问

雨圣科技 2023-11-15

通义千问开源720亿参数模型

北京商报讯（记者魏蔚）12月1日，阿里云开源了通义千问720亿参数模型Qwen-72B。根据10个权威基准测评结果，Qwen-72B性能超越开源标杆Llama2-70B和大部分商用闭源模型，可适配企业级、科研级的高性能应用。当天，通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio，实现“全尺寸、全模态”开源。

北京商报 2023-12-01

最强开源大模型！阿里云开源通义千问720亿参数模型

阿里云举办通义千问发布会，宣布开源通义千问720亿参数模型Qwen-72B。该模型基于3Ttokens高质量数据训练，在10个权威基准测评中荣获最佳成绩，超越了开源标杆Llama2-70B和大部分商用闭源模型，成为业界最强的开源大模型。其性能已经得到了中小企业和个人开发者的青睐，并且累计下载量超过150万，催生了150多款新模型和应用。

中关村在线 2023-12-01

通义千问开源千亿级参数模型

鞭牛士4月28日消息，通义千问开源1100亿参数模型Qwen1.5-110B，成为全系列首个千亿级参数开源模型，并在多项基准测评中都创下可与Llama3-70B媲美的成绩。目前Qwen1.5系列已累计开源10…

鞭牛士 2024-04-28

阿里云宣布通义千问720亿参数模型开源，还有多款大模型同时开源

目前，已经有多家国产厂商宣布了自己的AI的生成式AI产品或大模型，包括百度“文心一言”、阿里巴巴“通义千问”、360“360智脑”等多款产品，其中百度最早进行测试的AI产品，目前已经可以在一些场景进行实际的应…

通义千问文心一言生成式AI 百度

科技美学 2023-12-06

近期资讯

Java 异常处理：原理、实践与最佳策略

Java 异常处理：原理、实践与最佳策略在程序开发中，异常处理是一项重要的技能。无论是读取文件、访问数据库还是处理用户输入，异常随时可能发生。通过合理的异常处理，程序可以更具健壮性，避免因未处理的异

Java移动技术栈 2024-12-29

我国固体火箭技术杰出专家邢球痕院士逝世享年95岁

快科技12月29日消息，据“中国航天科技集团”官微发文，中国科学院院士、我国固体火箭技术领域的杰出专家，原航天工业部第四研究院院长邢球痕同志，因病医治无效，于2024年12月29日凌

2024-12-29

猜猜他是谁！比亚迪官宣“夏”MPV形象代言人即将揭晓

快科技12月29日消息，比亚迪近日宣布，其中大型智能旗舰MPV——比亚迪夏的形象代言人即将亮相。比亚迪透露，代言人的海报关键词包括技艺精湛、沉稳、硬朗、铁汉柔情、实力派影帝、戏

2024-12-29

人类思维的速度竟然只有每秒10比特！这么慢怎么活

互联网数据的传输速度可以用每秒传输的比特数来衡量，单位为bps，如果我们想要不卡顿地进行720p高清视频通话，最少大约需要120万bps（每秒120万比特）的速度，而2024年中国带宽的平均下载速度达

2024-12-29

韩失事客机下一航班为济州飞北京中国游客：打算坐船回国

快科技12月29日消息，今日上午韩国济州航空一架客机在着陆时脱离跑道，撞上围墙后爆炸起火，事故已致179人遇难，2人生还。韩国全罗南道务安国际机场针对近期发生的客机事故发布官方回应，指出

2024-12-29

Java中的String.valueOf()和toString()方法详解

在Java编程中，字符串操作是开发者日常编程任务中不可或缺的一部分。尤其是在处理对象和基本数据类型时，将其转换为字符串是一种常见需求。

Huooya 2024-12-29

Performance Tip: Specify Collection Capacity When Size is Known

When working with Java collections, their ability to grow dynamically is often valuable. Yet, if you

Richard2012 2024-12-29

从零实现LevelDB 3. MemTable实现

在本节，我们将会了解并实现： 1. LevelDB的内部键InternalKey和LookupKey及对应的比较器 2. Memtable

李沐阳_ 2024-12-29

全球航空一天连发3次事故！韩国客机爆炸179人遇难

年底了，全球航空业突然重大事故频发，让人心惊肉跳。首先是当地时间12月25日，一架从阿塞拜疆巴库飞往俄罗斯格罗兹尼的阿塞拜疆航空公司客机在哈萨克斯坦阿克套近郊坠毁，机上载有67人，结果

2024-12-29

Spring Cloud - 注册中心（Nacos）原理及代码实战

本文详细介绍了注册中心的基本原理和功能，以及 Nacos 作为注册中心的具体应用，包括服务注册、服务发现、配置管理和动态路由等核心功能的实现方法和配置步骤。

LoopLee 2024-12-29

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1