阿里云发布通义千问开源模型，打响大厂开源第一枪 | 最前线

作者：36氪发布时间：2023-08-04

通义千问

作者 | 周愚

编辑 | 邓咏仪

在这场国内大模型的“百模大战”中，开源生态正在日趋活跃。

8月3日，AI模型社区魔搭ModelScope上架两款开源模型——Qwen-7B和Qwen-7B-Chat，阿里云已确认其为通义千问70亿参数通用模型和对话模型，两款模型目前均开源、免费、可商用。

至此，阿里云称已经成为国内首个开源自家大模型的大型科技企业。

来源：阿里云

具体到参数上，Qwen-7B基座模型支持中、英等多种语言，在超过2万亿token数据集上训练，上下文窗口长度达到8k。开源代码支持对Qwen-7B和Qwen-7B-Chat的量化，用户可以在消费级显卡上部署和运行模型。

用户既可从魔搭社区直接下载模型，也可通过阿里云灵积平台访问和调用Qwen-7B和Qwen-7B-Chat，阿里云包括模型训练、推理、部署、精调等在内的全方位服务。

开源是追赶已有闭源模型的有效道路。但如今在海外，Meta旗下的Llama 2 在上个月开源，免费也可商用，一经推出，就被视作最强开源大模型。

而在国内，百川智能发布的Baichuan-7B、清华大学和智谱AI发布的ChatGLM2-6B等开源大模型，也是AI初创企业中无法忽视的力量。这些开源动作无疑影响了大厂——此前，国内大厂普遍选择不开源。如今，阿里通义千问的开源，无疑是意味着大厂大模型思路的一场转变。

其实，阿里云的开源战略早有端倪，为通义千问的开源做出了铺垫。

此次上架通义千问开源模型的魔搭ModelScope，是阿里云于去年11月初牵头发起的AI模型社区。目前，魔搭聚集了20多家人工智能机构贡献的1000多款开源模型，开发者数量超160万，模型下载量超2500万。

在今年6月举行的2023开放原子全球开源峰会上，阿里云还公布了“1+4”开源战略。除魔搭社区外，阿里云还将聚焦操作系统、云原生、数据库、大数据等四大开源领域。

开源的同时，阿里云也公布了通义千问7B预训练模型在多个权威基准测评中的表现。

在英文能力测评基准MMLU上，通义千问7B模型得分超过一众7B、12B、13B主流开源模型。在中文常识能力测评基准C-Eval上，通义千问在验证集和测试集中也都是得分最高的7B开源模型。

在数学解题能力评测GSM8K、代码能力评测HumanEval上分别得分51.6、24.4，超过所有同等尺寸和部分大尺寸开源模型。来源：阿里云

附开源地址：

魔搭Model Scope：

https://modelscope.cn/models/qwen/Qwen-7B/summary

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

Hugging Face：https://huggingface.co/Qwen

GitHub：https://github.com/QwenLM/Qwen-7B

阿里云发布通义千问开源模型，打响大厂开源第一枪 | 最前线

推荐体验

相关资讯

通义千问开源，打响大厂开源第一枪 | 最前线

阿里云通义千问开源

阿里云发布通义千问2.5，开源通义千问1100亿参数模型

阿里云宣布通义千问开源

阿里云通义千问14B模型开源

近期资讯

三星电视使用技巧与小窍门：提升观影体验的实用指南

如何在微信账号丢失或被盗时快速挂失与找回

如何在微信视频通话中灵活关闭摄像头的实用技巧与建议

支付宝碰一碰怎么样

宁波汉工科技取得物料进料装置专利，提高物料进料效率

1号位必看！本地生活线上与线下的业务逻辑

快手本地，尚未成熟

深圳乐信申请基于Netty框架的长连接通信专利，能确保服务器与客户端之间稳定高效的实时通信

中国移动通信申请一种算力节点配置方法专利，能够促进算力网络低碳化发展

沈阳悦控智能科技取得料斗自动运输设备专利，有效防止物料全部堆积在圆槽内

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响