国产大模型开源提速部分模型参数规模一个月翻倍

作者：封面新闻发布时间：2023-09-25

阿里云开源通义千问140亿参数模型

封面新闻记者欧阳宏宇

国产大模型的开源季正在跑出加速度。

9月25日，阿里云开源通义千问140亿参数模型，并宣布Qwen-14B及其对话模型Qwen-14B-Chat免费可商用。据介绍，Qwen-14B是一款支持多种语言的高性能开源模型，整体训练数据超过3万亿Token，最大支持8k的上下文窗口长度。就在一个多月前，其刚刚开源了70亿参数模型Qwen-7B等模型。

大模型的未来是否走向开源虽然还没有明确定论，但在国产大模型中，开源仍是主流。《中国人工智能大模型地图研究报告》显示，超过一半国内发布的大模型已经实现了开源，并朝着通用类大模型和垂直领域的专业类大模型两个方向加速迭代。

除了通义千问外，由王小川创立的人工智能创新科技公司百川智能也在一个月间将通用类开源模型参数规模翻倍。其在今年6月推出了70亿规模参数的Baichuan-7B开源模型后，又在7月开源了拥有130亿的参数规模的Baichuan-13B模型。

专业类大模型则受行业数据、适用程度等方面制约，开源模型参数规模差异较大。在大模型最先落地的搜索场景，知乎已于今年5月开源了有100亿参数规模的CPM-Bee 10b。而在金融行业，度小满在9月才开源了拥有70B参数量级和上下文长度可达8k以上的金融大模型“轩辕70B”。

不同参数规模模型

不过，也有业内人士指出，在一些垂直领域并不需要参数量很高、通用能力很强的模型，几十到百亿左右参数规模的模型，结合垂直领域数据，就可以发挥很好的价值。

对行业而言，开源大模型可以帮助用户简化模型训练和部署的过程，用户不必从头训练模型，只需下载预训练好的模型并进行微调，就可快速构建高质量的模型。这正是开源大模型推动各行业高质量发展的底层因素。

对此，阿里云CTO周靖人表示，头部科技公司应推动中国大模型生态建设，开源自研大模型能让大模型技术更快触达中小企业和个人开发者。网易杭州研究院执行院长汪源则预测，预计到今年年底，基础、开源的大模型从技术上能够达到较好水平，两三年以内基于大模型的智能化应用会成为普遍现象。

相关资讯

小新萌主 2023-04-08

一个设计师在【阿里云】一个月的收获

大哥大嫂新年好，我是竹相左边，怀揣着久久不能平息的惊喜和激动，写下这篇文字与大家分享。我，一个不懂代码，借助生成式大语言模型，学习代码，最终成功在阿里云DSW和函数计算FC 中部署自己想要的stable diffusion的经历和体会。本文将从缘起契机与难忘经历两个部分做分析，如果你对新技术，新事物也充满热情，不妨听听我的故事。如果想要体验云端版本SD炼丹出图，可以联系竹相左边。先看几张图，后续内容太干，如果你想听听我的故事~为啥要学代码，部署云端的SD呢？从2023年2月开始，有关于人

编程大语言模型 Stable Diffusion

方方上土 2023-06-10

国产大模型开源提速部分模型参数规模一个月翻倍

推荐体验

相关资讯

大模型迎来「开源季」，盘点过去一个月那些开源的LLM和数据集

Midjourney多少钱一个月

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

midjourney怎么付费?多钱一个月

一个设计师在【阿里云】一个月的收获

近期资讯

轻松搞定投影：从选择设备到设置技巧的全方位指南

小米官宣！雷军发声！

B站“神秘”官宣，雷军或亮相？跨年晚会已有超140万人预约！

华为 Mate 70 系列手机获鸿蒙 HarmonyOS 4.3.0.135 升级

真我 13 系列手机获 realme UI 6.0 15.0.0.304 升级

华为手机锁屏功能详解：设置、技巧与安全性分析

首次驶入中心城区，文远小巴广州天河段 BRT 自动驾驶便民线开通

荣耀 Magic V / Vs 折叠屏手机获 MagicOS 9.0.0.132 升级

C语言学习指南：从基础构成到调试技巧的详细介绍

如何在抖音上录制出色视频的实用技巧与建议

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

国产大模型开源提速 部分模型参数规模一个月翻倍

国产大模型开源提速部分模型参数规模一个月翻倍