原标题:阿里云开源通义千问140亿参数模型
驱动中国2023年9月25日消息 阿里云今日宣布开源通义千问 140 亿参数模型 Qwen-14B 及其对话模型 Qwen-14B-Chat,免费可商用。
据介绍,Qwen-14B 是一款支持多种语言的高性能开源模型,整体训练数据超过 3 万亿 Token,具备更强的推理、认知、规划和记忆能力,最大支持 8k 的上下文窗口长度。阿里云给出的数据显示,Qwen-14B 在多个权威评测中超越同等规模模型,部分指标甚至接近 Llama2-70B。
值得一提的是,此前阿里云已经开源了 70 亿参数模型 Qwen-7B,一个多月下载量破 100 万。