当前位置:首页|资讯|通义千问

通义千问Qwen-72B大模型开源:性能超越商用闭源模型

作者:中关村在线发布时间:2023-12-01

原标题:通义千问Qwen-72B大模型开源:性能超越商用闭源模型

2023-12-01 16:41:20 作者:姚立伟

通义千问720亿参数模型Qwen-72B已开源,这也是阿里云在业界率先实现的“全尺寸、全模态”开源大模型。通义千问720亿参数模型在10个权威基准测评中创下了最优成绩,成为业界最强的开源大模型。该模型性能超过开源标杆Llama 2-70B和大部分商用闭源模型,并可适配企业级和科研级高性能应用。

本次开源的模型不仅包括预训练模型,还同步推出了对应的对话模型。此外,阿里云还为72B和1.8B对话模型提供了4bit/8bit量化版模型,方便开发者进行推理训练。

阿里云CTO周靖人曾表示,阿里云将继续拥抱开源开放,并推动中国大模型生态建设。他们坚信开源开放的力量,并将率先自研大模型,让大模型技术更快地触达中小企业和个人开发者。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1