2023-12-01 15:51:34 作者:姚立伟
阿里云举办通义千问发布会,宣布开源通义千问720亿参数模型Qwen-72B。该模型基于3T tokens高质量数据训练,在10个权威基准测评中荣获最佳成绩,超越了开源标杆Llama 2-70B和大部分商用闭源模型,成为业界最强的开源大模型。
Qwen-72B在英语任务、中文任务、数学推理和代码理解方面都表现出色,尤其在MMLU基准测试中获得最高分,在C-Eval、CMMLU、GaokaoBench等基准测评中超越GPT-4,在GSM8K、MATH测评中断层式领先其他开源模型,并且在HumanEval、MBPP等测评中的表现也有了显著提升。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
通义千问是阿里云自主研发的大型语言模型系列之一,早在8月份就已开始对外开源。其性能已经得到了中小企业和个人开发者的青睐,并且累计下载量超过150万,催生了150多款新模型和应用。
值得一提的是,通义千问系列不仅支持语言生成和问答能力,还能够实现人机交互、语音输入输出等功能。用户只需一句提示词就能创建自己的AI助手。
总之,通义千问的开源对于国内大模型市场来说具有重要意义,它以高性能、高可控性和高性价比的优势提供了与商业闭源大模型媲美的选择。