原标题:阿里云正式发布72B及1.8B新开源模型
在通义千问发布会上,阿里云开源通义千问720亿参数模型Qwen-72B。据了解,Qwen-72B在10个权威基准测评创下开源模型最优成绩,性能超越开源标杆Llama 2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。通义千问当天还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,在业界率先实现“全尺寸、全模态”开源。(36氪)
目前,Qwen-72B支持中文和英文输入,这也是通义千问和Llama2差别比较大的一点。有鹿机器人创始人、CEO陈俊波就提到,他们在做产品时把市面上能找到的大模型都做过实验,最后选择了通义千问,因为「它是目前…
通义千问
机器之心Pro 2023-12-13
【环球网科技报道记者李文瑶】6月7日,阿里云更新技术博客,宣布发布开源模型Qwen2-72B。所有人均可在魔搭社区和HuggingFace免费下载通义千问最新开源模型。相比2月推出的通义千问Qwen1.5,Q…
Hugging Face通义千问
环球Tech 2024-06-08
前言近期大家都知道阿里推出了自己的开源的大模型千问72B,据说对于中文非常友好,在开源模型里面,可谓是名列前茅。千问拥有有强大的基础语言模型,已经针对多达 3 万亿个 token 的多语言数据进行了稳定的预训练,覆盖领域、语言(重点是中文和英文)。Qwen 模型在一系列基准数据集(例如 MMLU、C-Eval、GSM8K、MATH、HumanEval、MBPP、等)上优于类似模型大小的基线模型,这些数据集评估了模型在自然语言理解、数学方面的能力Qwen-72B 在所有任务上都比 LLaMA2-7
AIGC
AI研习所 2023-12-26
鞭牛士12月1日消息,在通义千问发布会现场,财经网消息阿里云宣布开源通义千问720亿参数模型Qwen-72B。此外,通义千问当天还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
鞭牛士 2023-12-01
Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推理、认知、规划和记忆能力。Qwen-14B-Chat是在基座模型…
OSC开源社区 2023-10-06
揭秘一场市集的台前幕后和营销价值。
36氪的朋友们 2024-12-27
并非单选题。
音乐先声 2024-12-27
谷歌发布Android XR SDK的开发者预览版——这是一个用于其最新发布的混合现实平台的综合工具包,由谷歌、三星和高通公司联手打造。
极客邦科技InfoQ 2024-12-27
2024,那些和钱有关的事
青年志Youthology 2024-12-27
基于局部敏感哈希采样技术
量子位 2024-12-27
谁说 AI 只能烧钱?
爱范儿 2024-12-27
北京、上海社零疲软,豪宅卖爆了。
小屋见大屋 2024-12-27
当下,湘菜的发展现状如何?有哪些发展动向?未来的发展趋势又如何?
红餐智库 2024-12-27
这届年轻人也太会了吧!
新氪度 2024-12-27
过度努力不是荣耀。
腾讯研究院 2024-12-27
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1