原标题:阿里云正式发布72B及1.8B新开源模型
在通义千问发布会上,阿里云开源通义千问720亿参数模型Qwen-72B。据了解,Qwen-72B在10个权威基准测评创下开源模型最优成绩,性能超越开源标杆Llama 2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。通义千问当天还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,在业界率先实现“全尺寸、全模态”开源。(36氪)
目前,Qwen-72B支持中文和英文输入,这也是通义千问和Llama2差别比较大的一点。有鹿机器人创始人、CEO陈俊波就提到,他们在做产品时把市面上能找到的大模型都做过实验,最后选择了通义千问,因为「它是目前…
通义千问
机器之心Pro 2023-12-13
【环球网科技报道记者李文瑶】6月7日,阿里云更新技术博客,宣布发布开源模型Qwen2-72B。所有人均可在魔搭社区和HuggingFace免费下载通义千问最新开源模型。相比2月推出的通义千问Qwen1.5,Q…
Hugging Face通义千问
环球Tech 2024-06-08
前言近期大家都知道阿里推出了自己的开源的大模型千问72B,据说对于中文非常友好,在开源模型里面,可谓是名列前茅。千问拥有有强大的基础语言模型,已经针对多达 3 万亿个 token 的多语言数据进行了稳定的预训练,覆盖领域、语言(重点是中文和英文)。Qwen 模型在一系列基准数据集(例如 MMLU、C-Eval、GSM8K、MATH、HumanEval、MBPP、等)上优于类似模型大小的基线模型,这些数据集评估了模型在自然语言理解、数学方面的能力Qwen-72B 在所有任务上都比 LLaMA2-7
AIGC
AI研习所 2023-12-26
鞭牛士12月1日消息,在通义千问发布会现场,财经网消息阿里云宣布开源通义千问720亿参数模型Qwen-72B。此外,通义千问当天还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
鞭牛士 2023-12-01
Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推理、认知、规划和记忆能力。Qwen-14B-Chat是在基座模型…
OSC开源社区 2023-10-06
择时与选股真的不容易。
派财经 2024-12-26
“调”是指调整与调改。
联商网 2024-12-26
2024年,券商罚单不仅数量密集且力度更大,投行依然是罚单“重灾区”,营业部的罚单明显增加
读数一帜 2024-12-26
16个月没工资不敢离职,这些打工人“自费上班”
财经故事荟 2024-12-26
初步计划是,仪陇惠民村镇银行吸收改造将于2025年上半年正式启动,2027年上半年完成
财经五月花 2024-12-26
那些“不务正业”的大厂,盘出来了一个千亿市场
互联网那些事 2024-12-26
协作机器人在资本市场火热。
铅笔道 2024-12-26
12月26日,哈森股份复牌一字涨停。
时代周报 2024-12-26
车企间不同的充电站运营模式反映出不同的战略特点,但核心都是为了提升车型销量
出行一客 2024-12-26
黄子韬送车,让全网粉丝疯狂?
科技旋涡 2024-12-26
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1