原标题:阿里云宣布开源通义千问720亿参数模型Qwen-72B
鞭牛士 12月1日消息,在通义千问发布会现场,财经网消息阿里云宣布开源通义千问720亿参数模型Qwen-72B。
此外,通义千问当天还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
IT之家12月1日消息,阿里云宣布开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B及音频大模型Qwen-Audio,目前已上线阿里魔搭社区。本次开源的模型中除预训练模型外,还同步推出了对应的对话模型,面向72B、1.8B对话模型提供了4bit/8bit量化版模型,便于开发者们推理训练。
通义千问
IT之家 2023-12-01
12月1日,阿里云开源通义千问720亿参数模型Qwen-72B。据了解,该版本模型的性能超过Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
南方都市报 2023-12-01
上证报中国证券网讯(记者 温婷)12月1日,阿里云通义千问720亿参数模型Qwen-72B正式开源发布。同时,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此,通
上海证券报 2023-12-01
据阿里云官方消息,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。
2023-09-25
目前,已经有多家国产厂商宣布了自己的AI的生成式AI产品或大模型,包括百度“文心一言”、阿里巴巴“通义千问”、360“360智脑”等多款产品,其中百度最早进行测试的AI产品,目前已经可以在一些场景进行实际的应…
通义千问文心一言生成式AI百度
科技美学 2023-12-06
IT之家12月27日消息,在今日的2024小米「人车家全生态」合作伙伴大会上,小米公布了Vela操作系统生态的最新进展。Vela是小米基于开源实时操作系统NuttX打造的物联网嵌入式软件平台,适配多种不同硬件规格的产品,最小系统仅需8KB内存,CPU主频不限,适配任意SoC多核架构,支持柔性部署。
IT之家 2024-12-27
若降水量达到462毫升/小时,将会带来怎样的影响?12月26日,在正式建成并投入使用的武汉城市安全风险监测预警平台模型中可以看到,当操作人员将模拟降雨量设定为历史最高警戒设防水位,平台模型迅速模拟出反馈结果:持续强降雨直接导致湖面高程攀升。
金台资讯 2024-12-27
钛媒体App12月27日消息,全国工业和信息化工作会议26日至27日在京召开。会议强调,2025年要推进信息化和工业化深度融合。实施“人工智能+制造”行动,加强通用大模型和行业大模型研发布局和重点场景应用。
钛媒体快报 2024-12-27
12月27日消息,OPPO周意保发文预热OPPOFindN5折叠屏,他表示,接下来Find系列的节奏会稳定下来,给到大家稳定的时间预期,以后每年Find会有春季旗舰发布会+秋季旗舰发布会。据悉,春季旗舰发布会包含FindN5折叠屏和FindX8Ultra影像旗舰,其中FindN5折叠屏会率先亮相,这也是行业内第一款骁龙8至尊版大折叠屏。
砍柴网 2024-12-27
快科技12月27日消息,今日,小米宣布澎湃OS2首次OTA升级,超级小爱首次向正式版用户开放,小米15系列、小米14系列、REDMIK80系列、REDMIK70至尊版即日起开始灰度。
驱动之家 2024-12-27
在科技日新月异的今天,我们精心整理了一份年度硬件推荐指南,旨在为您筛选出本年度最值得入手的科技产品。今年,我们更加注重性价比,所推荐的硬件不仅在性能上出类拔萃,更在价格上做到了亲民,让您无需破费太多就能享受到科技带来的便捷与乐趣。
动点科技 2024-12-27
金融界2024年12月27日消息,国家知识产权局信息显示,中交路桥建设有限公司取得一项名为“一种料斗”的专利,授权公告号CN222205925U,申请日期为2024年1月。
金融界 2024-12-27
全国工业和信息化工作会议26日至27日在京召开。会议强调,2025年要培育壮大新兴产业和未来产业。实施培育新兴产业打造新动能行动,推进制造业新技术新产品新场景大规模应用示范。推动智能网联汽车发展,扩大北斗应用规模。因地制宜建设低空信息基础设施。
每日经济新闻 2024-12-27
#年货节好物集市#卡萨帝冰箱以其卓越的品质和创新技术,在高端冰箱市场中占据了重要的地位。这款BCD-521WGCTDM4WKU1型号的冰箱,以其594mm专业超薄零嵌入式设计、双系统制冷技术、一级能效标准,以及十字四开门的便捷性,成为市场上的热门选择。同时适用于储存干货与奶制品,保持食物原有的色泽、口感和营养。
小米地瓜 2024-12-27
机器之心报道机器之心编辑部今天,一个国产大模型火遍了世界。打开X,满眼都是讨论DeepSeek-V3的推文,而其中最热门的话题之一是这个参数量高达671B的大型语言模型的预训练过程竟然只用了266.4万H800GPUHours,再加上上下文扩展与后训练的训练,总共也只有278.8H800GPUHours。
机器之心Pro 2024-12-27
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1