2024-02-2216:40:59作者:姚立伟近日,谷歌发布了其首个重要的开源大型语言模型Gemma,这标志着自从OpenAI的ChatGPT引领了人工智能聊天机器人热潮以来,在2022年取得了重要突破。G…...【查看原文】
1、Gemma的表现自从大模型横空出世之后,大部分大模型都是闭源的,只有少部分模型选择开源。谷歌推出了全新的开源模型系列Gemma,相比谷歌之前的 Gemini模型,Gemma 更加轻量,可以免费使用,模型权重也一并开源了,且允许商用。之前闭源Gemini模型效果还是不如ChatGPT,想利用开源方式迎头赶上。Gemma也第一时间冲上开源LLM的榜首:虽然Gemma较轻量,《 Gemma: Open Models Based on Gemini Research and Technology 》
谷歌ChatGPT
程序猿小三 2024-02-23
今天,Google 发布了一系列最新的开放式大型语言模型 —— Gemma!Google 正在加强其对开源人工智能的支持,我们也非常有幸能够帮助全力支持这次发布,并与 Hugging Face 生态完
谷歌人工智能大语言模型Hugging Face
HuggingFace 2024-02-22
今天,Google 发布了一系列最新的开放式大型语言模型 —— Gemma!Google 正在加强其对开源人工智能的支持,我们也非常有幸能够帮助全力支持这次发布,并与 Hugging Face 生态完美集成。Gemma 提供两种规模的模型:7B 参数模型,针对消费级 GPU 和 TPU 设计,确保高效部署和开发;2B 参数模型则适用于 CPU 和移动设备。每种规模的模型都包含基础版本和经过指令调优的版本。我们与 Google 紧密合作,确保 Gemma 能够无缝集成到 Hugging Face 的生态系统
OpenAI 推出了令人惊叹的 AI 视频生成器 Sora,而 Google 推出了 Gemini 1.5 模型,能够支持多达 100 万个 Token 上下文。
谷歌OpenAI
天行无忌 2024-02-26
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
通义千问Hugging Face大语言模型
2024-04-07
圣诞老人的故乡没有“紧人”。
新周刊 2024-12-26
服装品牌重视线下渠道,线上退货率高。
36氪的朋友们 2024-12-26
金融界2024年12月26日消息,国家知识产权局信息显示,上海盛剑半导体科技有限公司申请一项名为“铝合金表面缺陷修复的方法及其应用”的专利,公开号CN119177439A,申请日期为2024年11月。
金融界 2024-12-26
诚通科创基金投资新兴产业,首期100亿元。
苹果拒用英伟达GPU,因历史恩怨和生态系统战略。
在现代社会,微信已经成为了我们日常生活中不可或缺的一部分。今天就来聊聊微信的群聊功能,看看它是怎么运作的,以及如何更好地利用这个功能。
新报观察 2024-12-26
钛媒体APP 2024-12-26
算力提高50%,显存也提高50%
量子位 2024-12-26
银行推出升金活动,吸引客户提升资产。
苏州“芯片全科医院”冲刺上市。
智东西 2024-12-26
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1