当前位置：首页|资讯

Meta公布MobileLLM 1.5B参数量大、性能强

作者：中关村在线发布时间：2024-11-08

2024-11-08 17:40:36 作者：姚立伟

11 月 8 日，Meta 公布了他们在智能手机上运行的 Small Language Model (MobileLLM) 家族的开源计划。他们新增了 600M、1B 和 1.5B 三种不同参数版本，这是为了适应用户对高效表现的需求。据 Meta 的研究人员介绍，MobileLLM 模型家族采用了精简架构，并引入了“SwiGLU activation function”和“grouped-query attention”机制，以实现兼顾效率与表现成果的目标。

与此同时，Meta 研究人员称，在32颗Nvidia A100 80G GPU服务器环境下进行的实验表明，MobileLLM 1.5B 版本仅需18天就能完成训练任务，而125M 版本只需3天。从结果来看，MobileLLM 125M和350M两款模型在零样本常识理解任务中的准确率比Cerebras、OPT、BLOOM等State of the Art（SOTA）模型分别高出2.7%和4.3%。

Meta的研究人员还表示，他们将MobileLLM-1.5B与其他业界参数量更大的模型进行了比较，并发现其在测试结果方面领先于GPT-neo-2.7B、OPT-2.7B、BLOOM-3B、Qwen 1.5-1.8B等模型。

推荐体验

相关资讯

华为盘古大模型变「小」，1.5B也很能打

机器之心报道机器之心编辑部ChatGPT等系列模型横空出世，以其强大的性能引起了全球的关注，有望改变人与计算机之间的交互方式，应用到千行百业。此外，尽管许多研究已经成功地打造出多个效果很好的大语言模型，但他们往往采用相似的训练策略。另一方面，大型模型的训练需要极高的计算资源投入，使得探索大量的优化策略并不切实际。

华为 ChatGPT 大语言模型

机器之心Pro 2024-02-14

微软最新论文，ChatGPT的参数量只有20B（200亿）

微软在上周四放出来一篇论文，其中实验部分给出了gpt3.5的参数量：只有20B！本文分析了可信度，猜测了对应的技术路线

bastgia 2023-10-31

如何看待微软最新论文揭秘ChatGPT参数量只有20B?

刚刚简单看了一下原文，原文主要内容还是给出了一类用于代码生成的diffusion model并进行了评测分析，ChatGPT只是作为对比评测的baseline之一引入，对于表格中ChatGPT的20B

微软 ChatGPT 编程

情爱的你是谁 2023-11-06

通义千问Qwen1.5-110B：突破1000亿参数的新成员

通义千问Qwen1.5-110B来了！这个Qwen1.5系列的新成员创下了一个里程碑：拥有超过1000亿参数的庞大规模！模型亮点：架构：用了一种叫Transformer解码器的架构，还有个叫分组查询注意力（GQA）的东西。性能：无论是标准测试还是聊天模型测试，都厉害得很。多语言支持：说多少种语言都行，而且还能处理长篇大论！[图片] 详细：https://reurl.cc/qVOong 或搜同名号：AIFOX [图片]

AI_Fox 2024-04-27

通义千问推出千亿级参数模型Qwen1.5-110B

通义千问首次推出千亿级参数模型Qwen1.5-110B，在MMLU、TheoremQA、GPQA等多个基准测评中展现出卓越性能。目前Qwen1.5系列已累计开源10款大模型，通义千问开源模型下载量超过700万。

金融界 2024-04-29

近期资讯

小鹏汽车深入解析P7+纯视觉智驾：与激光雷达车型体验无差

小鹏汽车深入解析P7+纯视觉智驾：与激光雷达车型体验无差快科技11月7日消息，小鹏汽车今日发布了首期P7+答网友问。其中针对小鹏P7+纯视觉智驾和过去有什么体验上的区别这一问题进行了解答。

2024-11-07

卫星直击！40万平米的小米汽车二期工厂进展神速

快科技11月7日消息，近期，小米汽车二期工厂已经完成车身车间封顶，进展神速。吉林一号卫星也特意观察了新工厂的建设。根据小米官方11月1日公布的数据，小米SU7单约交付量首次突破2万辆，产能

2024-11-07

插画“真假闺蜜”被指丑化女性蜂花道歉：严肃整顿运营

快科技11月7日消息，今日中午，“蜂花”官方发布道歉信，称：我们为蜂花账号下近期发布的一篇不当图文内容，郑重道歉。此次事件充分暴露出我们在内容把控以及审核流程方面存在严重漏

2024-11-07

努比亚Z70 Ultra真机曝光：首发京东方1.5K全面屏

快科技11月7日消息，在日前举办的努比亚12周年庆典暨星云AIOS沟通会上，中兴通讯终端事业部总裁、努比亚技术有限公司总裁倪飞现场演示了全新星云AIOS AI功能。演示机型正是将在本月发布的

2024-11-07

微软重大更新！Windows on Arm玩游戏不愁了

快科技11月7日消息，微软正在测试一项针对Windows on Arm更新，能使配备高通骁龙X Elite或X Plus等Arm PC能够通过Prism模拟运行任意x64软件和游戏。这项功能作为Windows 11 Insider Preview B

黑白 2024-11-07

最强Mate机皇！华为Mate 70 Pro关键参数出炉

快科技11月7日消息，博主数码闲聊站爆料了华为Mate 70 Pro的详细参数。据悉，Mate 70 Pro采用6.88英寸1.5K LTPO等深四微曲屏幕，支持120Hz高刷新率，支持3D ToF人脸识别和侧边指纹识别。与

振亭 2024-11-07

滴滴宠物快车全国上线！遛狗打车再也不用提心吊胆了

快科技11月7日消息，滴滴宠物出行于近日正式上线全国，新增宠物快车车型，专门给带宠物的乘客提供服务。以往很多人带着猫狗等宠物打车的时候，会碰到司机拒载等、多收费等情况，打车比较困难。

建嘉 2024-11-07

雅鹿德绒无痕保暖套装到手仅24.57元：防风锁温无惧寒冬

雅鹿德绒无痕保暖套装原价38.9元，领券立减并叠加淘礼金，到手价24.57元。购买链接：天猫(24.57元)先抽取今日红包，再买价更低：天猫无门槛红包至高24888元：点此抽取或淘宝APP搜索&ldquo

2024-11-07

特斯拉焕新版Model Y现身上海工厂：2025年初有望开售

快科技11月7日消息，据海外博主最新爆料，特斯拉焕新版Model Y已在上海超级工厂正式下线，并正在进行多项测试，预计2025年年初正式开售。尽管特斯拉尚未公布焕新版Model Y的详细外观和信息

王略 2024-11-07

货车全责撞坏劳斯莱斯女车主不让掏钱赔爆火：网友怒赞

快科技11月7日消息，近日，广州一辆货车撞上劳斯莱斯被认定全责，但被撞的劳斯莱斯女车主称若定损超出保险金额，将由她本人承担。她也因此快速涨粉，目前粉丝量已达64.5万，不少网友夸她善良，

2024-11-07

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1