当前位置：首页|资讯

AMD发布首个AI小语言模型：6900亿token、推测解码提速3.88倍

作者：驱动之家发布时间：2024-10-01

快科技10月1日消息，AMD发布了自己的首个小语言模型(SLM)，名为“AMD-135M”。

相比于越来越庞大的大语言模型(LLM)，它体积小巧，更加灵活，更有针对性，非常适合私密性、专业性很强的企业部署。

AMD-135小模型隶属于Llama家族，有两个版本：

一是基础型“AMD-Llama-135M”，拥有多达6700亿个token，在八块Instinct MIM250 64GB加速器上训练了六天。

二是延伸型“AMD-Llama-135M-code”，额外增加了专门针对编程的200亿个token，同样硬件训练了四天。

创建与部署流程

它使用了一种名为“推测解码”(speculative decoding)的方法，通过较小的草稿模型，在单次前向传播中生成多个候选token，然后发送给更大的、更精确的目标模型，进行验证或纠正。

这种方法可以同时生成多个token，不会影响性能，还可以降低内存占用，但因为数据交易更多，功耗也会增加。

AMD还使用AMD-Llama-135M-code作为CodeLlama-7b的草案模型，测试了推测解码使用与否的性能。

比如在MI250加速器上，性能可提升最多约2.8倍，锐龙AI CPU上可提升最多约3.88倍，锐龙AI NPU上可提升最多约2.98倍。

推测解码

AMD-135M小模型的训练代码、数据集等资源都已经开源，遵循Apache 2.0。

按照AMD的说法，它的性能与其他开源小模型基本相当或略有领先，比如Hellaswag、SciQ、ARC-Easy等任务超过Llama-68M、LLama-160M，Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任务则基本类似GTP2-124MN、OPT-125M。

推荐体验

相关资讯

AMD驱动更新 10倍ai生图提速

[图片] AMD发布了Adrenalin 23.11.1版显卡驱动，无论是玩游戏的还是搞AI创作的都不容错过。游戏方面不多说，AI方面，改进和优化了RX 600M、RX 700M、RX 6000、RX 7000系列对DirectML的支持，Stable Diffusion、Adobe Lightroom、Davinci Resolve、Procyon AI性能大大提升。如图： [图片] 翻译后如下：重点红框 [图片] 我没有上面系列的显卡，不过经过群友测试，在windows 系统下，更新驱动前后，出图

AI写作 Stable Diffusion

zail_ai 2023-11-11

摩根大通推测苹果 AI 发展策略：立足本地小模型、管理大语言模型

摩根大通近日发布投资备忘录，推测苹果的AI发展战略，认为苹果一方面专注于iPhone本地运行的小模型，另一方面通过和其它厂商合作引入大语言模型（LLM）。摩根大通认为相比较OpenAI的ChatGPT和Goo…

苹果 OpenAI 大语言模型融资 ChatGPT

动点科技 2024-03-22

AI语言模型“提速”药物发现

钛媒体App6月13日消息，美国麻省理工学院和塔夫茨大学研究人员设计出一种基于大型语言模型（如ChatGPT）的人工智能算法，这种称为ConPLex的新模型可将目标蛋白与潜在的药物分子相匹配，而无需执行计算分子结构的密集型步骤。相关论文发表在最新一期《美国国家科学院院刊》上。

大语言模型 ChatGPT 人工智能

钛媒体快报 2023-06-13

重庆首个自主研发大语言模型产品发布

中新社重庆7月13日电(梁钦卿)13日，上海交通大学重庆人工智能研究院发布基于AI大模型技术研发的最新成果——“兆言”大模型，这是重庆首个自主研发的大语言模型。“兆言”大模型通过积累海量数据，辅以独特的数据处理和AI训练技术，达到精准、专业的文本输出，并能实现以自然语言选择、调用应用程序的能力，助力打造个性化的智能产品。

大语言模型人工智能 AI大模型

中国新闻网 2023-07-13

提速10倍！英伟达发布ChatGPT专用GPU

3月21日晚间，英伟达CEO黄仁勋在2023年GTC开发者大会上发表了主题演讲，介绍了英伟达在AI领域的最新进展，包括全新的量子计算系统、云服务平台、视觉图像系统等，以及这些技术将如何影响每个行业和日

21视频 2023-03-22

近期资讯

未上市就先火！江铃新能源E福顺冲上热搜榜单，江铃“E”系列方阵加速扩容

近日，一则关于“江铃新能源E福顺系列公告图曝光”的话题一出，随即登上了头条热榜，期待值爆棚，让还未真正驶入公众视野的江铃新能源E福顺系列，深受媒体和广大网友的高度关注，甚至有网友直呼：“城配双雄要来横扫市场了”，而近期网上也流传着江铃汽车新能源E福顺在吐鲁番的测试视频。没错！江铃“E”系列方阵正在加速扩容！ [图片] 物流“鼻祖”再出手，频频发力新能源赛道近年来，在政策引导与市场需求的合力推动下，城市物流新能源化趋势愈发明显。作为物流市场的“鼻祖”，江铃汽车多年来紧跟市场发展节奏，深度聚焦新能源赛道频

卡车生活家 2024-09-27

安瓿瓶折断力仪的试验步骤介绍

安瓿瓶折断力仪的试验步骤介绍安瓿瓶是用于盛装注射用药的可熔封容器，一般为玻璃材质，目前也有塑料安瓿瓶投入使用，容量一般为 1～25 mL，用于存放疫苗、血清、口服液等。玻璃安瓿瓶生产使用方式为将玻璃瓶体吹制成型后罐装液体，用激光或者明火将其加热熔封，使用时用砂轮在瓶颈处划出凹痕，掰其头部折断瓶颈即可开启药瓶。安瓿瓶折断力是评判安瓿瓶质量的重要性能参数。如折断力太大，会导致安瓿瓶不易折断、断口碎裂等情况的出现。所以需要制药企业对安瓿瓶的折断力指标进行检测控制。安瓿瓶折断力的测试可依据GB 2673-19

济南思克测试 2024-09-27

新疆无人机培训在低空经济中的关键作用解析

新疆保华润天航空无人机培训中心：在当今社会，无人机已经从军事侦察工具转变为多领域应用的高科技产品。它们在航拍摄影、农业植保、物流配送、环境监测等领域发挥着重要作用。而在这一过程中，无人机培训无疑扮演了关键角色。首先，无人机培训为低空经济提供了源源不断的专业人才。随着无人机应用范围的扩大，对专业技能的需求也日益增长。无人机培训学校通过系统的教学和实践操作，培养出一批又一批合格的无人机驾驶员，满足了市场的人才需求。其次，无人机培训强调飞行安全的重要性。通过专业的培训和考试，无人机驾驶员能够掌握更加专业的飞行技

会飞的大乌苏 2024-09-27

如何修复user32.dll缺失问题：利用免费DLL修复工具解决电脑报错（全面）

[图片] 如何修复user32.dll缺失问题？小编在玩梦幻西游时空手游桌面版时，遇到如上图的系统提示“user32.dll文件丢失或损坏”的错误。这一错误可能导致应用程序无法正常运行，甚至影响系统的稳定性。我立马查询了相关资料，也询问了懂电脑的同时，他们都说有多种方法可以帮助我解决这一问题，包括使用免费的DLL修复工具。小编将资料整理出来，详细介绍如何使用这些工具来有效解决user32.dll文件缺失的问题。整理不易，有帮助记得给小编三连奖励！ [图片] 电脑dll修复方法一：使用系统文件检查器（

胡说八道的冰淇淋 2024-09-27

【pwn11 2022ciscn 华南赛区printf_hhh】

一道2022国赛华南赛区的格式化字符串题。首先看一下保护checksec程序没有canary。看一下程序逻辑：main函数很简单，只有一个main。程序提供两个选项对应两个输出函数，分别为printf和__printf_chk。均有格式化字符串漏洞。两者不同之处在于__printf_chk对格式化字符串的任意地址写%x$n这种有保护，x$必须是连着的即想要用%4$n必须先用%3$n。且注意到，__printf_chk输出一次之后会关闭标准输出，即我们只有一次泄露信息的机会。且printf调用完会直接exi

K3yB0ard 2024-09-27

或首发骁龙8 Gen4，荣耀Magic7系列有望10月发布

随着高通骁龙峰会的临近，各大手机厂商也开始了骁龙8Gen4首发权的争夺战，而荣耀Magic7系列似乎抢得了先机。9月27日，有消息称荣耀将于10月23日举行新品发布会，届时荣耀Magic7系列新机有望亮相。考虑到时间恰逢高通骁龙峰会期间，因此业内普遍预测，荣耀Magic7系列很可能会抢先搭载骁龙8Gen4。骁龙8Gen4采用台积电3nm工艺制程和高通自研NuviaPhoenix架构。该芯片CPU部分采用了全新的双集群八核心架构，拥有两颗主频高达4.32GHz的超大核以及六颗主频为3

智八斗 2024-09-27

高中英语“16种英语时态总结归纳”，学渣三年看这一份

首先一点：英语光靠记单词能提分，但上限很低，尤其是对于我们这种零基础来说. 各位有没有发现个问题❓ 就是自己英语差，在网上寻求方法时，得到的结论都是记单词. 那到底该怎么记?记完3500后能达到什么分段？这些没人说，因为他们没经历过这种低分… ?高中英语提分三步法：记单词、做题方法、大量刷题。记单词通过“看英文记中文”，短期积累基础. 随时看的次数多了，自然也会默写了. 阅读理解靠主题做题、两首一尾定主题，逐个题目找答案；找到关键字读懂一整句，一句不够用，再看上下句. 完型填空十大线索，靠线索做题. 完型

小孔同学呀_ 2024-09-27

哪个品牌的开放式耳机佩戴最舒适？开放式蓝牙耳机排行榜前端品牌大揭秘！

开放式耳机正成为潮流，它们不仅佩戴舒适，音质也出色，特别受到音乐发烧友和运动爱好者的追捧。对于喜欢在锻炼时听歌的人来说，开放式耳机是绝佳的选择。它们佩戴稳固，无论是跑步还是骑行，都能让你无后顾之忧地享受音乐。在运动界，这些耳机因其出色的性能而备受青睐。接下来，我会为你介绍几款市面上广受好评的开放式耳机，每款都有其独到之处，总有一款能满足你的需求。 [图片] [图片] 开放式耳机怎么选？6个必看智商税点，新手必读！ 1.无脑宣传喇叭尺寸的很多商家经常宣传的就是自家的喇叭尺寸有多大，并定义为音质的标准。事

scboy数码 2024-09-27

Ampleon BLF8G20LS-230V是一款精准可靠的晶体管

[图片] 型号简介 BLF8G20LS-230V是Ampleon(安谱隆)推出的一款功率 LDMOS 晶体管，它拥有令人惊叹的功率输出，高达 230 瓦，如同交响乐团的指挥，引领着信号传递的浪潮。它的功率增益和效率如同音乐家对音准和音量的精准掌控，让信号的质量和强度达到了完美的平衡。型号规格品牌：Ampleon(安谱隆)型号：BLF8G20LS-230V类别：晶体管封装：SOT1258-1型号特点漏源击穿电压 (V(BR)DSS): 65 V栅源开启电压 (VGS(th))

立年电子 2024-09-27

数字人直播出现违规问题！究竟是自身原因，还是数

随着人工智能时代的来临，以数字人直播为代表的技术应用逐渐被各大中小型企业引进，并成为了它们在直播板块降本增效的利器。不过，从目前的应用情况来看，不少企业都在使用数字人无人直播的过程中遭遇了违规封号的问题。在此背景下，以数字人直播违规吗为母题的多个问题开始成为了众多创业者和引进或计划引进数字人直播的企业所重点关注的对象。需要承认的是，当前，数字人直播确实会存在违规的情况，但是，问题的根源却并不在于数字人直播本身，而在于直播的形式和内容违反了平台的相关规定，例如，直播形式有录播的嫌疑或者直播内容低质量等。也就

AI创业分享 2024-09-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1