当前位置：首页|资讯|AI大模型

AI大模型之Attention 升级面

作者：Web前端牛人区发布时间：2024-09-23

1 传统 Attention 存在哪些问题？ 1. 传统 Attention 存在上下文长度约束问题； 2. 传统 Attention 速度慢，内存占用大； 2 Attention 优化方向 1. 提升上下文长度 2. 加速、减少内存占用 3 Attention 变体有哪些？ • 稀疏 attention。将稀疏偏差引入 attention 机制可以降低了复杂性； • 线性化 attention。解开 attention 矩阵与内核特征图，然后以相反的顺序计算 attention 以实现线性复杂度；...【查看原文】

推荐体验

相关资讯

AI大模型之Attention 升级面

1 传统 Attention 存在哪些问题？ 1. 传统 Attention 存在上下文长度约束问题； 2. 传统 Attention 速度慢，内存占用大； 2 Attention 优化方向 1. 提升上下文长度 2. 加速、减少内存占用 3 Attention 变体有哪些？ • 稀疏 attention。将稀疏偏差引入 attention 机制可以降低了复杂性； • 线性化 attention。解开 attention 矩阵与内核特征图，然后以相反的顺序计算 attention 以实现线性复杂度；

Web前端牛人区 2024-09-23

月之暗面大模型Kimi全新升级推理能力大幅提升

近日，国内人工智能企业月之暗面推出了其最新Kimi国产大模型的升级版k0-math。这款模型专为增强数学问题解决能力而设计，集成了最新的强化学习技术和思维链推理机制，能够有效模仿人类的思考与反思过程，从而显著…

驱动中国 2024-11-21

月之暗面发布数学推理模型

11月16日消息，月之暗面旗下Kimi发布新一代数学推理模型k0-math。基准测试显示，Kimik0-math数学能力可对标OpenAIo1系列可公开使用的两个模型：o1-mini和o1-preview。月…

鞭牛士 2024-11-18

大模型公司押注AI搜索，字节豆包、月之暗面引领技术新浪潮

近日，随着字节豆包和月之暗面等企业纷纷推出浏览器插件，AI搜索技术的浪潮愈发汹涌。月之暗面公司发布的Kimi浏览器插件以其“轻量小搜索”的特性，通过点问笔和总结器两大功能，不仅快速响应用户提问，还能够有效提炼长篇文章的核心要点，进一步巩固了其AI助手的市场地位。钉钉发布的 AI 搜索则是聚焦于解决钉钉上的信息分散问题，具有专有个性搜索、感知信息变化等六大特征。与此同时，知乎也不甘示弱，正式发布了AI搜索工具“知乎直答”，在原有“发现·AI搜索”的基础上，增强了追问和内容溯源等高级功能，为用户带来更为深入和

神经童非童 2024-07-28

Attention提速9倍！大模型都在用的FlashAttention

近来，几种长上下文语言模型陆续问世，包括 GPT-4（上下文长度为 32k）、MosaicML 的 MPT（上下文长度为 65k）Anthropic 的 Claude（上下文长度为 100k）。长文档查询和故事写作等新兴用例已经表明扩展语言模型上下文窗口是非常必要的。然而，扩大 Transformer 的上下文长度是一个挑战，因为其核心的注意力层在时间复杂度和空间复杂度与输入序列长度的平方成正比。一年前，来自斯坦福大学、纽约州立大学布法罗分校的研究者共同提出一种快速、内存高效的注意力算法 ——Flas

GPT-4 Claude 斯坦福

人工智能AI课程 2024-01-15

近期资讯

韩国济州航空失事机型全球占15%

韩国济州航空失事飞机为波音737-800型，这一机型在全球广为使用。数据显示，这款机型约占全球营运中客机15%，即4400架。纽约时报称，这款飞机属于波音公司(Boeing)737新世代一员，737新世代是更现代化机型737Max的前身。根据航空数据分析公司睿思誉（Cirium），全球有近200家航空公司使用波音737-800系列飞机。

金融界 2024-12-29

轻松将纸质文件转换为PDF格式的实用技巧与步骤指南

在这个数字化的时代，纸质文件逐渐被电子文档取代。很多人可能会问，如何将纸质文件转换成PDF格式呢？如果有需要，可以进行裁剪，去除多余的边距，或者进行旋转调整，确保文件的整齐和美观。

新报观察 2024-12-30

Intel新一代纯小核Twin Lake挤牙膏：频率+100MHz、8核仅仅7W

快科技12月29日消息，Intel正在准备一款代号“TwinLake”的处理器新品，但不属于新的酷睿Ultra200系列，甚至不属于马甲的酷睿200系列，而是将近两年前的AlderLake-N系列的继任者，还是纯E小核设计。

驱动之家 2024-12-30

美国四大厂出手核电：亚马逊将投5亿美元，Meta已发核电征集令

“人工智能有一个肮脏的秘密......生成式人工智能是惊人的能源密集型（领域），甚至比普通的云服务更为密集……谷歌、Meta和微软都在尽最大努力购买绿色能源和碳信用额。”根据美国能源部的数据，到2050年全球用电量可能会增长75%，其中科技行业的大模型开发助长了这一数据的增长，这是因为训练大模型和生成内容都十分耗电。

DeepTech深科技 2024-12-29

雷军：小米汽车顺利完成所有全年目标 SU7交付量超过13万台

：雷军12月28日在微博上表示，这一年，小米汽车顺利完成所有全年目标，也收获了超预期的成绩和口碑：截至目前，小米SU7交付量超过13万台，我们还将扩充产能，保障交付。雷军还表示，这一年，小米持续布局销售网络，目前已开业200家，覆盖全国58个城市；我们始终坚持投入底层核心技术，目前研发投入超130亿，专利授权超1000项。

金融界 2024-12-29

铭凡UN1250迷你主机首发1599元起：酷睿i5-1250P

快科技12月29日消息，铭凡UN1250迷你主机上市，首发1599元起。据介绍，铭凡UN1250迷你主机采用极光银配色设计，容积0.9升，搭载12核16线程英特尔酷睿i5-1250P处理器，12M缓存，最高4.4GHz。

驱动之家 2024-12-29

直播电商卷到头了？有人找到打开2025的“新钥匙”

直播相机，正在成为后直播电商时代的“新钥匙”。直播电商发展多年，直播电商早已成为众多品牌的“标配”，大量的个体商户也在持续涌入直播赛道。在这样的背景之下，直播间的画质、美颜、场景一样都不能少，手机已经不能满足高质量开播的需求，而传统相机又存在成本高、操作难的问题。

中国财富网 2024-12-29

30年虔行迎来工业机器人的伟大时代

1975年、1985年，又分别推出IRB60、IRB90，以及后面推出的喷涂机器人，都是为汽车制造服务的，奠定了ABB在汽车制造业的领导地位。

第一财经 2024-12-30

【汽车】小米SU7官宣交付量已超过13万台车主可免费领新年礼物

12月28日小米汽车官方微博发文表示：去年的今天，小米汽车正式跟大家见面。这一年，小米汽车顺利完成所有全年目标，也收获了超预期的成绩和口碑，截至目前小米SU7交付量超过13万台，还将扩充产能，保障交付；这一年持续布局销售网络，目前已开业200家，覆盖全国58个城市。

小白测评 2024-12-29

【前沿】曝iQOO神秘新机测试苹果同款压感按键

今年9月发布的iPhone16系列全系机身都新增一颗电容式的「相机控制按键」，主要用于辅助拍照，后续OPPOFindX8Pro机身也有配备单独的「抓拍快启键」，现据最新爆料，iQOO似乎也有一款新机在测试苹果同款压感按键。如上图所见，爆料达人数码闲聊站暗示iQOO某神秘新机在测试果子同款压感按键，或许是用于肩键？

小白测评 2024-12-29

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1