当前位置：首页|资讯

GLM Long：如何将 LLM 的上下文扩展至百万级

作者：ChatGLM发布时间：2024-07-19

[图片] 在2023年初，即便是当时最先进的GPT-3.5，其上下文长度也仅限于2k。然而，时至今日，1M的上下文长度已经成为衡量模型技术先进性的重要标志之一。如果把 LLM 比作新时代的操作系统，上下文窗口便是它的「内存」。一个现代的操作系统需要足够大的内存才能完成各种各样的复杂任务。与之类似，一个优秀的 LLM 也需要足够长的上下文长度来完成各种复杂的任务。基于此种观念，GLM 技术团队经过不断的技术迭代，从最初的仅支持2K上下文的ChatGLM-6B，发展到ChatGLM2-6B（32K）、C...【查看原文】

推荐体验

相关资讯

首个开源世界模型来了！百万级上下文，长视频理解吊打GPT-4

首个开源世界模型来了！百万级上下文，长视频理解吊打GPT-4 新智元报道编辑：alan 【新智元导读】来自UC berkeley的研究人员开源了首个世界模型，多模态性能优秀，

新智元 2024-04-04

【OpenAI】第三节（上下文）什么是上下文？全面解读GPT中的上下文概念与实际案例

GPT（Generative Pre-trained Transformer）作为一种强大的自然语言处理模型，已经引起了广泛关注。理解GPT中的“上下文”概念，对于有效利用这一技术至关重要。

XinZong 2024-10-23

如何让你的chatGPT维持会话状态，保存上下文

本文正在参加 ✍🏻 技术视角深入 ChatGPT 征文活动现在ChatGPT的API是无状态的，意味着你需要自己去维持会话状态，保存上下文，每次请求的时候将之前的历史消息全部发过去，但是这里面有两个

uWydnA 2023-03-16

不到1000步微调，将LLaMA上下文扩展到32K，田渊栋团队最新研究

在大家不断升级迭代自家大模型的时候，LLM（大语言模型）对上下文窗口的处理能力，也成为一个重要评估指标。大模型处理上下文窗口是个什么概念，就拿GPT-4支持32ktoken来说，这相当于50页的文字，意味着在对话或生成文本时，GPT-4最多可以记住50页左右内容。

LLaMA 大语言模型 GPT-4

机器之心Pro 2023-06-30

OpenAI史诗级更新！128K上下文、价格暴降2/3

视频来源：OpenAI首届开发者大会

dbaplus社群 2023-11-17

近期资讯

轻松应对电脑问题：一键还原系统操作指南与注意事项

在使用电脑的过程中，难免会遇到一些问题，比如系统崩溃、软件冲突、病毒感染等等。这种操作可以帮助你恢复到之前的状态，就像时光倒流一样，省去很多麻烦。在这个过程中，用户的数据、设置、已安装的软件都可能会被清空，因此在操作之前，备份重要文件是非常必要的。

新报观察 2024-12-30

科学家研发全新磁控变形材料，不用触碰也能移动物体

但如果是液滴这样的易碎品，或者处在狭小空间里的物品呢？研究人员表示：“通过控制超材料薄片表面的运动，我们可以移动各种类型的物体，无论是液滴还是平板玻璃。”这个改进带来了惊人的效果，带有正交切割的圆盘在磁场作用下能够达到4毫米的隆起高度，这比没有切割的圆盘高出一倍多。

DeepTech深科技 2024-12-29

轻松将纸质文件转换为PDF格式的实用技巧与步骤指南

在这个数字化的时代，纸质文件逐渐被电子文档取代。很多人可能会问，如何将纸质文件转换成PDF格式呢？如果有需要，可以进行裁剪，去除多余的边距，或者进行旋转调整，确保文件的整齐和美观。

新报观察 2024-12-30

千万年薪！雷军突然宣布

她表示，“单论DeepSeek-V2模型的中文水平，是真实处在国内外闭源模型的第一梯队”，“外加1元/百万输入Tokens的价格，只有GPT4价格的1/100，性价比之王”。小米集团财报显示，今年第三季度，小米集团实现总收入925亿元，同比增长30.5%；实现经调整净利润63亿元，同比增长4.4%。

21世纪经济报道 2024-12-29

美国四大厂出手核电：亚马逊将投5亿美元，Meta已发核电征集令

“人工智能有一个肮脏的秘密......生成式人工智能是惊人的能源密集型（领域），甚至比普通的云服务更为密集……谷歌、Meta和微软都在尽最大努力购买绿色能源和碳信用额。”根据美国能源部的数据，到2050年全球用电量可能会增长75%，其中科技行业的大模型开发助长了这一数据的增长，这是因为训练大模型和生成内容都十分耗电。

DeepTech深科技 2024-12-29

【电脑】1月发红米笔记本新品预热

此前REDMITurbo4官宣将在元旦后和大家见面，不出意外的话也是2025年第一场新机发布会，现据最新消息，当天发布会不止有Turbo4新机，还会有笔记本电脑新品。目前REDMIBook14/162025笔记本电脑新品已经上架开启预约，京东平台显示提供1GB+512GB、16GB+1TB、32GB+1TB三个SKU。

小白测评 2024-12-29

直播电商卷到头了？有人找到打开2025的“新钥匙”

直播相机，正在成为后直播电商时代的“新钥匙”。直播电商发展多年，直播电商早已成为众多品牌的“标配”，大量的个体商户也在持续涌入直播赛道。在这样的背景之下，直播间的画质、美颜、场景一样都不能少，手机已经不能满足高质量开播的需求，而传统相机又存在成本高、操作难的问题。

中国财富网 2024-12-29

韩国济州航空失事机型全球占15%

韩国济州航空失事飞机为波音737-800型，这一机型在全球广为使用。数据显示，这款机型约占全球营运中客机15%，即4400架。纽约时报称，这款飞机属于波音公司(Boeing)737新世代一员，737新世代是更现代化机型737Max的前身。根据航空数据分析公司睿思誉（Cirium），全球有近200家航空公司使用波音737-800系列飞机。

金融界 2024-12-29

Intel新一代纯小核Twin Lake挤牙膏：频率+100MHz、8核仅仅7W

快科技12月29日消息，Intel正在准备一款代号“TwinLake”的处理器新品，但不属于新的酷睿Ultra200系列，甚至不属于马甲的酷睿200系列，而是将近两年前的AlderLake-N系列的继任者，还是纯E小核设计。

驱动之家 2024-12-30

【前沿】曝iQOO神秘新机测试苹果同款压感按键

今年9月发布的iPhone16系列全系机身都新增一颗电容式的「相机控制按键」，主要用于辅助拍照，后续OPPOFindX8Pro机身也有配备单独的「抓拍快启键」，现据最新爆料，iQOO似乎也有一款新机在测试苹果同款压感按键。如上图所见，爆料达人数码闲聊站暗示iQOO某神秘新机在测试果子同款压感按键，或许是用于肩键？

小白测评 2024-12-29

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1