当前位置：首页|资讯|GPT-4

百川智能推出最长上下文窗口大模型Baichuan2-192K，一次可输入35万字

作者：中国网科技发布时间：2023-11-01

10月30日，百川智能发布Baichuan2-192K大模型。其上下文窗口长度高达192K，能够处理约35万个汉字，是Claude2(支持100K上下文窗口，实测约8万字)的 4.4倍，更是 GPT-4(支持32K上下文窗口，实测约 2.5万字)的14倍。

上下文窗口长度是大模型的核心技术之一，通过更大的上下文窗口，模型能够结合更多上下文内容获得更丰富的语义信息，更好的捕捉上下文的相关性、消除歧义，进而更加准确、流畅的生成内容，提升模型能力。

Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10项中英文长文本问答、摘要的评测集上表现优异，有7项取得SOTA。

此外，LongEval的评测结果显示，在窗口长度超过100K后Baichuan2-192K依然能够保持强劲的性能，而其他开源或者商用模型在窗口增长后效果都出现了近乎直线下降的情况。Claude2也不例外，在窗口长度超过80K后整体效果下降非常严重。

(LongEval是加州大学伯克利分校联合其他高校发布的针对长窗口模型的评测榜单，主要用来衡量模型对长窗口内容的记忆和理解能力)

扩大上下文窗口能有效提升大模型性能是人工智能行业的共识，但是超长上下文窗口意味着更高的算力需求和更大的显存压力。

目前，业内有很多提升上下文窗口长度的方式，包括滑动窗口、降采样、小模型等。这些方式虽然能提升上下文窗口长度，但对模型性能均有不同程度的损害，换言之都是通过牺牲模型其他方面的性能来换取更长的上下文窗口。

而本次百川发布的Baichuan2-192K通过算法和工程的极致优化，实现了窗口长度和模型性能之间的平衡，做到了窗口长度和模型性能的同步提升。

今年9月25日，百川智能已开放了Baichuan2的API接口，正式进军企业级市场，开启商业化进程。此次Baichuan2-192K将以API调用和私有化部署的方式提供给企业用户，目前百川智能已经启动Baichuan2-192K的API内测，开放给法律、媒体、金融等行业的核心合作伙伴，不久后还将全面开放。

推荐体验

相关资讯

刚刚，百川智能Baichuan2-192K发布，上下文窗口全球最长！一次读完《三体》，拿下7个SOTA

【新智元导读】全球最长上下文窗口来了！今日，百川智能发布Baichuan2-192K大模型，上下文窗口长度高达192K（35万个汉字），是Claude 2的4.4倍，GPT-4的14倍！

新智元 2023-10-30

百川智能发布Baichuan2-192K大模型，上下文窗口长度创全球之最

"上下文窗口长度是大模型的核心技术之一。"本文为IPO早知道原创作者｜Stone Jin据IPO早知道消息，百川智能于10月30日发布了Baichuan2-192K大模型。其上下文窗口长度高达192K，是目前全球最长的上下文窗口。值得一提的是，Baichuan2-192K能够处理约35万个汉字，是目前支持长上下文窗口最优秀大模型Claude2（支持100K上下文窗口，实测约8万字）的 4.4倍，更是 GPT-4（支持32K上下文窗口，实测约 2.5万字）的14倍。Baichuan2-192K不仅在上下文窗

IPO早知道 2023-10-31

百川智能Baichuan2-192发布，上下文窗口达35万字，一次读完《三体》| 最前线

大模型发展到现在，上下文窗口的长度成为如今追逐的热点：OpenAI的GPT-4-32k的文字处理量约2.5万字，Anthropic的Claude100k大约能处理8万字的文本，而前段时间杀出的黑马KimiChat的文字处理量达到了20万字。

36氪 2023-10-31

百川智能推出 Baichuan2-192K 大模型，上下文窗口长超 GPT-4 约 14 倍

10 月 30 日消息，百川智能今日宣布推出 Baichuan2-192K 大模型。据介绍，该模型上下文窗口长度达 192K，能够处理约 35 万个汉字，号称是目前全球最长的上下文窗口。百川智能表示，Baichuan2-192K 是目前支持长上下文窗口最优秀大模型 Claude2（100K 上下文窗口，实测约 8 万字）的 4.4 倍，是 GPT-4（支持 32K 上下文窗口，实测约 2.5 万字）的 14 倍。上下文窗口长度是大模型的核心技术之一，通过更大的上下文窗口，模型能够结合更多上下文内容获得更丰

櫂離徴 2023-10-30

百川智能宣布推出Baichuan2-192K，上下文窗口长超GPT-4约14倍

百川智能宣布发布Baichuan2-192K大模型。据介绍，该模型上下文窗口长度达192K，能够处理约35万个汉字，是大模型Claude2（100K上下文窗口，实测约8万字）的4.4倍，是GPT-4（支持32…

三言财经 2023-10-31

近期资讯

豪华汽车市场，中国品牌站稳了

汽车技术话语权的夺取。

36氪品牌 2024-12-26

【述职黑话】ToB交易业务解决方案之状态机

年底了大家都要述职，老板都会问：你这个方案，是否沉淀形成一套可复用解决方案？今天就介绍关于一个业务：状态变多、条件分支增多、状态转换规则、依赖关系变复杂，导致代码难以维护，代码可重用性和可扩展性变差

转转技术团队 2024-12-26

难道这个世界容不下真正的「mini」吗？

为什么这么大个世界就容不下一台「mini」手机呢？

少数派 2024-12-26

模型训练与数据分析

本次数据——直播带货。我这里的 "直播带货.csv"文件数据量有点大，大家可以使用Python进行模拟数据，建立cvs文件，用于数据分析来源本次数据分析目的——使用魔搭社区在线集成环境（IDE）进

ys指风不买醉 2024-12-26

Docker-Dockerfile讲解(二)

接上一节讲过的FROM,MAINTAINER,RUN,EXPOSE,WORKDIR,USER,我们这一节继续讲解其他参数。

dessler 2024-12-26

RocketMQ结合源码告诉你消息量大为啥不需要手动压缩消息

背景最近同事发现线上发送的RocketMQ消息太大，同事为了节省网络带宽和存储空间，手动压缩消息然后再进行消息发送，发现磁盘也没有明显的缩减所以我打算结合源码告诉他RocketMQ自带的消息压缩

小奏技术 2024-12-26

单身购房正在改变上海楼市

单身购房正在为哪类房子买单

真叫卢俊 2024-12-26

关于Android 16你想知道的都在这里

介绍一下新一代Android 16 Baklava的发布计划，带来的新功能和API变化，以及如何适配。

稀有猿诉 2024-12-26

CMU等提出超实用「模型泛化性」指标，分布外准确率提升6%

LCA距离评估泛化性能，提升OOD准确率。

新智元 2024-12-26

Mac电脑全屏【平铺】的时候，窗口周维有空隙

当我们需要将窗口铺满整个屏幕的时候，一般有两种方式：使用快捷键：按住 ⌘ 键，点击绿色按钮；平铺之后，就会发现窗口四周会有间隙，每次都需要手动拖动窗口，很麻烦；解决方法：打开设置；将【平铺

禁止摆烂_才浅 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1