当前位置：首页|资讯|GPT-4

百川智能推出最长上下文窗口大模型Baichuan2-192K，一次可输入35万字

作者：中国网科技发布时间：2023-11-01

10月30日，百川智能发布Baichuan2-192K大模型。其上下文窗口长度高达192K，能够处理约35万个汉字，是Claude2(支持100K上下文窗口，实测约8万字)的 4.4倍，更是 GPT-4(支持32K上下文窗口，实测约 2.5万字)的14倍。

上下文窗口长度是大模型的核心技术之一，通过更大的上下文窗口，模型能够结合更多上下文内容获得更丰富的语义信息，更好的捕捉上下文的相关性、消除歧义，进而更加准确、流畅的生成内容，提升模型能力。

Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10项中英文长文本问答、摘要的评测集上表现优异，有7项取得SOTA。

此外，LongEval的评测结果显示，在窗口长度超过100K后Baichuan2-192K依然能够保持强劲的性能，而其他开源或者商用模型在窗口增长后效果都出现了近乎直线下降的情况。Claude2也不例外，在窗口长度超过80K后整体效果下降非常严重。

(LongEval是加州大学伯克利分校联合其他高校发布的针对长窗口模型的评测榜单，主要用来衡量模型对长窗口内容的记忆和理解能力)

扩大上下文窗口能有效提升大模型性能是人工智能行业的共识，但是超长上下文窗口意味着更高的算力需求和更大的显存压力。

目前，业内有很多提升上下文窗口长度的方式，包括滑动窗口、降采样、小模型等。这些方式虽然能提升上下文窗口长度，但对模型性能均有不同程度的损害，换言之都是通过牺牲模型其他方面的性能来换取更长的上下文窗口。

而本次百川发布的Baichuan2-192K通过算法和工程的极致优化，实现了窗口长度和模型性能之间的平衡，做到了窗口长度和模型性能的同步提升。

今年9月25日，百川智能已开放了Baichuan2的API接口，正式进军企业级市场，开启商业化进程。此次Baichuan2-192K将以API调用和私有化部署的方式提供给企业用户，目前百川智能已经启动Baichuan2-192K的API内测，开放给法律、媒体、金融等行业的核心合作伙伴，不久后还将全面开放。

推荐体验

相关资讯

刚刚，百川智能Baichuan2-192K发布，上下文窗口全球最长！一次读完《三体》，拿下7个SOTA

【新智元导读】全球最长上下文窗口来了！今日，百川智能发布Baichuan2-192K大模型，上下文窗口长度高达192K（35万个汉字），是Claude 2的4.4倍，GPT-4的14倍！

新智元 2023-10-30

百川智能发布Baichuan2-192K大模型，上下文窗口长度创全球之最

"上下文窗口长度是大模型的核心技术之一。"本文为IPO早知道原创作者｜Stone Jin据IPO早知道消息，百川智能于10月30日发布了Baichuan2-192K大模型。其上下文窗口长度高达192K，是目前全球最长的上下文窗口。值得一提的是，Baichuan2-192K能够处理约35万个汉字，是目前支持长上下文窗口最优秀大模型Claude2（支持100K上下文窗口，实测约8万字）的 4.4倍，更是 GPT-4（支持32K上下文窗口，实测约 2.5万字）的14倍。Baichuan2-192K不仅在上下文窗

IPO早知道 2023-10-31

百川智能Baichuan2-192发布，上下文窗口达35万字，一次读完《三体》| 最前线

大模型发展到现在，上下文窗口的长度成为如今追逐的热点：OpenAI的GPT-4-32k的文字处理量约2.5万字，Anthropic的Claude100k大约能处理8万字的文本，而前段时间杀出的黑马KimiChat的文字处理量达到了20万字。

36氪 2023-10-31

百川智能推出 Baichuan2-192K 大模型，上下文窗口长超 GPT-4 约 14 倍

10 月 30 日消息，百川智能今日宣布推出 Baichuan2-192K 大模型。据介绍，该模型上下文窗口长度达 192K，能够处理约 35 万个汉字，号称是目前全球最长的上下文窗口。百川智能表示，Baichuan2-192K 是目前支持长上下文窗口最优秀大模型 Claude2（100K 上下文窗口，实测约 8 万字）的 4.4 倍，是 GPT-4（支持 32K 上下文窗口，实测约 2.5 万字）的 14 倍。上下文窗口长度是大模型的核心技术之一，通过更大的上下文窗口，模型能够结合更多上下文内容获得更丰

櫂離徴 2023-10-30

百川智能宣布推出Baichuan2-192K，上下文窗口长超GPT-4约14倍

百川智能宣布发布Baichuan2-192K大模型。据介绍，该模型上下文窗口长度达192K，能够处理约35万个汉字，是大模型Claude2（100K上下文窗口，实测约8万字）的4.4倍，是GPT-4（支持32…

三言财经 2023-10-31

近期资讯

AI明年有望迎“突破性进展”：“破解”动物叫声背后的沟通结构

IT之家 2024-12-27

韩国国会通过《AI 框架法案》，着重关注治理、发展、防范三方面

IT之家 2024-12-27

译体验｜NICE：2025 客户体验趋势报告

在数字化和人工智能技术飞速发展的今天，客户体验（CX）领域正经历着前所未有的变革。这篇报告深入探讨了塑造2025年客户体验战略的关键趋势，提供了如何在这一变革时代中保持领先的重要见解。

鹈小鹕 2024-12-27

微信小店“送礼物”落后的设计，还是新机会？

人人都是产品经理 2024-12-27

支付方式大变！数币钱包、碰一下支付更方便

IT时报 2024-12-27

AI项目的商业模式：回顾与趋势

人人都是产品经理 2024-12-27

AIPC来袭，企业如何抢占营销先机？

钛媒体APP 2024-12-27

和胖东来学做私域，100%拿结果

说了这么多年私域，做了这么多年私域越来越认知到：私域其实本质是一种生意模式，而不简单的运营方式而这个生意模式的底层有且仅有两个衡量标准：产品力和用户信任...

私域何老师 2024-12-27

微软 Microsoft 365 捆绑 AI 策略被吐槽：Copilot 太“热情”

IT之家 2024-12-27

金牛座“愤怒的公牛” 轻量化合金框架和橡胶握把让人爱不释手

武器科技 2024-12-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1