B站开源长文本大模型：我很小但很能“装”

作者：哔哩哔哩技术发布时间：2024-09-18

一、“2% GPT size, yet powerful.”模型简介Index-1.9B-32K 是一个拥有 1.9B （19亿）参数并具备 32K 上下文长度的语言模型（这意味着，这个超小精灵可以一次性读完 3.5 万字以上的文档）。在多项长文本评测任务中，该模型在相近尺寸的模型中表现突出。以极小的体积和算力开销（仅仅约为 GPT-4 的 2%），实现了出色的长文本处理能力。如下图所示，我们的 1.9B 模型得分甚至远超 7B 大小的模型。以下是与 GPT-4、千问Qwen2 等模型的对比：Index-...【查看原文】

金融界 2024-03-28

B站开源长文本大模型：我很小但很能“装”

推荐体验

相关资讯

B站开源长文本大模型：我很小但很能“装”

通义千问长文本功能升级，大模型角逐长文本

华为盘古大模型变「小」，1.5B也很能打

Meta推出参数仅7B的无限长文本大模型，引领AI大模型新潮流

国产AI大模型Kimi“出道”，瞄准长文本赛道

近期资讯

上海繁易信息科技取得集成化智能控制老化房专利，中控电路可同时控制多个老化房内老化位控制电路

同力智能取得路由器天线用信号检测设备专利，能够模拟不同墙体厚度下路由器天线信号穿透强度

北京泰派斯特取得一种滤波器快速测试工装专利，快速完成滤波器的通电测试工作

深圳达人高科取得一种 BMS 保护板检测系统专利，实现检测自动化并精准获取保护板最大过流能力

青岛诚祥东强取得具有可拆卸防尘罩的耐电压测试仪专利，无需借助工具即可实现防尘罩的安装拆卸

民科科技取得电容器检测装置专利，将电容器短路不良品的筛选率提高到百分百

信利半导体取得一种显示模组的集成式热敏测试装置专利，精简检测流程提高生产效率

国家电网取得一种多功能便携式电化学储能系统测试装置专利，适用于对电池储能变流器及协控等储能设备调试

中科天际取得种叶片雷电记录装置专利，有效提升了工作效率

昆明琉略机电取得集成电路多通道检测装置专利，提高检测精度

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响