当前位置:首页|资讯|GPT-4|大语言模型|AGI

百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4

作者:OSC开源社区发布时间:2024-02-07

原标题:百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4

1 月 29 日,百川智能发布超千亿参数的大语言模型 Baichuan 3。

链接:https://www.baichuan-ai.com/

据称在多个权威通用能力评测如 CMMLU、GAOKAO 和 AGI-Eval 中,Baichuan 3 都展现了出色的能力,尤其在中文任务上更是超越了 GPT-4。而在数学和代码专项评测如 MATH、HumanEval 和 MBPP 中同样表现出色。

不仅如此,其在对逻辑推理能力及专业性要求极高的 MCMLE、MedExam、CMExam 等权威医疗评测上的中文效果同样超过了 GPT-4,是中文医疗任务表现最佳的大模型。Baichuan 3 还突破 “迭代式强化学习” 技术,进一步提升了语义理解和生成能力,在诗词创作的格式、韵律、表意等方面表现优异,领先于其他大模型。

在测试逻辑推理能力的 MCMLE、MedExam、CMExam 等医疗评测上,Baichuan 3 的中文效果同样号称超过了 GPT-4,是 “中文医疗任务表现最佳的大模型”。

据介绍,百川智能在 Baichuan 3 训练过程中提出了 “动态数据选择”、“重要度保持” 以及 “异步 CheckPoint 存储” 等多种技术手段及方案,稳定训练时间达到一个月以上,故障恢复时间不超过 10 分钟。

百川智能表示,Baichuan 3 还突破 “迭代式强化学习” 技术,进一步提升了语义理解和生成能力,在诗词创作的格式、韵律、表意等方面进行了提升,对于宋词这种格式多变,结构深细、韵律丰富的高难度文体,生成的内容亦能工整对仗、韵脚和谐,让每个人都能创作出咏物、寄思的五言律诗、七言绝句,写下的言志、抒情的 “沁园春”、“定风波”。

END

Star数超3万的开源仓库被清空,作者:保护版权,此仓库不再维护

这里有最新开源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦~


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1