当前位置:首页|资讯

低内存占用也能实现满血训练?!北理北大港中文 MMLab 推出 Fira 训练框架

作者:量子位发布时间:2024-10-22

来自北理、北大和港中文 MMLab 的研究团队提出了一种满足低秩约束的大模型全秩训练框架——Fira,成功打破了传统低秩方法中内存占用与训练表现的 “非此即彼” 僵局。...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1