当前位置:首页|资讯

大模型训练时底层显存占用情况详解

作者:我是王大你是谁发布时间:2024-11-13

本文借用 FP16 精度的 llama-13B 大模型为例,详细介绍了大模型在训练时候底层的显存的实际占用情况...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1