当前位置:首页|资讯|微软|OpenAI|大语言模型

用FP8训练大模型有多香?微软:比BF16快64%,省42%内存

作者:机器之心发布时间:2023-11-02

大型语言模型(LLM)具有前所未有的语言理解和生成能力,但是解锁这些高级的能力需要巨大的模型规模和训练计算量。在这种背景下,尤其是当我们关注扩展至 OpenAI 提出的超级智能 (Super Inte...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1