当前位置:首页|资讯

大模型量化技术原理:FP6

作者:吃果冻不吐果冻皮发布时间:2024-09-11

近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,从而导致模型变...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1