当前位置:首页|资讯

清华开源混合精度推理系统 MixQ,实现大模型近无损量化并提升推理吞吐

作者:量子位发布时间:2024-10-22

一键部署 LLM 混合精度推理,端到端吞吐比 AWQ 最大提升 6 倍! 清华大学计算机系 PACMAN 实验室发布开源混合精度推理系统——MixQ。...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1