当前位置:首页|资讯|ChatGPT

【ChatGLM3】(8):模型执行速度优化,在4090上使用fastllm框架,运行ChatGLM3-6B模型,速度11w tokens/s,真的超级快

作者:freewebsys发布时间:2023-12-05

1,视频演示 https://www.bilibili.com/video/BV1fC4y1c7nf/ 更多chatgpt资料: https://blog.csdn.net/freewebsys/ca...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1